O que é Gemini, a IA da próxima geração do Google?

O Google apresentou seu mais recente avanço na área de Inteligência Artificial (IA), um novo modelo chamado Gemini.

O que é Gemini, a IA da próxima geração do Google?

Segundo o Google, o Gemini promete superar a tecnologia GPT-4 da OpenAI em termos de capacidade de geração de texto, compreensão de linguagem natural e resolução de problemas, revolucionando a forma como pesquisamos e encontramos informações na web.

A multinacional tecnológica lançou no dia 6 de dezembro o seu novo modelo de IA, denominado Gemini, indicando que é capaz de aprender a partir de uma grande variedade de fontes de informação, adaptando-se a diferentes contextos e domínios e gerando respostas coerentes e relevantes a qualquer consulta. 

O Google Gemini é o resultado de vários anos de pesquisa e desenvolvimento no laboratório Google DeepMind, onde foram aplicadas as mais recentes técnicas de aprendizagem profunda, redes neurais e processamento de linguagem natural. A empresa diz que o seu novo modelo de IA é o mais inteligente e poderoso que existe no mercado até à data, e que representa um grande salto qualitativo na corrida da IA, onde compete com outras empresas como OpenAI, Meta e Microsoft.

Atualmente, o Gemini está disponível em três versões, Ultra, Pro, Nano e, segundo o Google, pode ser testado por meio de seu chatbot Bard, que também rivaliza com o ChatGPT da OpenAI.

O que é o Google Gêmeos?

Gemini é um modelo de inteligência artificial ou IA baseado em redes neurais profundas, que pode processar informações de diversos tipos e fontes, como texto, imagens, áudio ou vídeo. Além disso, Gemini pode compreender o contexto e o propósito de uma consulta e gerar respostas relevantes e completas, mesmo que a consulta seja complexa ou ambígua.

De acordo com Demis Hassabis, CEO e cofundador do Google DeepMind, Gêmeos é “o modelo mais capaz e geral que já construímos”

fonte: X – @GoogleDeepMind

Se você perguntar a Gêmeos “O que preciso para escalar o Monte Fuji no inverno?”, o modelo de IA poderia analisar informações de diversos sites, blogs, vídeos ou imagens sobre o assunto, para nos oferecer uma lista de dicas, equipamentos, roteiros e cuidados que devem ser levados em consideração na realização da atividade. Além disso, a IA tem a capacidade de comparar o Monte Fuji com outras montanhas que escalamos antes, para sugerir como adaptar nossa experiência anterior às condições do Monte Fuji.

A este respeito, Hassabis enfatizou que o Gemini foi projetado e construído do zero para ser multimodal, o que significa que “pode generalizar e compreender, operar e combinar, sem problemas, diferentes tipos de informação”.

Como funciona a nova IA do Google?

Gemini é capaz de fazer tudo isso porque usa uma arquitetura chamada transformador, que permite aprender simultânea e autonomamente múltiplas tarefas e competências, como compreensão de linguagem natural, geração de texto, reconhecimento de imagens, tradução ou síntese de fala. Dessa forma, o Gemini consegue transferir o que aprende de uma tarefa para outra e melhorar seu desempenho ao longo do tempo.

De acordo com o Google, Gemini é 1.000 vezes mais poderoso que seu modelo anterior, BERT, que já conseguia compreender o significado das palavras com base no contexto. 

Com o Gemini, o Google pretende criar um assistente inteligente que possa responder a qualquer tipo de consulta, e que possa interagir com todos de forma natural e fluida.

IA nativamente multimodal com desempenho de última geração

Gemini não é apenas um chatbot inteligente e criativo, mas também possui recursos avançados de programação, incluindo a geração de código de alta qualidade. Essa IA também pode resolver problemas complexos de programação e colaborar com os desenvolvedores.

Segundo o Google, o novo modelo obteve nota de 90% em Medindo a compreensão massiva da linguagem multitarefa (MMLU), ou medição da compreensão linguística multitarefa em massa, superando os especialistas humanos na área. A MMLU utiliza uma combinação de 57 disciplinas, como matemática, física, história, direito, medicina e ética, para testar o conhecimento mundial e as habilidades de resolução de problemas, observou a empresa.

“Nossa nova abordagem básica para MMLU permite que Gemini use seus recursos de raciocínio para pensar com mais cuidado antes de responder a perguntas difíceis.”

O especialista em IA Rowan Cheung apontou que o Gemini é o chatbot mais poderoso disponível no mercado. No entanto, depois de a Google ter admitido que tinha realizado a demonstração inicial do Gemini, questionou a transparência da empresa e as capacidades deste modelo de IA. “Isso foi apenas uma simples falha de comunicação de relações públicas ou está mais atrás do ChatGPT do que se pensava inicialmente?” eu pergunto Cheung. 

Apesar disso, outros especialistas acreditam que o Gemini pode tornar-se a base que aprofunda ainda mais a integração da IA ​​nas tarefas e atividades quotidianas.

Continue lendo: Google Cloud se torna um validador dentro da rede Polygon PoS