Qu'est-ce que Gemini, l'IA nouvelle génération de Google ?

Google a présenté sa dernière avancée dans le domaine de l'intelligence artificielle (IA), un nouveau modèle appelé Gemini.

Qu'est-ce que Gemini, l'IA nouvelle génération de Google ?

Selon Google, Gemini promet de surpasser la technologie GPT-4 d'OpenAI en termes de capacité de génération de texte, de compréhension du langage naturel et de résolution de problèmes, révolutionnant ainsi la façon dont nous recherchons et trouvons des informations sur le Web.

La multinationale technologique a lancé son nouveau modèle d'IA, appelé Gemini, le 6 décembre, indiquant qu'il est capable d'apprendre à partir d'une grande variété de sources d'information, de s'adapter à différents contextes et domaines et de générer des réponses cohérentes et pertinentes à toute requête. 

Google Gemini est le résultat de plusieurs années de recherche et de développement dans le laboratoire Google DeepMind, où les dernières techniques d'apprentissage profond, de réseaux de neurones et de traitement du langage naturel ont été appliquées. La société dit que son nouveau modèle d'IA est le plus intelligent et le plus puissant qui existe sur le marché à ce jour, et qu'il représente un grand saut qualitatif dans la course à l'IA, où il rivalise avec d'autres sociétés telles que OpenAI, Meta et Microsoft.

Gemini est actuellement disponible en trois versions, Ultra, Pro, Nano et, selon Google, peut être testé via son chatbot Bard, qui rivalise également avec ChatGPT d'OpenAI.

Qu’est-ce que Google Gemini ?

Gemini est un modèle d'intelligence artificielle ou d'IA basé sur des réseaux de neurones profonds, qui peut traiter des informations de différents types et sources, telles que du texte, des images, de l'audio ou de la vidéo. De plus, Gemini peut comprendre le contexte et l'objectif d'une requête et générer des réponses pertinentes et complètes, même si la requête est complexe ou ambiguë.

Selon Demis Hassabis, PDG et co-fondateur de Google DeepMind, les Gémeaux sont « le modèle le plus performant et le plus général que nous ayons jamais construit »

source: X – @GoogleDeepMind

Si vous demandez aux Gémeaux « De quoi ai-je besoin pour gravir le Mont Fuji en hiver ? », le modèle d'IA pourrait analyser les informations de différents sites Web, blogs, vidéos ou images sur le sujet, pour nous proposer une liste de conseils, d'équipements, d'itinéraires et de précautions à prendre en compte lors de la réalisation de l'activité. De plus, l'IA a la capacité de comparer le mont Fuji à d'autres montagnes que nous avons escaladées auparavant, pour suggérer comment adapter notre expérience précédente aux conditions du mont Fuji.

À cet égard, Hassabis a souligné que Gemini a été conçu et construit à partir de zéro pour être multimodal, ce qui signifie qu’« il peut généraliser et comprendre, exploiter et combiner, sans problème, différents types d’informations ».

Comment fonctionne la nouvelle IA de Google ?

Gemini est capable de faire tout cela car il utilise une architecture appelée transformateur, qui vous permet d'acquérir simultanément et de manière autonome plusieurs tâches et compétences, telles que la compréhension du langage naturel, la génération de texte, la reconnaissance d'images, la traduction ou la synthèse vocale. De cette manière, les Gémeaux peuvent transférer ce qu’ils apprennent d’une tâche à une autre et améliorer leurs performances au fil du temps.

Selon Google, Gemini est 1.000 XNUMX fois plus puissant que son modèle précédent, BERT, qui était déjà capable de comprendre le sens des mots en fonction du contexte. 

Avec Gemini, Google ambitionne de créer un assistant intelligent capable de répondre à tout type de requête, et capable d'interagir avec tout le monde de manière naturelle et fluide.

IA nativement multimodale avec des performances de nouvelle génération

Gemini n'est pas seulement un chatbot intelligent et créatif, mais il possède également des capacités de programmation avancées, notamment la génération de code de haute qualité. Cette IA peut également résoudre des problèmes de programmation complexes et collaborer avec les développeurs.

Selon Google, le nouveau modèle a obtenu un score de 90 % en Mesurer la compréhension massive du langage multitâche (MMLU), ou mesure de la compréhension linguistique multitâche de masse, surpassant les experts humains dans le domaine. MMLU utilise une combinaison de 57 matières, telles que les mathématiques, la physique, l'histoire, le droit, la médecine et l'éthique, pour tester à la fois les connaissances du monde et les compétences en résolution de problèmes, a noté la société.

"Notre nouvelle approche de base pour MMLU permet à Gemini d'utiliser ses capacités de raisonnement pour réfléchir plus attentivement avant de répondre à des questions difficiles."

L'expert en IA Rowan Cheung a souligné que Gemini est le chatbot le plus puissant disponible sur le marché. Cependant, après que Google ait admis avoir organisé la première démonstration de Gemini, il a remis en question la transparence de l'entreprise et les capacités de ce modèle d'IA. « Était-ce juste un simple problème de communication en matière de relations publiques, ou est-ce plus en retard sur ChatGPT qu'on ne le pensait initialement ? » demandé Cheung. 

Malgré cela, d’autres experts estiment que Gemini pourrait devenir la base qui approfondira davantage l’intégration de l’IA dans les tâches et activités quotidiennes.

Continuer la lecture: Google Cloud devient validateur au sein du réseau Polygon PoS