Cos'è Gemini, l'intelligenza artificiale di prossima generazione di Google?

Google ha presentato il suo ultimo progresso nel campo dell'intelligenza artificiale (AI), un nuovo modello chiamato Gemini.

Cos'è Gemini, l'intelligenza artificiale di prossima generazione di Google?

Secondo Google, Gemini promette di superare la tecnologia GPT-4 di OpenAI in termini di capacità di generazione di testi, comprensione del linguaggio naturale e risoluzione dei problemi, rivoluzionando il modo in cui cerchiamo e troviamo informazioni sul web.

La multinazionale tecnologica ha lanciato il 6 dicembre il suo nuovo modello di intelligenza artificiale, chiamato Gemini, dimostrando che è in grado di apprendere da un'ampia varietà di fonti di informazione, adattarsi a diversi contesti e domini e generare risposte coerenti e pertinenti a qualsiasi domanda. 

Google Gemini è il risultato di diversi anni di ricerca e sviluppo nel laboratorio Google DeepMind, dove sono state applicate le più recenti tecniche di deep learning, reti neurali e elaborazione del linguaggio naturale. L'azienda dice che il suo nuovo modello di intelligenza artificiale è il più intelligente e potente esistente fino ad oggi sul mercato e che rappresenta un grande salto di qualità nella corsa all'intelligenza artificiale, dove compete con altre aziende come OpenAI, Meta e Microsoft.

Gemini è attualmente disponibile in tre versioni, Ultra, Pro, Nano e, secondo Google, può essere testato tramite il suo chatbot Bard, che rivaleggia anche con ChatGPT di OpenAI.

Cos'è Google Gemini?

Gemini è un modello di intelligenza artificiale o AI basato su reti neurali profonde, in grado di elaborare informazioni di diversi tipi e fonti, come testo, immagini, audio o video. Inoltre, Gemini può comprendere il contesto e lo scopo di una query e generare risposte pertinenti e complete, anche se la query è complessa o ambigua.

Secondo Demis Hassabis, CEO e co-fondatore di Google DeepMind, i gemelli lo sono “il modello più capace e generale che abbiamo mai costruito”

fonte: X – @GoogleDeepMind

Se chiedi ai Gemelli “Di cosa ho bisogno per scalare il Monte Fuji in inverno?”, il modello AI potrebbe analizzare informazioni provenienti da diversi siti Web, blog, video o immagini sull'argomento, per offrirci un elenco di suggerimenti, attrezzature, percorsi e precauzioni di cui tenere conto nello svolgimento dell'attività. Inoltre, l'intelligenza artificiale ha la capacità di confrontare il Monte Fuji con altre montagne che abbiamo scalato in precedenza, per suggerire come adattare la nostra precedente esperienza alle condizioni del Monte Fuji.

A questo proposito, Hassabis ha sottolineato che Gemini è stato progettato e costruito da zero per esserlo multimodale, il che significa che “può generalizzare e comprendere, operare e combinare, senza problemi, diversi tipi di informazioni”.

Come funziona la nuova IA di Google?

Gemini è in grado di fare tutto questo perché utilizza un'architettura chiamata trasformatore, che consente di apprendere simultaneamente e in autonomia molteplici compiti e abilità, come la comprensione del linguaggio naturale, la generazione di testi, il riconoscimento delle immagini, la traduzione o la sintesi vocale. In questo modo, i Gemelli possono trasferire ciò che imparano da un compito all’altro e migliorare le proprie prestazioni nel tempo.

Secondo Google, Gemini è 1.000 volte più potente del suo modello precedente, BERT, che era già in grado di comprendere il significato delle parole in base al contesto. 

Con Gemini, Google punta a creare un assistente intelligente in grado di rispondere a qualsiasi tipo di query e in grado di interagire con tutti in modo naturale e fluido.

IA multimodale nativa con prestazioni di nuova generazione

Gemini non è solo un chatbot intelligente e creativo, ma ha anche capacità di programmazione avanzate, inclusa la generazione di codice di alta qualità. Questa intelligenza artificiale può anche risolvere problemi di programmazione complessi e collaborare con gli sviluppatori.

Secondo Google, il nuovo modello ha ottenuto un punteggio del 90%. Misurazione della comprensione linguistica multitasking di massa (MMLU), o misurazione della comprensione linguistica multitasking di massa, superando gli esperti umani nell'area. MMLU utilizza una combinazione di 57 materie, tra cui matematica, fisica, storia, diritto, medicina ed etica, per testare sia la conoscenza del mondo che le capacità di risoluzione dei problemi, ha osservato la società.

“Il nostro nuovo approccio di base per MMLU consente a Gemini di utilizzare le sue capacità di ragionamento per pensare con maggiore attenzione prima di rispondere a domande difficili”.

L’esperto di intelligenza artificiale Rowan Cheung aveva notato che Gemini è il chatbot più potente disponibile sul mercato. Tuttavia, dopo che Google ha ammesso di aver organizzato la dimostrazione iniziale di Gemini, ha messo in dubbio la trasparenza dell’azienda e le capacità di questo modello di intelligenza artificiale. "Si è trattato solo di un semplice errore di comunicazione o è più indietro rispetto a ChatGPT di quanto si pensasse inizialmente?" Chiedo Cheung. 

Nonostante ciò, altri esperti ritengono che Gemini potrebbe diventare la base che approfondisce ulteriormente l’integrazione dell’intelligenza artificiale nei compiti e nelle attività quotidiane.

Continua a leggere: Google Cloud diventa un validatore all'interno della rete Polygon PoS