Was ist Gemini, Googles KI der nächsten Generation?

Google hat seinen neuesten Fortschritt im Bereich der künstlichen Intelligenz (KI) vorgestellt, ein neues Modell namens Gemini.

Was ist Gemini, Googles KI der nächsten Generation?

Laut Google verspricht Gemini, die GPT-4-Technologie von OpenAI in Bezug auf Textgenerierungskapazität, Verständnis natürlicher Sprache und Problemlösung zu übertreffen und die Art und Weise, wie wir Informationen im Web suchen und finden, zu revolutionieren.

Das multinationale Technologieunternehmen hat am 6. Dezember sein neues KI-Modell mit dem Namen Gemini auf den Markt gebracht. Dies zeigt, dass es in der Lage ist, aus einer Vielzahl von Informationsquellen zu lernen, sich an verschiedene Kontexte und Domänen anzupassen und kohärente und relevante Antworten auf jede Anfrage zu generieren. 

Google Gemini ist das Ergebnis mehrjähriger Forschung und Entwicklung im Google DeepMind-Labor, in dem die neuesten Deep-Learning-, neuronalen Netze und Techniken zur Verarbeitung natürlicher Sprache angewendet wurden. Das Unternehmen , sagt dass sein neues KI-Modell das intelligenteste und leistungsfähigste ist, das es bisher auf dem Markt gibt, und dass es einen großen qualitativen Sprung im KI-Wettlauf darstellt, wo es mit anderen Unternehmen wie OpenAI, Meta und Microsoft konkurriert.

Gemini ist derzeit in drei Versionen erhältlich: Ultra, Pro, Nano, und kann laut Google über seinen Bard-Chatbot getestet werden, der auch mit ChatGPT von OpenAI konkurriert.

Was ist Google Gemini?

Gemini ist ein künstliches Intelligenz- oder KI-Modell, das auf tiefen neuronalen Netzen basiert und Informationen unterschiedlicher Art und Quelle wie Text, Bilder, Audio oder Video verarbeiten kann. Darüber hinaus kann Gemini den Kontext und Zweck einer Anfrage verstehen und relevante und vollständige Antworten generieren, selbst wenn die Anfrage komplex oder mehrdeutig ist.

Laut Demis Hassabis, CEO und Mitbegründer von Google DeepMind, Zwillinge sind „das leistungsfähigste und umfassendste Modell, das wir je gebaut haben“

Quelle: X – @GoogleDeepMind

Wenn Sie Zwillinge fragen „Was brauche ich, um im Winter den Fuji zu besteigen?“, könnte das KI-Modell Informationen von verschiedenen Websites, Blogs, Videos oder Bildern zu diesem Thema analysieren, um uns eine Liste mit Tipps, Ausrüstung, Routen und Vorsichtsmaßnahmen anzubieten, die bei der Durchführung der Aktivität berücksichtigt werden müssen. Darüber hinaus ist die KI in der Lage, den Berg Fuji mit anderen Bergen zu vergleichen, die wir zuvor bestiegen haben, um Vorschläge zu machen, wie wir unsere bisherigen Erfahrungen an die Bedingungen am Berg Fuji anpassen können.

In diesem Zusammenhang betonte Hassabis, dass Gemini von Grund auf entworfen und gebaut wurde multimodal, was bedeutet, dass „es verschiedene Arten von Informationen problemlos verallgemeinern und verstehen, verarbeiten und kombinieren kann.“

Wie funktioniert Googles neue KI?

Gemini ist zu all dem in der Lage, weil es eine Architektur namens „ Transformator, mit dem Sie gleichzeitig und autonom mehrere Aufgaben und Fähigkeiten erlernen können, wie z. B. das Verstehen natürlicher Sprache, die Texterzeugung, die Bilderkennung, die Übersetzung oder die Sprachsynthese. Auf diese Weise kann der Zwilling das Gelernte von einer Aufgabe auf eine andere übertragen und seine Leistung im Laufe der Zeit verbessern.

Laut Google Gemini ist 1.000-mal leistungsstärker als sein Vorgängermodell BERT, der bereits in der Lage war, die Bedeutung von Wörtern anhand des Kontexts zu verstehen. 

Mit Gemini möchte Google einen intelligenten Assistenten schaffen, der auf jede Art von Anfrage reagieren und auf natürliche und flüssige Weise mit jedem interagieren kann.

Native multimodale KI mit Leistung der nächsten Generation

Gemini ist nicht nur ein intelligenter und kreativer Chatbot, sondern verfügt auch über erweiterte Programmierfunktionen, einschließlich der Generierung von hochwertigem Code. Diese KI kann auch komplexe Programmierprobleme lösen und mit Entwicklern zusammenarbeiten.

Laut Google erreichte das neue Modell eine Punktzahl von 90 % Messung des Massive Multitask Language Understanding (MMLU), oder Messung des Massen-Multitasking-Sprachverständnisses, die menschliche Experten auf diesem Gebiet übertrifft. MMLU nutzt eine Kombination aus 57 Fächern, darunter Mathematik, Physik, Geschichte, Recht, Medizin und Ethik, um sowohl Weltwissen als auch Problemlösungsfähigkeiten zu testen, so das Unternehmen.

„Unser neuer Basisansatz für MMLU ermöglicht es Gemini, seine Denkfähigkeiten zu nutzen, um sorgfältiger nachzudenken, bevor schwierige Fragen beantwortet werden.“

KI-Experte Rowan Cheung hatte darauf hingewiesen, dass Gemini der leistungsstärkste Chatbot ist, der auf dem Markt erhältlich ist. Nachdem Google jedoch zugegeben hatte, die erste Gemini-Demonstration durchgeführt zu haben, stellte es die Transparenz des Unternehmens und die Fähigkeiten dieses KI-Modells in Frage. „War das nur eine einfache PR-Fehlkommunikation, oder liegt es weiter hinter ChatGPT zurück als zunächst angenommen?“ fragte Cheung. 

Dennoch glauben andere Experten, dass Gemini die Grundlage sein könnte, die die Integration von KI in alltägliche Aufgaben und Aktivitäten weiter vertieft.

Weiterlesen: Google Cloud wird zum Validator innerhalb des Polygon PoS-Netzwerks