
Według Google Gemini obiecuje przewyższyć technologię GPT-4 OpenAI pod względem możliwości generowania tekstu, rozumienia języka naturalnego i rozwiązywania problemów, rewolucjonizując sposób, w jaki wyszukujemy i znajdujemy informacje w Internecie.
Międzynarodowy koncern technologiczny uruchomił 6 grudnia swój nowy model sztucznej inteligencji o nazwie Gemini, wskazując, że jest on w stanie uczyć się z wielu różnych źródeł informacji, dostosowywać się do różnych kontekstów i domen oraz generować spójne i odpowiednie odpowiedzi na każde zapytanie.
Google Gemini jest efektem kilkuletnich badań i rozwoju w laboratorium Google DeepMind, gdzie zastosowano najnowsze techniki głębokiego uczenia, sieci neuronowych i przetwarzania języka naturalnego. Firma mówi że jego nowy model sztucznej inteligencji jest najinteligentniejszy i najpotężniejszy, jaki istnieje dotychczas na rynku, oraz że stanowi wielki skok jakościowy w wyścigu sztucznej inteligencji, w którym konkuruje z innymi firmami, takimi jak OpenAI, Meta i Microsoft.
Gemini jest obecnie dostępny w trzech wersjach: Ultra, Pro, Nano i według Google można go przetestować za pomocą chatbota Bard, który również rywalizuje z ChatGPT OpenAI.
Co to jest Google Gemini?
Gemini to sztuczna inteligencja lub model AI oparty na głębokich sieciach neuronowych, który może przetwarzać informacje różnego typu i źródeł, takie jak tekst, obrazy, audio lub wideo. Dodatkowo Gemini może zrozumieć kontekst i cel zapytania oraz wygenerować trafne i kompletne odpowiedzi, nawet jeśli zapytanie jest złożone lub niejednoznaczne.
Według Demisa Hassabisa, dyrektora generalnego i współzałożyciela Google DeepMind: Bliźnięta są „najbardziej wydajny i ogólny model, jaki kiedykolwiek zbudowaliśmy”.
Jeśli zapytasz Bliźniąt „Czego potrzebuję, aby wejść na górę Fuji zimą?”, model AI mógłby analizować informacje z różnych stron internetowych, blogów, filmów lub zdjęć na ten temat, aby zaoferować nam listę wskazówek, sprzętu, tras i środków ostrożności, które należy wziąć pod uwagę podczas wykonywania danej czynności. Dodatkowo sztuczna inteligencja ma możliwość porównania góry Fudżi z innymi górami, na które się wcześniej wspięliśmy, i zasugerowania, jak dostosować nasze dotychczasowe doświadczenia do warunków panujących na górze Fuji.
W związku z tym Hassabis podkreślił, że Gemini został zaprojektowany i zbudowany od podstaw multimodalny, co oznacza, że „potrafi uogólniać i rozumieć, obsługiwać i łączyć bez problemów różne rodzaje informacji”.
Jak działa nowa sztuczna inteligencja Google?
Gemini jest w stanie to wszystko zrobić, ponieważ wykorzystuje architekturę tzw Transformator, co pozwala na jednoczesną i autonomiczną naukę wielu zadań i umiejętności, takich jak rozumienie języka naturalnego, generowanie tekstu, rozpoznawanie obrazów, tłumaczenie czy synteza mowy. W ten sposób Gemini może przenieść zdobytą wiedzę z jednego zadania na drugie i z czasem poprawić swoje wyniki.
Według Google Gemini jest 1.000 razy mocniejszy od swojego poprzedniego modelu BERT, który był już w stanie zrozumieć znaczenie słów na podstawie kontekstu.
Celem Google jest stworzenie inteligentnego asystenta, który będzie w stanie odpowiedzieć na każdy rodzaj zapytania i będzie w stanie wchodzić w interakcję ze wszystkimi w naturalny i płynny sposób.
Natywna multimodalna sztuczna inteligencja z wydajnością nowej generacji
Gemini to nie tylko inteligentny i kreatywny chatbot, ale posiada także zaawansowane możliwości programistyczne, w tym generowanie wysokiej jakości kodu. Ta sztuczna inteligencja może również rozwiązywać złożone problemy programistyczne i współpracować z programistami.
Według Google nowy model uzyskał wynik 90% w Pomiar ogromnego zrozumienia języka wielozadaniowego (MMLU)lub pomiar masowego, wielozadaniowego rozumienia języka, przewyższający ekspertów w tej dziedzinie. Jak zauważyła firma, MMLU wykorzystuje kombinację 57 przedmiotów, takich jak matematyka, fizyka, historia, prawo, medycyna i etyka, do sprawdzania zarówno wiedzy o świecie, jak i umiejętności rozwiązywania problemów.
„Nasze nowe, podstawowe podejście do MMLU pozwala Gemini wykorzystać swoje możliwości rozumowania, aby dokładniej przemyśleć przed udzieleniem odpowiedzi na trudne pytania”.
Ekspert AI, Rowan Cheung, zauważył, że Gemini to najpotężniejszy chatbot dostępny na rynku. Jednak po tym, jak Google przyznał, że przeprowadził wstępną demonstrację Gemini, zakwestionował przejrzystość firmy i możliwości tego modelu AI. „Czy było to tylko zwykłe nieporozumienie PR, czy też rozwiązanie ChatGPT jest dalej niż początkowo sądzono?” pytam Cheung.
Mimo to inni eksperci uważają, że Gemini może stać się fundamentem jeszcze bardziej pogłębiającym integrację sztucznej inteligencji z codziennymi zadaniami i działaniami.
Kontynuuj czytanie: Google Cloud staje się walidatorem w sieci Polygon PoS