Android Zentrale

Google Gemini ist hier, um die Bühne für KI-Modelle im Jahr 2024 und darüber hinaus zu bereiten

protection click fraud

Was du wissen musst

  • Trotz Berichten über Verzögerungen wurde Google Gemini offiziell eingeführt.
  • Dieses KI-Modell besteht aus drei verschiedenen „Größen“, darunter Gemini Nano, Pro und Ultra.
  • Gemini Nano ist für mobile Geräte konzipiert, während Gemini Pro in Google Bard integriert wird.
  • Gemini Ultra soll irgendwann im nächsten Jahr erscheinen und Teil des neuen „Bard Advanced-Erlebnisses“ sein.

Das Warten hat endlich ein Ende, denn Google hat mit Google Gemini seinen wahren ChatGPT-Konkurrenten offiziell vorgestellt. Angekündigt unter Google I/O 2023Gemini ist das „Basismodell der nächsten Generation“ des Unternehmens, das aus drei verschiedenen Modellen besteht: Ultra, Pro und Nano.

Auch wenn es den Anschein hat, als hätte Google schnell reagiert, um sein neues KI-Modell der Öffentlichkeit zugänglich zu machen, könnte dies nicht weiter von der Wahrheit entfernt sein. Mit der Hilfe von Google DeepMindGemini ist seit 2012 in Arbeit, bevor die Entwicklung im Jahr 2015 mit KI-Beschleunigern vorangetrieben wurde.

Im Gegensatz zu Bard, das im Vergleich zu Leuten wie ChatGPT und Claude nicht überzeugen konnte, bringt Gemini echte Konkurrenz mit sich. Von den drei verschiedenen Modellen bietet Google einen umfassenden Überblick darüber, was jedes Modell leisten kann:

Multimodaler Überblick über Google Gemini Ultra, Pro und Nano
(Bildnachweis: Google)
  • Gemini Nano: Effizientestes Modell für Aufgaben auf dem Gerät.
  • Gemini Pro: Bestes Modell für die Skalierung für ein breites Aufgabenspektrum.
  • Gemini Ultra: Größtes und leistungsfähigstes Modell für hochkomplexe Aufgaben.

Wenn wir die Dinge ein wenig aufschlüsseln, ist Gemini Nano das, was wir unter den besten Android-Handys sehen werden. Gemini Nano wird nicht nur für Entwickler geöffnet AICore, aber Google hat bereits bestätigt, dass es dazu kommen wird Pixel 8 Pro.

Erwarten Sie jedoch keine spezielle App für den Gemini-Zugriff, da Google angibt, dass sie „neue Funktionen wie Summarize in der Recorder-App ermöglicht und Smart Reply in Gboard einführt“. Beginnend mit WhatsApp.“ Aber dank der Möglichkeit für Entwickler, Gemini Nano über AICore zu implementieren und „zu bauen“, hoffen wir, dass es nicht lange dauern wird, bis Nano mehr erreicht Apps.

Um einen Schritt weiter zu gehen, wird Gemini Pro ab dem 13. Dezember „Entwicklern und Unternehmenskunden“ zur Verfügung gestellt. Der Zugriff erfolgt über die neue Gemini-API, die entweder in Google AI Studio oder zu finden ist Google Cloud Vertex AI.

Zum Glück müssen wir nicht auf die Gelegenheit warten, mit Gemini Pro herumzuspielen. Ab heute wurde Gemini Pro implementiert Google Bard „für textbasierte Eingabeaufforderungen, mit Unterstützung für andere Modalitäten in Kürze.“ Derzeit ist Bard nur mit Gemini Pro verfügbar ist in 170 Ländern verfügbar, aber Google plant, „in naher Zukunft“ auf weitere Regionen und mit mehr Sprachen zu expandieren Zukunft."

Multimodales Hero-Rendering von Google Gemini
(Bildnachweis: Google)

Großer Fokus wurde auf Gemini Pro gelegt, da Google behauptet, es sei das „beste Modell für die Skalierung für ein breites Aufgabenspektrum“. Eine von Google bereitgestellte Studie besagt, dass Gemini Pro dazu in der Lage war übertreffen GPT-3.5 „in sechs von acht Benchmarks.“ Obwohl es beeindruckend ist, müssen wir uns auch fragen, ob es verbessert wird, um GPT-3.5 zu übertreffen, oder ob der Schwerpunkt auf Nano und anderen liegen wird Ultra.

Apropos: Gemini Ultra ist wohl das aufregendste Modell der Gruppe, da es das „leistungsfähigste Modell“ ist. Wir jedoch Wille Wir müssen noch etwas warten, bevor wir Ultra in die Hände bekommen, da Google „derzeit umfangreiche Vertrauens- und Sicherheitsprüfungen durchführt“.

Gemini Ultra wird zunächst „Kunden, Entwickler, Partner und Sicherheits- und Verantwortungsexperten für frühe Experimente und Rückmeldungen auswählen, bevor es den Entwicklern zur Verfügung gestellt wird“. Unternehmenskunden Anfang nächsten Jahres.“ Aber es gibt noch etwas anderes, worüber man sich freuen kann, da Ultra voraussichtlich in ein neues „Bard Advanced-Erlebnis“ implementiert wird, das voraussichtlich früh verfügbar sein wird nächstes Jahr.

Google Gemini-Text- und Codierungs-Benchmarks im Vergleich zu GPT-4 von OpenAI
(Bildnachweis: Google)

Ein Teil dessen, was Gemini Ultra so faszinierend macht, ist seine scheinbare Kraft. Google gibt an, dass Ultra „das erste Modell ist, das menschliche Experten übertrifft.“ MMLU (Massive Multitask Language Understanding), das eine Kombination aus 57 Fächern wie Mathematik, Physik, Geschichte, Recht, Medizin und Ethik zur Prüfung sowohl des Weltwissens als auch der Problemlösung Fähigkeiten." 

Wie hat es das gemacht? Durch den Erhalt einer Punktzahl von 90 %, die höher ist als die berechnete Punktzahl von 86,4 % Das GPT-4-Modell von OpenAI. Gemini übertraf GPT-4 in jeder Kategorie, mit Ausnahme des „HellaSwag“-Benchmarks, der als „gesundes Denken für alltägliche Aufgaben“ beschrieben wird.

Und als ob es inzwischen nicht offensichtlich genug wäre, war Google Bard nur eine Notlösung, da das Unternehmen Gemini bis zur Veröffentlichung weiterentwickelte. Aber Bard dient auch als Zugangspunkt zwischen uns und Gemini, da Sie Bard noch heute mit Gemini Pro nutzen können.

Um für ein bisschen Spaß zu sorgen und zu zeigen, wozu Bard mit Gemini Pro fähig ist, hat Google eine Partnerschaft mit YouTuber Mark Rober geschlossen. Im Video, nutzt Rober Bard, um einige Videoideen zu entwickeln, was dazu führt, dass Rober daran arbeitet, „Das genaueste Papierflugzeug der Welt“ zu erschaffen.

Von dort aus wird Bard verwendet, um „Story-Strukturen“ zu generieren, denen Rober dann folgt. In jedem der Abschnitte verlässt sich Bard nicht nur auf Textaufforderungen, denn Rober macht Fotos von den verschiedenen Papierfliegerdesigns und lässt Bard sie analysieren, um herauszufinden, welches das beste ist.

Nachdem er das genaueste Design eines Papierflugzeugs entdeckt hat, wird Bard dann dazu verwendet, das Design zu „kritisieren“. Bard spuckt seine Ergebnisse aus und macht gleichzeitig einige Vorschläge, wie zum Beispiel „Die Flügel sind zu klein“ und „Das Papier ist auch.“ Licht.“ Von da an befolgt Rober Bards Rat und stellt die verschiedenen Testmethoden vor, die vor dem Großen angewendet wurden Finale.

Das Teaser-Video ist zwar großartig, aber es ist nicht gerade das perfekte Beispiel dafür, was wir ausprobieren können Barde mit Gemini Pro Heute. Es gibt uns jedoch einen Einblick in das Gesamtbild dessen, was hoffentlich möglich sein wird, sobald Bard Advanced mit Gemini Ultra verfügbar ist.

Dennoch ist es erfrischend zu sehen, wie Gemini sein offizielles Debüt feiert, bevor wir den Kalender auf das Jahr 2024 umdrehen. Diese Ankündigung hat das Potenzial, das Größte zu sein, was Google in den letzten zehn Jahren passiert ist. Jetzt müssen wir nur noch hoffen, dass Bard with Gemini dem Hype gerecht wird.

instagram story viewer