Google stellt das aktualisierte Gemini 2.0 Flash ab sofort allgemein über die Gemini API in Google AI Studio und Vertex AI bereit. Damit kann das Modell nun auch für Produktionsanwendungen genutzt werden. Bereits zuvor wurde eine aktualisierte Version von 2.0 Flash für alle Nutzer der Gemini-App auf Desktop und Mobilgeräten ausgerollt. Außerdem wird 2.0 Flash Thinking Experimental in der Gemini-App über die Modellauswahl auf Desktop und Mobilgeräten verfügbar.
Alle neu genannten Modelle starten mit multimodalem Input und Textausgabe. Weitere Modalitäten sollen in den kommenden Monaten allgemein verfügbar werden. Genauere Angaben, auch zur Preisgestaltung, verweist Google auf den Google-for-Developers-Blog.
Gemini 2.0 Flash
Die Flash-Modellreihe wurde erstmals zur I/O 2024 vorgestellt und ist laut Google für hochvolumige, häufige Aufgaben im großen Maßstab ausgelegt. Gemini 2.0 Flash verfügt über ein Kontextfenster von 1 Million Token und ist auf multimodales Reasoning über große Informationsmengen ausgelegt. Mit der allgemeinen Verfügbarkeit nennt Google auch verbesserte Ergebnisse in zentralen Benchmarks; Bildgenerierung und Text-to-Speech sollen folgen.
Gemini 2.0 Pro Experimental
Neben Flash veröffentlicht Google eine experimentelle Version von Gemini 2.0 Pro in Google AI Studio und Vertex AI; in der Gemini-App ist sie für Gemini-Advanced-Nutzer verfügbar. Das Modell ist laut Google auf Coding-Leistung und komplexe Prompts ausgerichtet und baut auf Rückmeldungen zu früheren experimentellen 2.0-Versionen wie Gemini-Exp-1206 auf.
Gemini 2.0 Pro verfügt über ein Kontextfenster von 2 Millionen Token, das größte im aktuellen Gemini-2.0-Portfolio. Google nennt zudem ein besseres Verständnis und stärkeres Reasoning bei Weltwissen als bei bisher veröffentlichten Modellen sowie die Möglichkeit, Tools wie Google Search und Code Execution aufzurufen.
Gemini 2.0 Flash-Lite
Mit Gemini 2.0 Flash-Lite erscheint außerdem ein neues Modell in Public Preview in Google AI Studio und Vertex AI. Google positioniert es als bislang kosteneffizientestes Modell. Es soll eine höhere Qualität als 1.5 Flash bei gleicher Geschwindigkeit und gleichen Kosten bieten und 1.5 Flash in der Mehrzahl der Benchmarks übertreffen.
Wie 2.0 Flash hat Flash-Lite ein Kontextfenster von 1 Million Token und unterstützt multimodalen Input. Als Beispiel nennt Google die Erzeugung einer passenden einzeiligen Bildunterschrift für rund 40.000 einzelne Fotos für weniger als einen US-Dollar im kostenpflichtigen Tarif von Google AI Studio.
Sicherheit
Google beschreibt begleitende Sicherheitsmaßnahmen für die Gemini-2.0-Modellfamilie. Dazu gehören neue Reinforcement-Learning-Techniken, bei denen Gemini die eigenen Antworten kritisiert, um genaueres und gezielteres Feedback zu erzeugen und den Umgang mit sensiblen Prompts zu verbessern.
Zusätzlich setzt Google automatisiertes Red Teaming ein, um Sicherheits- und Schutzrisiken zu bewerten. Dazu zählen auch Risiken durch indirekte Prompt Injection, bei der Angreifer schädliche Anweisungen in Daten verbergen, die ein KI-System voraussichtlich abruft.
