Google stellt Gemini 2.0 Flash allgemein bereit und ergänzt Pro Experimental sowie Flash-Lite

Google stellt das aktualisierte Gemini 2.0 Flash ab sofort allgemein über die Gemini API in Google AI Studio und Vertex AI bereit. Damit kann das Modell nun auch für Produktionsanwendungen genutzt werden. Bereits zuvor wurde eine aktualisierte Version von 2.0 Flash für alle Nutzer der Gemini-App auf Desktop und Mobilgeräten ausgerollt. Außerdem wird 2.0 Flash Thinking Experimental in der Gemini-App über die Modellauswahl auf Desktop und Mobilgeräten verfügbar.

Alle neu genannten Modelle starten mit multimodalem Input und Textausgabe. Weitere Modalitäten sollen in den kommenden Monaten allgemein verfügbar werden. Genauere Angaben, auch zur Preisgestaltung, verweist Google auf den Google-for-Developers-Blog.

Gemini 2.0 Flash

Die Flash-Modellreihe wurde erstmals zur I/O 2024 vorgestellt und ist laut Google für hochvolumige, häufige Aufgaben im großen Maßstab ausgelegt. Gemini 2.0 Flash verfügt über ein Kontextfenster von 1 Million Token und ist auf multimodales Reasoning über große Informationsmengen ausgelegt. Mit der allgemeinen Verfügbarkeit nennt Google auch verbesserte Ergebnisse in zentralen Benchmarks; Bildgenerierung und Text-to-Speech sollen folgen.

Gemini 2.0 Pro Experimental

Neben Flash veröffentlicht Google eine experimentelle Version von Gemini 2.0 Pro in Google AI Studio und Vertex AI; in der Gemini-App ist sie für Gemini-Advanced-Nutzer verfügbar. Das Modell ist laut Google auf Coding-Leistung und komplexe Prompts ausgerichtet und baut auf Rückmeldungen zu früheren experimentellen 2.0-Versionen wie Gemini-Exp-1206 auf.

Gemini 2.0 Pro verfügt über ein Kontextfenster von 2 Millionen Token, das größte im aktuellen Gemini-2.0-Portfolio. Google nennt zudem ein besseres Verständnis und stärkeres Reasoning bei Weltwissen als bei bisher veröffentlichten Modellen sowie die Möglichkeit, Tools wie Google Search und Code Execution aufzurufen.

Gemini 2.0 Flash-Lite

Mit Gemini 2.0 Flash-Lite erscheint außerdem ein neues Modell in Public Preview in Google AI Studio und Vertex AI. Google positioniert es als bislang kosteneffizientestes Modell. Es soll eine höhere Qualität als 1.5 Flash bei gleicher Geschwindigkeit und gleichen Kosten bieten und 1.5 Flash in der Mehrzahl der Benchmarks übertreffen.

Wie 2.0 Flash hat Flash-Lite ein Kontextfenster von 1 Million Token und unterstützt multimodalen Input. Als Beispiel nennt Google die Erzeugung einer passenden einzeiligen Bildunterschrift für rund 40.000 einzelne Fotos für weniger als einen US-Dollar im kostenpflichtigen Tarif von Google AI Studio.

Sicherheit

Google beschreibt begleitende Sicherheitsmaßnahmen für die Gemini-2.0-Modellfamilie. Dazu gehören neue Reinforcement-Learning-Techniken, bei denen Gemini die eigenen Antworten kritisiert, um genaueres und gezielteres Feedback zu erzeugen und den Umgang mit sensiblen Prompts zu verbessern.

Zusätzlich setzt Google automatisiertes Red Teaming ein, um Sicherheits- und Schutzrisiken zu bewerten. Dazu zählen auch Risiken durch indirekte Prompt Injection, bei der Angreifer schädliche Anweisungen in Daten verbergen, die ein KI-System voraussichtlich abruft.

Quelle

Originalquelle: Google DeepMind News

Google stellt Gemini 2.0 Flash allgemein bereit und ergänzt Pro Experimental sowie Flash-Lite

Gemini 2.0 Flash

Gemini 2.0 Pro Experimental

Gemini 2.0 Flash-Lite

Sicherheit

Quelle

Recent Articles

xAI veröffentlicht Grok Text-to-Speech API

NVIDIA erweitert Megatron Core um Muon und weitere Optimizer für LLM-Training

NVIDIA beschreibt RTX PRO 4500 Blackwell Server Edition mit vGPU 20 für virtualisierte Rechenzentren

nvmath-python 0.9.0 integriert Universal Sparse Tensor für Sparse-Workloads

NVIDIA beschreibt Kaggle-Sieg mit LLM-gestützter Code-Generierung und GPU-beschleunigten Experimenten

Related Stories

Leave A Reply Antwort abbrechen

Stay on op - Ge the daily news in your inbox