Google aktualisiert Gemini 2.5 Pro und 2.5 Flash

Google hat weitere Aktualisierungen fuer die Modellreihe Gemini 2.5 angekuendigt. Dazu gehoeren neue Funktionen fuer Gemini 2.5 Pro und 2.5 Flash, Erweiterungen in der Gemini API und in Vertex AI sowie ein breiterer Rollout von 2.5 Flash. Laut Google ist 2.5 Flash bereits in der Gemini-App verfuegbar; die aktualisierte Version soll Anfang Juni allgemein in Google AI Studio fuer Entwickler und in Vertex AI fuer Unternehmen verfuegbar werden, 2.5 Pro kurz danach.

Fuer Gemini 2.5 Pro verweist Google auf Fortschritte bei akademischen Benchmarks und auf fuehrende Platzierungen in WebDev Arena und ueber die Leaderboards von LMArena hinweg. In WebDev Arena nennt Google einen ELO-Wert von 1415. Mit einem Kontextfenster von 1 Million Tokens soll 2.5 Pro zudem bei Long-Context- und Videoverstaendnis State-of-the-Art-Leistung erreichen. Nach der Einbindung von LearnLM beschreibt Google 2.5 Pro auch als fuehrendes Modell fuer Lernanwendungen; in direkten Vergleichen haetten Lehrkraefte und Experten das Modell bei Paedagogik und Wirksamkeit in unterschiedlichen Szenarien bevorzugt.

Mit Deep Think testet Google fuer 2.5 Pro einen experimentellen erweiterten Reasoning-Modus. Dieser nutzt laut Google neue Forschungstechniken, damit das Modell vor einer Antwort mehrere Hypothesen beruecksichtigen kann. Google nennt Ergebnisse auf dem Mathematik-Benchmark 2025 USAMO, eine Fuehrung bei LiveCodeBench fuer wettbewerbsnahes Coding sowie 84,0 Prozent auf MMMU fuer multimodales Reasoning. Vor einer breiteren Verfuegbarkeit will Google zusaetzliche Frontier-Safety-Evaluierungen durchfuehren und weiteres Feedback von Sicherheitsexperten einholen. Zunaechst soll Deep Think ueber die Gemini API nur fuer vertrauenswuerdige Tester verfuegbar werden.

Gemini 2.5 Flash beschreibt Google als effizientes Modell fuer Geschwindigkeit und niedrige Kosten. Die neue Version habe sich bei zentralen Benchmarks fuer Reasoning, Multimodalitaet, Code und Long Context verbessert und in Googles Evaluierungen zugleich 20 bis 30 Prozent weniger Tokens genutzt. Die neue Version ist laut Google als Preview in Google AI Studio und in Vertex AI verfuegbar und in der Gemini-App fuer alle nutzbar; die allgemeine Freigabe fuer den produktiven Einsatz ist fuer Anfang Juni vorgesehen.

Zu den neuen Faehigkeiten der Gemini-2.5-Modelle gehoert in der Live API eine Preview fuer audio-visuellen Input und nativen Audio-Output fuer Dialoge. Damit sollen sich konversationelle Anwendungen mit natuerlicherer und ausdrucksfaehigerer Sprachinteraktion erstellen lassen. Nutzer koennen laut Google Tonfall, Akzent und Sprechstil steuern. Die Live API unterstuetzt ausserdem Tool Use. Als fruehe Funktionen nennt Google Affective Dialogue, bei dem das Modell Emotionen in der Stimme des Nutzers erkennen und passend reagieren soll, Proactive Audio, bei dem Hintergrundgespraeche ignoriert und passende Antwortzeitpunkte erkannt werden sollen, sowie Thinking in der Live API fuer komplexere Aufgaben.

Zusaetzlich veroeffentlicht Google neue Previews fuer Text-to-Speech in 2.5 Pro und 2.5 Flash. Diese unterstuetzen laut Google erstmals mehrere Sprecher und damit Text-to-Speech mit zwei Stimmen ueber nativen Audio-Output. Die Ausgabe soll ueber 24 Sprachen hinweg funktionieren und nahtlos zwischen ihnen wechseln koennen.

Die Computer-Use-Faehigkeiten aus Project Mariner bringt Google in die Gemini API und in Vertex AI. Unternehmen wie Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company und Cartwheel pruefen laut Google moegliche Anwendungen. Ein breiterer Rollout fuer Entwickler zum Experimentieren ist fuer den Sommer angekuendigt.

Im Bereich Sicherheit hebt Google einen erweiterten Schutz gegen Bedrohungen wie indirekte Prompt-Injections hervor, bei denen schaedliche Anweisungen in von einem Modell abgerufene Daten eingebettet sind. Der neue Sicherheitsansatz habe die Schutzrate bei indirekten Prompt-Injection-Angriffen waehrend der Tool-Nutzung deutlich erhoeht; Google bezeichnet Gemini 2.5 deshalb als bisher sicherste Modellfamilie des Unternehmens.

Fuer Entwickler fuehrt Google ausserdem Thought Summaries in der Gemini API und in Vertex AI ein. Diese sollen die rohen Gedanken des Modells in ein klar strukturiertes Format mit Ueberschriften, Kerndetails und Informationen zu Modellaktionen wie Tool-Nutzung ueberfuehren. Ziel ist laut Google, Interaktionen mit den Modellen leichter verstaendlich und einfacher debugbar zu machen.

Die bereits mit 2.5 Flash eingefuehrten Thinking Budgets werden auf 2.5 Pro ausgeweitet. Damit koennen Entwickler die Zahl der Tokens steuern, die ein Modell vor der Antwort fuer sein Denken verwendet, oder die Thinking-Faehigkeiten ganz deaktivieren, um Kosten, Latenz und Qualitaet auszubalancieren. Gemini 2.5 Pro mit Budgets soll in den kommenden Wochen allgemein fuer einen stabilen Produktionseinsatz verfuegbar werden.

Hinzu kommt native SDK-Unterstuetzung fuer Definitionen des Model Context Protocol (MCP) in der Gemini API, um die Integration von Open-Source-Tools zu erleichtern. Google prueft zudem Moeglichkeiten, MCP-Server und andere gehostete Tools bereitzustellen, um den Aufbau agentischer Anwendungen zu vereinfachen.

Quelle

Originalquelle: Google DeepMind News

Recent Articles

spot_img

Related Stories

Leave A Reply

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Stay on op - Ge the daily news in your inbox