Google stellt Gemini 2.5 Pro Experimental vor

Google stellt mit Gemini 2.5 eine neue Modellgeneration vor. Die erste Veröffentlichung ist Gemini 2.5 Pro Experimental, das laut Google auf einer breiten Auswahl von Benchmarks State-of-the-Art erreicht und auf LMArena mit deutlichem Abstand Platz 1 belegt.

Gemini 2.5 wird als Thinking Model beschrieben. Gemeint ist damit, dass das Modell vor der Antwort seine Schlussfolgerungen durchgeht. Google bezeichnet dies als Fähigkeit, Informationen zu analysieren, logische Schlüsse zu ziehen, Kontext und Nuancen einzubeziehen und informierte Entscheidungen zu treffen. Das Unternehmen verweist dabei auf frühere Arbeiten mit Reinforcement Learning, Chain-of-Thought Prompting und auf Gemini 2.0 Flash Thinking. Bei Gemini 2.5 werde ein deutlich verbessertes Basismodell mit verbessertem Post-Training kombiniert. Künftig sollen diese Thinking-Fähigkeiten direkt in alle Modelle eingebaut werden.

Gemini 2.5 Pro Experimental ist laut Google auf komplexe Aufgaben ausgelegt. In LMArena, das menschliche Präferenzen misst, führt das Modell nach Angaben des Unternehmens mit deutlichem Vorsprung. Zudem zeige es starke Fähigkeiten bei Reasoning und Coding und liege bei gängigen Benchmarks in Coding, Mathematik und Wissenschaft vorn.

Bei Benchmarks für fortgeschrittenes Reasoning nennt Google unter anderem GPQA und AIME 2025. Dabei hebt das Unternehmen hervor, dass Gemini 2.5 Pro ohne test-time Techniken auskommt, die die Kosten erhöhen, etwa Majority Voting. Auf Humanity’s Last Exam, einem von Hunderten Fachexperten entworfenen Datensatz zur Erfassung der menschlichen Wissens- und Reasoning-Grenze, erreiche das Modell ohne Tool-Nutzung 18,8 %.

Beim Coding beschreibt Google einen deutlichen Sprung gegenüber Gemini 2.0, mit weiteren angekündigten Verbesserungen. Gemini 2.5 Pro eigne sich für visuell aufwendige Web-Apps, agentische Code-Anwendungen sowie für Code-Transformation und -Bearbeitung. Auf SWE-Bench Verified, das Google als Industriestandard für agentische Code-Evaluierungen bezeichnet, erreicht das Modell laut Unternehmen 63,8 % mit einem benutzerdefinierten Agent-Setup.

Gemini 2.5 übernimmt außerdem zentrale Eigenschaften der bisherigen Gemini-Modelle: native Multimodalität und ein langes Kontextfenster. Gemini 2.5 Pro startet mit einem Kontextfenster von 1 Million Tokens; 2 Millionen Tokens sollen bald folgen. Laut Google kann das Modell große Datensätze verarbeiten und komplexe Probleme über verschiedene Informationsquellen hinweg bearbeiten, darunter Text, Audio, Bilder, Video und vollständige Code-Repositories.

Gemini 2.5 Pro ist ab sofort in Google AI Studio verfügbar. Nutzer von Gemini Advanced können das Modell in der Gemini-App auf Desktop und Mobilgeräten auswählen. Für Vertex AI ist die Verfügbarkeit in den kommenden Wochen angekündigt. Preise sollen ebenfalls in den nächsten Wochen folgen, einschließlich höherer Rate Limits für den skalierten Produktionseinsatz. Am 26. März wurde der Beitrag laut Google zudem um neue MRCR-Evaluierungen (Multi Round Coreference Resolution) ergänzt.

Quelle

Originalquelle: Google DeepMind News

Recent Articles

spot_img

Related Stories

Leave A Reply

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein

Stay on op - Ge the daily news in your inbox