KI Modelle

Forschung

Waypoint-1.5 erweitert Echtzeit-Weltmodelle für Consumer-Hardware

Hugging Face stellt Waypoint-1.5 als nächstes Echtzeit-Video-Weltmodell von Overworld vor. Die Version erhöht die Bildqualität, ergänzt eine 360p-Stufe für breitere Hardware-Unterstützung und soll interaktive generative Umgebungen lokal auf Alltags-Hardware zugänglicher machen.

admin - 24. April 2026

Audio & Video

Google erweitert Video- und Bildgenerierung mit Veo 2, Imagen 3 und Whisk

Google stellt mit Veo 2 ein neues Videomodell und eine aktualisierte Version von Imagen 3 für die Bildgenerierung vor. Beide Modelle sollen in menschlich bewerteten Vergleichen Ergebnisse auf dem Stand der Technik erreichen und werden über VideoFX, ImageFX und das neue Labs-Experiment Whisk verfügbar gemacht.

admin - 24. April 2026

Forschung

FACTS Grounding: Neuer Benchmark zur Bewertung der Faktentreue von Sprachmodellen

Google DeepMind und Google Research stellen mit FACTS Grounding einen neuen Benchmark zur Bewertung der Faktentreue großer Sprachmodelle vor. Der Fokus liegt auf der Frage, wie gut Modellantworten durch bereitgestellte Quellen gestützt sind.

admin - 24. April 2026

KI Modelle

NVIDIA und Google Cloud bauen Infrastruktur für agentische und physische KI aus

NVIDIA und Google Cloud erweitern ihre gemeinsame KI-Plattform um neue Infrastruktur, Sicherheitsfunktionen und Modellangebote für agentische und physische KI. Vorgestellt wurden unter anderem A5X-Bare-Metal-Instanzen auf Basis von NVIDIA Vera Rubin, Gemini auf Google Distributed Cloud mit Blackwell-GPUs sowie Nemotron-Modelle und NeMo-Funktionen auf der Gemini Enterprise Agent Platform.

admin - 24. April 2026

Forschung

PlugMem: Allgemeines Speichermodul für KI-Agenten

Microsoft Research beschreibt mit PlugMem ein Plug-and-play-Speichersystem für LLM-Agenten, das Interaktionsverläufe in strukturierte, wiederverwendbare Wissenseinheiten umwandelt. In drei unterschiedlichen Benchmarks erzielte das Modul laut den Autoren bessere Ergebnisse als generische Retrieval-Verfahren und aufgabenspezifische Speicheransätze, bei geringerem Speicher-Token-Bedarf.

admin - 24. April 2026

Audio & Video

Microsoft-Research-Podcast vergleicht LLMs mit der Architektur des Gehirns

In der ersten Folge von „The Shape of Things to Come“ diskutieren Doug Burger, Nicolò Fusi und Subutai Ahmad, ob heutige KI-Systeme als intelligent gelten können. Im Mittelpunkt stehen Unterschiede zwischen transformerbasierten Large Language Models und der verteilten, kontinuierlich lernenden Architektur des menschlichen Gehirns.

admin - 24. April 2026

Recent Articles

xAI veröffentlicht Grok Text-to-Speech API

NVIDIA erweitert Megatron Core um Muon und weitere Optimizer für LLM-Training

NVIDIA beschreibt RTX PRO 4500 Blackwell Server Edition mit vGPU 20 für virtualisierte Rechenzentren

nvmath-python 0.9.0 integriert Universal Sparse Tensor für Sparse-Workloads

NVIDIA beschreibt Kaggle-Sieg mit LLM-gestützter Code-Generierung und GPU-beschleunigten Experimenten

Stay on op - Ge the daily news in your inbox