Google DeepMind hat auf der Entwicklerkonferenz Google I/O sein Weltmodell Genie an Street View gekoppelt. Wer in Google Maps eine Straße in den USA antippt, kann sie ab sofort nicht nur als Foto ansehen, sondern als begehbare 3D-Welt betreten. Das zugrunde liegende Modell Genie 3 erzeugt den Weg nach vorn in Echtzeit, während man sich bewegt. Es simuliert Umgebungen, lässt Wetter und Tageszeit ändern und kann denselben Ort im Schnee oder unter Wasser zeigen.
Die Datenbasis ist der eigentliche Hebel. Google sammelt seit 20 Jahren Street-View-Aufnahmen, mit Kamera-Autos und mit Trägern, die Rucksack-Kameras schultern. Inzwischen sind über 280 Milliarden Bilder aus 110 Ländern und sieben Kontinenten zusammengekommen. Genie verankert seine Simulationen an diesen realen Orten. Bemerkenswert ist die räumliche Konsistenz, so DeepMind: Dreht man sich um 360 Grad, merkt sich das Modell, was hinter einem liegt, und baut die Welt von dort aus weiter.
Für Nutzer ist das mehr als eine Spielerei. Weltmodelle dienen als Trainingsumgebung für Roboter und selbstfahrende Autos. Genie 3 treibt bereits einen Simulator von Waymo an, der das autonome Fahren auf sehr seltene Situationen vorbereitet, etwa Tornados oder Tiere auf der Fahrbahn. Mit Street-View-Daten ließe sich ein Roboter auf den Moment trainieren, in dem im sonst grauen London plötzlich die Sonne durchbricht. Wer kein Robotiklabor betreibt, kann über das Webtool Project Genie eigene Welten aus Text und Bildern erzeugen, erkunden und neu kombinieren.
Die Grenzen sind klar. Die Ergebnisse wirken noch eher wie ein Videospiel als fotorealistisch, und das Modell versteht Physik bislang nicht. In einer Demo lief eine Figur einfach durch Kakteen hindurch. Die Generierung ist auf 60 Sekunden begrenzt. DeepMind-Forscher Jack Parker-Holder ordnet ein: »Ich denke, dieses Modell liegt etwa sechs bis zwölf Monate hinter Video zurück, was Genauigkeit und Qualität angeht.« Die Street-View-Funktion startet zunächst für einige Ultra-Abonnenten in den USA, weltweit soll sie in den kommenden Wochen folgen.
Quellen
- Google: Project Genie: Experimenting with infinite, interactive worlds
- TechCrunch: Google’s Genie world model can now simulate real streets with Street View
- Bildungssprache: Google Gemini – Was Googles KI kann und was nicht
- Bildungssprache: KI Trends 2026 – Agenten, multimodale Wahrnehmung und mehr
Ähnliche News
- OpenAI baut Codex in die ChatGPT-Mobile-App ein
- Google baut einen KI-Agenten, der nie schläft
- Anthropic schickt zehn KI-Agenten an die Wall Street
Diese Meldung wurde mit Unterstützung von Claude (Anthropic) recherchiert und verfasst. Inhaltliche Fehler sind möglich. Die verlinkten Quellen ermöglichen eine eigene Prüfung. Fachbegriffe erläutert das Glossar.