Google hat Gemini 3.5 Live Translate veröffentlicht, ein Audiomodell, das gesprochene Sprache fast in Echtzeit in über 70 Sprachen überträgt. Es erkennt die Ausgangssprache automatisch und gibt die Übersetzung als Sprache wieder, die Tempo, Betonung und Tonhöhe des Sprechers nachahmt. Ausgerollt wird es ab sofort in der Google-Translate-App für Android und iOS, in Google Meet als geschlossene Vorschau und über die Gemini Live API für Entwickler.
Der Trick steckt im Timing. Statt zu warten, bis jemand seinen Satz beendet hat, übersetzt das Modell kontinuierlich und bleibt nur wenige Sekunden hinter dem Sprecher. In Google Meet springt die Zahl der unterstützten Sprachen von fünf auf über 70, mit mehr als 2000 möglichen Sprachkombinationen in einem einzigen Meeting. Für Android kommt ein neuer »listening mode«: Telefon ans Ohr halten wie bei einem normalen Anruf, und die Übersetzung kommt direkt aus dem Hörer, ohne dass jemand mithört.
Für alle, die schon einmal mit Händen und Füßen eine Speisekarte in Lissabon entziffert haben, ist das mehr als eine Spielerei. Übersetzungs-Apps gibt es seit Jahren, aber die meisten klangen wie ein Navigationsgerät mit Schnupfen und zerhackten jedes Gespräch in Wartepausen. Wenn Google hält, was es verspricht, fällt genau dieser Bruch weg. Wie gut KI inhaltlich wirklich überträgt, bleibt trotzdem eine eigene Frage, denn flüssig klingen und präzise sein sind zwei verschiedene Dinge.
Noch ist vieles Vorschau. Google Meet bekommt die Funktion zunächst nur für ausgewählte Workspace-Kunden, der breite Rollout soll später im Jahr folgen. Jedes erzeugte Audio trägt das unhörbare Wasserzeichen SynthID, damit eine synthetische Stimme als solche erkennbar bleibt. Der Fahrdienst Grab testet das Modell schon für Gespräche zwischen Fahrern und Fahrgästen, über zehn Millionen Sprachanrufe im Monat. Wer Sprachen lieber selbst lernen will, sei beruhigt: Ein Dolmetscher im Ohr ersetzt das Verstehen nicht.
Quellen
- Google The Keyword: Fluid, natural voice translation with Gemini 3.5 Live Translate
- 9to5Google: Gemini 3.5 Live Translate rolling out to Google Meet and Translate
- SiliconANGLE: Google’s Gemini 3.5 Live Translate enables realistic translation at the speed of natural conversations
Ähnliche News
- Meta wirft Llama über Bord und setzt auf ein geschlossenes Modell
- ChatGPT schreibt jetzt Dossiers über dich und nennt es Träumen
- Claude Opus 4.7 löst Aufgaben, an denen der Vorgänger scheiterte
Diese Meldung wurde mit Unterstützung von Claude (Anthropic) recherchiert und verfasst. Inhaltliche Fehler sind möglich. Die verlinkten Quellen ermöglichen eine eigene Prüfung. Fachbegriffe erläutert das Glossar.