xAI hat am 2. Mai Custom Voices gestartet. Das Feature klont die Stimme eines Nutzers aus rund 60 Sekunden natürlicher Sprache, aufgenommen über die xAI-Konsole. In weniger als zwei Minuten steht ein fertiges Stimmmodell bereit, das sich über die Text-to-Speech- und Voice-Agent-APIs nutzen lässt. Extra kosten: null.
Neben dem eigenen Klon stehen über 80 vorgefertigte Stimmen in 28 Sprachen zur Verfügung, alle über denselben API-Endpunkt erreichbar. xAIs Chatbot Grok bekommt das Feature als Teil des Grok-4.3-Releases. Wer Grok bereits für Sprachanwendungen nutzt, kann geklonte Stimmen ohne Umstellung einbinden.
Gegen Missbrauch setzt xAI eine zweistufige Verifikation ein. Zuerst liest der Nutzer eine Passphrase vor, die in Echtzeit transkribiert und geprüft wird. Danach vergleicht das System die Stimmeigenschaften beider Aufnahmen, um sicherzustellen, dass dieselbe Person spricht. Unabhängig geprüft wurden diese Schutzmaßnahmen bislang nicht. Konkurrenten wie Alibabas Qwen3-TTS klonen bereits ab drei Sekunden Audio, Microsoft hat Stimmklonen in Teams integriert. xAIs 60-Sekunden-Schwelle ist konservativer, die Frage bleibt, ob die Sicherheitsmechanismen mit dem Missbrauchspotenzial Schritt halten.
Für Entwickler ist das Angebot attraktiv: kostenlose Stimmklone senken die Einstiegshürde für Audiobooks, Sprachagenten und Spielecharaktere erheblich. Die meisten Konkurrenten berechnen pro Minute oder pro Zeichen. Dass xAI das Feature direkt in ein günstiges Modell-Tier bündelt, dürfte die Zahl geklonter Stimmen auf der Plattform schnell wachsen lassen.
Quellen
- xAI: Custom Voices and Voice Library
- The Decoder: xAI’s new Custom Voices feature turns a minute of speech into a usable voice clone
- WinBuzzer: xAI Adds Voice Cloning to New Grok 4.3 AI Model
Ähnliche News
- Alibabas Qwen3.6 macht Coding-Agenten für alle verfügbar
- Pentagon öffnet geheime Netzwerke für acht KI-Firmen, Anthropic bleibt draußen
- Microsoft baut eine Leitstelle für KI-Agenten
Diese Meldung wurde mit Unterstützung von Claude (Anthropic) recherchiert und verfasst. Inhaltliche Fehler sind möglich. Die verlinkten Quellen ermöglichen eine eigene Prüfung. Fachbegriffe erläutert das Glossar.