xAI erstellt in Minuten ein Stimmmodell aus deiner Aufnahme und bietet sichere API-Nutzung ohne Zusatzgebühren.
In Kürze
- Stimme in ~2 Minuten einsatzbereit
- Zweistufige Verifikation gegen Missbrauch
- Integration in TTS- und Voice-Agent-APIs
xAI bietet jetzt „Custom Voices“ an
Du kannst in kurzer Zeit eine KI-Stimme erzeugen, die auf deiner eigenen Stimme basiert.
In nur etwa einer Minute sprichst du natürlich über die xAI-Konsole einen Text ein. Laut xAI ist das daraus erstellte Stimmmodell in unter zwei Minuten einsatzbereit — praktisch sofort, ohne lange Wartezeiten oder Studioaufwand.
Die geklonte Stimme lässt sich in xAIs Text-to-Speech- und in Voice-Agent-APIs nutzen (API = Schnittstelle, mit der Entwickler Funktionen wie Sprachwiedergabe in Apps einbinden). Zusätzlich gibt es in der Konsole eine Bibliothek mit mehr als 80 vorinstallierten Stimmen in 28 Sprachen, falls du lieber eine fertige Stimme auswählst.
Sicherheit
Für den Schutz vor Missbrauch setzt xAI auf ein zweistufiges Sicherheitsverfahren:
- Zuerst liest du eine vorgegebene Passphrase vor, die das System in Echtzeit abgleicht.
- Danach werden akustische Merkmale beider Aufnahmen verglichen, um sicherzustellen, dass wirklich dieselbe Person spricht.
xAI betont, dass sich vorhandene Aufnahmen oder fremde Stimmen so nicht zum Klonen verwenden lassen sollen.
Kosten
Das Klonen deiner Stimme verursacht keine zusätzlichen Gebühren, heißt es von xAI.
Produktpalette
Die Ankündigung ergänzt xAIs jüngste Produktpalette rund um Sprache:
- Grok Speech-to-Text- und Text-to-Speech-APIs
- das Voice-Agent-Modell „Grok Voice Think Fast 1.0“, das xAI zufolge bereits für Kundensupport und Vertrieb von Starlink im Einsatz ist
Quellen
- Quelle: xAI
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




