DeepL stellt Voice‑to‑Voice vor: Live-Übersetzung für Meetings, Gespräche und APIs.
In Kürze
- Echtzeit-Übersetzung für Meetings, mobile Gespräche und Gruppen
- Wichtige Termine: Gruppen 30. Apr, Optimierungen 7. Mai, Meetings EA im Juni
- Mehr als 40 Sprachen; 96% Präferenz in Blindtests
DeepL aus Köln hat eine neue Produktreihe namens „DeepL Voice-to-Voice“ vorgestellt: eine Echtzeit-Lösung für Sprach-zu-Sprach-Übersetzung, gedacht für Meetings, persönliche Gespräche und Kundenanwendungen per API. Ziel ist, Teams und Support einfacher über Sprachbarrieren hinweg arbeiten zu lassen.
Wie es funktioniert
DeepL kombiniert nach eigenen Angaben große Sprachmodelle mit der vorhandenen Übersetzungstechnik des Unternehmens, erklärt CEO Jarek Kutylowski. Du sprichst in deiner Sprache; beim Gegenüber erscheint eine präzise Übersetzung in Echtzeit. Technisch soll eine „Übersetzungs‑Ebene“ als Zwischenschicht dafür sorgen, dass die Übersetzung in bestehende Dienste eingebunden werden kann.
Die fünf Produkte
- Voice for Meetings: Echtzeit-Übersetzung für Videokonferenz-Plattformen wie Microsoft Teams und Zoom. Early Access startet im Juni, die Anmeldung ist bereits möglich.
- Voice for Conversations: Sofort verfügbar per Mobilgerät und Web, gedacht für Situationen, in denen keine App installiert werden kann oder darf.
- Gruppenkonversationen: Für mehrsprachige Trainings, Coachings und Workshops. Teilnehmende treten per QR‑Code bei und können gleichzeitig auf mehreren Geräten Übersetzungen empfangen. Verfügbar ab 30. April.
- Voice-to-Voice API: Firmen können die Übersetzung in eigene interne oder kundenorientierte Tools integrieren. Ein konkretes Startdatum nennt DeepL nicht; Interessierte können sich anmelden.
- Optimierungsfunktionen: Einstellungen zur Erkennung spezieller Terminologie (Branchenbegriffe, Produkt- und Eigennamen), auch bei schneller oder technischer Sprache. Diese Funktionen werden ab 7. Mai angeboten.
Sprachumfang und Qualität
Zum Start deckt DeepL Voice alle 24 offiziellen EU-Sprachen ab sowie zusätzliche Sprachen wie Vietnamesisch, Thailändisch, Arabisch, Norwegisch, Hebräisch, Bengalisch und Tagalog — insgesamt mehr als 40 Sprachen. In unabhängigen Blindtests von Slator bevorzugten 96 % der teilnehmenden Linguist:innen DeepL Voice gegenüber den nativen Übersetzungsfunktionen von Google, Microsoft und Zoom.
Praktische Einsatzfelder
DeepL sieht die Lösung vor allem als Möglichkeit, Support in seltenen oder teuren Sprachen anbieten zu können, indem Übersetzungen als Zwischenschicht in vorhandene Services eingebunden werden. Für Meetings und Workshops versprechen die Funktionen simultane Übersetzungen auf mehreren Geräten; für Unternehmen bieten die API und die Terminologie-Optimierung Integrations- und Anpassungsoptionen.
Kontext
Im September 2025 hatte DeepL bereits einen KI-Agenten vorgestellt, der Firmen in Bereichen wie Finanzen, Vertrieb, Marketing, Kundensupport und Lokalisierung unterstützen soll. Medienberichten zufolge prüft das Unternehmen außerdem einen möglichen Börsengang.
Termine und Zugang
- Voice for Conversations ist ab sofort verfügbar.
- Gruppenkonversationen starten am 30. April.
- Optimierungsfunktionen ab 7. Mai.
- Early Access für Voice for Meetings beginnt im Juni — Anmeldungen sind bereits möglich.
- Voice-to-Voice API: Für die API hat DeepL noch kein Startdatum genannt; Interessierte können sich ebenfalls registrieren.
Quellen
- Quelle: DeepL
- Der ursprüngliche Artikel wurde hier veröffentlicht
- Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.




