Zyphra präsentiert Zonos-v0.1: Innovatives KI-Modell für Text-zu-Sprache und Stimmklonung

13.02.2025 | KI

Ein neues KI-Modell von Zyphra sorgt für Aufsehen in der Sprachsynthese und Stimmklonung.

In Kürze

  • Natürlich klingende Sprache aus Text in nur 5 bis 30 Sekunden
  • Open-Source-Modell mit umfangreichen Anpassungsoptionen
  • Vielfältige Einsatzmöglichkeiten von Sprachassistenten bis Übersetzungssystemen

Zyphra’s New Model: Zonos-v0.1

Zyphra, an emerging AI startup, has introduced a new model, Zonos-v0.1, which is making waves in the field of text-to-speech (TTS) and voice cloning. With this tool, it is possible to generate naturally sounding speech from text and clone voices – all with just 5 to 30 seconds of voice recording. Zonos supports a variety of languages, including English, German, French, Chinese, and Japanese.

Model Specifications

The model is based on an extensive training dataset of approximately 200,000 hours of voice data. There are two variants: a pure transformer model and a hybrid model that combines the strengths of transformers and state-space models (SSM). Both models boast 1.6 billion parameters, providing them with remarkable processing capacity.

Open-Source Accessibility

Another advantage: Zonos is open-source and thus freely accessible to developers and researchers. This means that the model can be used and further developed for personal projects. Particularly useful are the customization options that allow for adjustments in speaking speed, pitch, audio quality, and even emotions. With a powerful GPU like the RTX 4090, the model runs faster than real-time. The user-friendly Gradio interface and simple Docker installation significantly ease handling.

Potential Impact and Future Development

The release of Zonos as open-source could bring new impetus to speech synthesis and voice cloning. The applications are diverse – from personalized voice assistants to translation systems. Zyphra plans to continuously develop the model to improve audio quality and add more languages. Developers worldwide are invited to participate in this exciting project. Zonos-v0.1 could prove to be a valuable tool in AI speech processing.

Quellen

  • Quelle: Zyphra
  • Der ursprüngliche Artikel wurde hier veröffentlicht
  • Dieser Artikel wurde im Podcast KI-Briefing-Daily behandelt. Die Folge kannst du hier anhören.

💡Über das Projekt KI News Daily

Dieser Artikel wurde vollständig mit KI generiert und ist Teil des Projektes KI News Daily der Pickert GmbH.

Wir arbeiten an der ständigen Verbesserung der Mechanismen, können aber leider Fehler und Irrtümer nicht ausschließen. Sollte dir etwas auffallen, wende dich bitte umgehend an unseren Support und feedback[at]pickert.io

Vielen Dank! 🙏

Das könnte dich auch interessieren…

Nvidia öffnet Warp: Python-Framework jetzt Open Source

Nvidia öffnet Warp: Python-Framework jetzt Open Source

Nvidia hat sein Python-Framework Warp unter die Open-Source-Lizenz Apache 2 gestellt und reagiert damit auf Community-Kritik.In KürzeWarp wandelt Python-Funktionen in Echtzeit in Code um.Das Framework unterstützt sowohl x86- als auch CUDA-GPUs.Integration in...