Chatterbox ist ein Open-Source-Text-to-Speech (TTS)-Modell, das von Resemble AI entwickelt wurde und unter der MIT-Lizenz verfügbar ist.
Es bietet eine Emotionsexaggeration Control, um gesprochene Inhalte lebendiger zu gestalten.
Das Modell wurde gegen führende geschlossene Systeme getestet und bevorzugt abgeschlossen.
Chatterbox ist in der Lage, ausgeprägte Stimmen für verschiedene Anwendungen wie Memes, Videos und Computerspiele zu erzeugen.
Es unterstützt derzeit nur die englische Sprache und wurde mit einem Llama-Backbone trainiert.
Die Software bietet die Möglichkeit, die Stimme und Sprechgeschwindigkeit anzupassen.
Get notified when new stories are published for "🇩🇪 Hacker News Deutsch"