"Chatterbox" - это открытая модель преобразования текста в речь (TTS) производства Resemble AI.
Модель лицензирована по MIT и превосходит по некоторым показателям закрытые системы, такие как ElevenLabs.
Chatterbox поддерживает управление эмоциями, что делает синтезированные голоса более выразительными.
Модель позволяет масштабировать и настраивать её для повышения точности с использованием платного сервиса TTS от Resemble AI.
Для установки модели используется Python 3.11, а поддержка сейчас есть только для английского языка.
Get notified when new stories are published for "🇷🇺 Hacker News Русский"