Sonic 3 — генератор речи с 42 языками и 50+ эмоциями. Клонирует голос по 3 сек аудио; заявляют ~190 мс задержки и скорость выше OpenAI в 3–5 раз.
Что это
Это сервис для озвучки текста. Поддерживает сотни акцентов и русский язык. Можно тонко управлять паузами, запинками, дыханием, произношением и тембром. Есть эмоции — от страха и грусти до спокойствия и смеха.
Зачем
Как попробовать
Ссылка
cartesia.ai
Что это
Это сервис для озвучки текста. Поддерживает сотни акцентов и русский язык. Можно тонко управлять паузами, запинками, дыханием, произношением и тембром. Есть эмоции — от страха и грусти до спокойствия и смеха.
Зачем
- Быстро озвучить ролики и прототипы, где важна низкая задержка (~190 мс по заявлению сервиса).
- Передать нужное настроение: страх, грусть, спокойствие или смех.
- Точно контролировать речь: паузы, запинки, дыхание, произношение, тембр.
- Сделать озвучку на 42 языках и с разными акцентами, включая русский.
- Быстро клонировать голос по 3 секундам записи.
Как попробовать
- Откройте ссылку и зарегистрируйтесь — дают 30 000 кредитов (примерно 30 минут генерации).
- Выберите язык/акцент и эмоции; при желании загрузите 3‑секундный фрагмент для клона.
- Настройте паузы, дыхание, произношение, тембр — затем сгенерируйте дорожку.
- На сайте указано, что число аккаунтов не ограничено.
Ссылка
Real-time TTS API with AI laughter and emotion | Cartesia Sonic-3
Integrate real-time text-to-speech with Sonic-3, Cartesia’s streaming TTS API. Generate natural, expressive voices with laughter in 40+ languages—built for AI agents and interactive apps.
cartesia.ai