НАВИГАЦИЯ

Изменяем голос в реальном времени при помощи AI

25.07.2023 15:04

7 737

В мире современных технологий искусственного интеллекта реальное изменение голоса становится все более доступным. Программное обеспечение, речь о котором пойдет в данной статье, предлагает возможность производить голосовую конверсию в режиме реального времени с помощью различных искусственных интеллектуальных алгоритмов. Помимо этого, предлагается распределить нагрузку путем запуска AI на отдельном компьютере в качестве сервера, что позволит минимизировать влияние на другие ресурсоемкие процессы. Приложение совместимо с различными операционными системами, включая Windows, Mac, Linux и Google Colaboratory.

Приступим к реализации:
Открываем страницу приложения на Github, используя прямую ссылку:

Опускаемся немного ниже, где находим различные версии. Выбираем последнюю стабильную, то есть без различных букв. В зависимости от вашей видеокарты необходимо загружать различные файлы:

После того, как Вы нашли нужный вариант, то нажимаем на "google" или "hugging face" для скачивания:

Изменяем голос в реальном времени при помощи AI

В случае с Google может быть ограничение на загрузку, тогда переходим на Hugging Face:

Находим нужный архив и загружаем его, после чего распаковываем:

Запускаем файл с названием "start_http.bat" и ожидаем окончания загрузки всех необходимых файлов, после чего у вас откроется пользовательский интерфейс:

Первым делом выбираем при помощи чего будет происходить рендер. Желательно иметь хорошую видеокарту, чтобы не было задержек:

Указываем устройство ввода и вывода. Выбираем любой из понравившихся голосов и можно провести запись для проверки:

Если вас все устроило и Вы хотите выводить звук из AI в любое приложение, то необходимо загрузить и установить VB-CABLE:

После чего изменяем устройство ввода в нужном приложении на "CABLE Output":

В MMVCServerSIO изменяем "input" на свой вариант и "output" на "CABLE Input":

На этом все, приложение можно полноценно использовать!

Понравилась статья?

Интересно!

Нет

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

КОММЕНТАРИИ 0

ПОПУЛЯРНЫЕ НОВОСТИ

НОВЫЕ КОММЕНТАРИИ

Doctor Who

9 июня 2025

А что там в плане безопасности? Chat GPT говорит, что риски высокие: провайдер может логировать все DNS-запросы, перехватывать TLS-трафик, модифицировать ответы.

Как пользоваться ChatGPT в Росси ...