В мире современных технологий искусственного интеллекта реальное изменение голоса становится все более доступным. Программное обеспечение, речь о котором пойдет в данной статье, предлагает возможность производить голосовую конверсию в режиме реального времени с помощью различных искусственных интеллектуальных алгоритмов. Помимо этого, предлагается распределить нагрузку путем запуска AI на отдельном компьютере в качестве сервера, что позволит минимизировать влияние на другие ресурсоемкие процессы. Приложение совместимо с различными операционными системами, включая Windows, Mac, Linux и Google Colaboratory.

Приступим к реализации:
Открываем страницу приложения на Github, используя прямую ссылку:


Опускаемся немного ниже, где находим различные версии. Выбираем последнюю стабильную, то есть без различных букв. В зависимости от вашей видеокарты необходимо загружать различные файлы:


После того, как Вы нашли нужный вариант, то нажимаем на "google" или "hugging face" для скачивания:

Изменяем голос в реальном времени при помощи AI

В случае с Google может быть ограничение на загрузку, тогда переходим на Hugging Face:


Находим нужный архив и загружаем его, после чего распаковываем:


Запускаем файл с названием "start_http.bat" и ожидаем окончания загрузки всех необходимых файлов, после чего у вас откроется пользовательский интерфейс:


Первым делом выбираем при помощи чего будет происходить рендер. Желательно иметь хорошую видеокарту, чтобы не было задержек:


Указываем устройство ввода и вывода. Выбираем любой из понравившихся голосов и можно провести запись для проверки:


Если вас все устроило и Вы хотите выводить звук из AI в любое приложение, то необходимо загрузить и установить VB-CABLE:


После чего изменяем устройство ввода в нужном приложении на "CABLE Output":


В MMVCServerSIO изменяем "input" на свой вариант и "output" на "CABLE Input":


На этом все, приложение можно полноценно использовать!