В последние годы использование аудиофайлов становится все более распространенным: это могут быть записи интервью, лекции, конференции, голосовые сообщения и многое другое. Однако, часто возникает необходимость иметь текстовую транскрипцию этих файлов, что может занять много времени и сил. С появлением искусственного интеллекта, данную задачу можно решить гораздо быстрее и эффективнее. Одним из таких сервисов является WriteoutAI, о его использовании речь и пойдет в данном материале.

Приступим к реализации:
Открываем официальную страницу сервиса и нажимаем на кнопку, находящуюся посередине:


Далее необходимо авторизоваться, используя существующий аккаунт GitHub. Если такого у Вас нет, то создаем его, для этого нажимаем на надпись "Create an account":


Первым делом выбираем файл, который необходимо обработать, формат должен быть .mp3, .mp4, .mpeg, .mpga, .m4v, .wav и .webm. При этом размер вашего файла не должен превышать двадцать пять мегабайт:

Получаем текстовую транскрипцию любого аудиофайла

Ниже доступно окно, в которое можно написать "промты" (подсказки для нейросети), которые помогут лучше понять текст. Их указание необязательно, но поможет получить более точные результаты:


После того, как Вы добавили файл и возможно написали подсказки — нажимаем на "Transcribe":


Ожидаем некоторое время, которое зависит от сложности вашего аудио и его длины соответственно:


Когда процесс завершится, Вы можете перевести полученную транскрипцию на один из предложенных языков, либо оставить её на изначальном. Также можно сразу же загрузить транскрипцию на свое устройство:


Опускаемся ниже и тут нам доступна онлайн—версия расшифровки с таймингами, где нажав на определенную фразу — Вы сможете её прослушать и проверить правильность, если у Вас появились сомнения:


Для того, чтобы получить новую транскрипцию необходимо подняться выше и нажать на соответствующую кнопку:


На этом все, надеюсь статья оказалась для Вас полезной!