Вконтакте: распознавание речи и преобразование ее в текст

29lvl

29lvl

Администратор
FB-killa team
Регистрация
20 Июл 2022
Сообщения
110
Реакции
31
Технический директор Вконтакте Александр Тоболь, сообщил, что разработчикам доступна функция ASR (Automatic Speech Recognition) - это технология распознавания речи. Она считывает голос, а затем преобразует его в текст.

У такой функции доступны два варианта:​
  • нейтральная (подходит для весьма разборчивой речи - интервью, например)​
  • спонтанная (обычные голосовые, где есть сленг и ненормативная лексика)​

Нейросети Вконтакте отлично справляются со своей задачей: удаляют при расшифровке посторонние звуки и шумы, ненужные паузы. Отлично разберут невнятную речь и даже (!) сообразят где был использован отдельно твёрдый знак.

В сутки доступны до 100 минут, а вот чтобы претендовать на безлимит, нужно отправить заявку на электронную почту.

Функция преобразования голоса в текст уже широко используется в самом приложении Вконтакте. Теперь же целью разработчиков является использование такой функции в стартапах, в небольших инди-проектах или же в личных проектах.​
 
Назад
Верх