
FB-killa team
29lvl
Администратор
- Регистрация
- 20 Июл 2022
- Сообщения
- 110
- Реакции
- 31
Технический директор Вконтакте Александр Тоболь, сообщил, что разработчикам доступна функция ASR (Automatic Speech Recognition) - это технология распознавания речи. Она считывает голос, а затем преобразует его в текст.
У такой функции доступны два варианта:
У такой функции доступны два варианта:
- нейтральная (подходит для весьма разборчивой речи - интервью, например)
- спонтанная (обычные голосовые, где есть сленг и ненормативная лексика)
Нейросети Вконтакте отлично справляются со своей задачей: удаляют при расшифровке посторонние звуки и шумы, ненужные паузы. Отлично разберут невнятную речь и даже (!) сообразят где был использован отдельно твёрдый знак.
В сутки доступны до 100 минут, а вот чтобы претендовать на безлимит, нужно отправить заявку на электронную почту.
Функция преобразования голоса в текст уже широко используется в самом приложении Вконтакте. Теперь же целью разработчиков является использование такой функции в стартапах, в небольших инди-проектах или же в личных проектах.