Социальные сети

ВКонтакте открыла доступ сторонним разработчикам к собственным технологиям распознавания речи

Теперь разработчики смогут бесплатно использовать в своих инди-проектах технологию ВКонтакте, которая считывает голос и переводит его в текст. Об этом рассказал технический директор ВКонтакте Александр Тоболь на открытии конференции Saint HighLoad++.

Технология распознавания речи, или ASR (Automatic Speech Recognition), внедряется в несколько кликов. Нейросети хорошо справляются с аудио с посторонними шумами, большим количеством сленга и сокращений.

Для распознавания можно выбрать одну из двух моделей. Нейтральная подойдет для разборчивой речи, как в телешоу или интервью, а спонтанная поможет, когда нужно обработать более обыденную речь со сленгом и ненормативной лексикой. Нейросети ВКонтакте обрабатывают файлы за несколько секунд, умеют удалять из расшифровки шумы и паузы, а также понимают неразборчивую речь.

Технологию можно попробовать через веб-интерфейс на специальной странице или интегрировать через публичный API ВКонтакте. На портале доступен широкий набор методов, с помощью которых можно создавать мини-приложения ВКонтакте или использовать в сторонних проектах. Решение подойдет для стартапов, инди-проектов, личных pet-проектов для обучения и саморазвития. Версию с обработкой аудио до 100 минут в сутки можно применять для любых целей. А для безлимитного использования технологии можно отправить заявку на электронную почту.

Напомним, ВКонтакте разрабатывает технологию распознавания речи с 2020 года. Именно тогда соцсеть начала использовать ASR для расшифровки голосовых сообщений, генерации субтитров в видео, персональных рекомендаций и многого другого. Под капотом у решения сразу три нейросети: одна отвечает за распознавание речи, вторая находит подходящие слова, а третья расставляет знаки препинания. Технология построена таким образом, чтобы справляться с ежедневной обработкой сотен миллионов сообщений разной длительности, качества и наполнения. Каждое сообщение расшифровывается очень быстро — примерно за 1,5 секунды после отправки.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован.

Кнопка «Наверх»
Закрыть
Закрыть