Несмотря на формальное удобство набора и отправки, голосовые сообщения в чатах нередко вызывают раздражение пользователей, и даже породили множество
. Но вскоре поводов для недовольства у владельцев гаджетов станет меньше — социальная сеть «ВКонтакте» объявила о старте тестирования системы распознавания голоса с поддержкой русского языка и переводом речи в текст.При появлении голосового сообщения достаточно будет нажать кнопку, чтобы конвертировать аудиозапись в классический формат — таким образом, получателю не придётся прослушивать аудио в случае, если это неудобно. На стадии раннего тестирования новая функция доступна только в iOS-версии клиента для участников программы VK Testers.
«Ежемесячно 30 миллионов человек обмениваются голосовыми сообщениями ВКонтакте. Для такого высоконагруженного сервиса требовалось решение, способное обрабатывать огромное количество входящей информации без потери качества. Поэтому мы создали его сами. Ещё одним серьёзным вызовом стал разговорный язык. Записывая голосовые сообщения, люди редко выражаются как персонажи классической русской литературы — напротив, они используют много сленга и заимствованной лексики. Готовые решения на наших тестах плохо справлялись с распознаванием таких слов, но мы учли специфику современного русского языка при разработке собственной технологии», — отметил Павел Калайдин, директор по исследованиям в области искусственного интеллекта «ВКонтакте».
В качестве алгоритма распознавания «ВКонтакте» будет использовать собственную разработку, основанную на нейронных сетях. Алгоритм проходит обучение русскоязычному сленгу и легко настраивается. В перспективе он даже позволит находить голосовые сообщения по текстовому запросу. Ранее «ВКонтакте» представила проект, способный генерировать новостные заголовки с помощью нейросети. При помощи ИИ осуществляется и модерация контента, а также определение тематики публикаций.