Нейросеть Microsoft распознает речь лучше человека (и IBM Watson) |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2017-08-22 13:10 В конце прошлого года Microsoft представила алгоритм распознавания речи, который ошибается не чаще, чем профессиональный стенографист с коэффициентом ошибочных слов 5.9%. Теперь специалистам компании удалось снизить процент ошибок до рекордных 5.1%. При такой точности можно говорить о том, что система достигла уровня человека. За последний год Microsoft улучшила свой результат на 12%. Компания использует искусственную нейронные сети и акустические модели, постоянно совершенствуя их. В частности, искусственный интеллект научился анализировать контекст и предсказывать, какие слова или фразы могут последовать дальше. Таким образом повышается точность расшифровки аудиозаписи. Эффективность подобных систем проверяют на сборнике из 2400 записей телефонных разговоров на общие темы, этот тест называется Switchboard. Показатель в 5.1% ошибок сопоставим с результатами работы нескольких специалистов, которым разрешили прослушать аудиозапись несколько раз и общаться друг с другом. Если Microsoft планирует использовать алгоритм в своих сервисах, скоро голосовой помощник Cortana станет лучше понимать пользователей. Технология также может найти применение в офисном пакете компании (например, для перевода презентаций) и Microsoft Cognitive Services. Есть куда расти Нейросеть Microsoft вышла на один уровень с человеком, но только в одном тесте. Исследователи признают, что в шумных условиях, при распознавании речи с акцентом и расшифровке диалектов точность системы будет ниже. Еще одной целью ученых является научить компьютеры понимать услышанное, а не просто переводить его в текстовую форму. Предыдущий рекорд точности распознавания речи принадлежал IBM, которая весной сообщила о снижении процента ошибочных слов до 5.5% (благодаря своей когнитивной системе Watson), но теперь в лидеры вырвалась Microsoft. Источник: Microsoft Комментарии: |
|