Нейросеть Microsoft распознает речь лучше человека (и IBM Watson)

МЕНЮ

Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ

Новости ИИ

Искусственный интеллект
Голосовой помощник
Городские сумасшедшие
ИИ в медицине
ИИ проекты
Искусственные нейросети
Слежка за людьми
Угроза ИИ

Разработка ИИ

ИИ теория
Компьютерные науки
Машинное обуч. (Ошибки)
Машинное обучение
Машинный перевод
Реализация ИИ
Реализация нейросетей
Создание беспилотных авто
Трезво про ИИ
Философия ИИ

Внедрение ИИ

Big data
Генетические алгоритмы
Капсульные нейросети
Основы нейронных сетей
Распознавание лиц
Распознавание образов
Распознавание речи
Техническое зрение
Чат-боты

Работа разума и сознание

Изучение сна
Изучение сознания
Психология
Работа головного мозга
Работа памяти
Работа разума

Модель мозга

Модель мозга

Робототехника, БПЛА

Беспилотные автомобили
БПЛА
Робототехника

Трансгуманизм

Трансгуманизм

Обработка текста

Анализ социальных сетей
Компьютерная лингвистика
Лингвистика
Поисковые алгоритмы

Теория эволюции

Головной мозг
Нейронные сети
Поведение животных
Теория эволюции

Дополненная реальность

Виртулаьная реальность
Дополненная реальность

Железо

Интернет вещей
Квантовые компьютеры
Нейронные процессоры
облачные вычисления
Суперкомпьютеры

Киберугрозы

Кибербезопасность

Научный мир

Методы исследования
Наука и образование
Семинары

ИТ индустрия

ИТ-гиганты
Новости ит

Разработка ПО

Разработка ПО
Теория алгоритмов

Теория информации

Кластеризация

Математика

Актуальная математика
Статистика
Теория вероятности
Теория информации
Теория хаоса

Цифровая экономика

Технология блокчейн
Цифровая экономика

Авторизация

RSS

RSS новости

2017-08-22 13:10

ИТ-гиганты

В конце прошлого года Microsoft представила алгоритм распознавания речи, который ошибается не чаще, чем профессиональный стенографист с коэффициентом ошибочных слов 5.9%. Теперь специалистам компании удалось снизить процент ошибок до рекордных 5.1%. При такой точности можно говорить о том, что система достигла уровня человека.

За последний год Microsoft улучшила свой результат на 12%. Компания использует искусственную нейронные сети и акустические модели, постоянно совершенствуя их. В частности, искусственный интеллект научился анализировать контекст и предсказывать, какие слова или фразы могут последовать дальше. Таким образом повышается точность расшифровки аудиозаписи. Эффективность подобных систем проверяют на сборнике из 2400 записей телефонных разговоров на общие темы, этот тест называется Switchboard.

Показатель в 5.1% ошибок сопоставим с результатами работы нескольких специалистов, которым разрешили прослушать аудиозапись несколько раз и общаться друг с другом. Если Microsoft планирует использовать алгоритм в своих сервисах, скоро голосовой помощник Cortana станет лучше понимать пользователей. Технология также может найти применение в офисном пакете компании (например, для перевода презентаций) и Microsoft Cognitive Services.

Есть куда расти

Нейросеть Microsoft вышла на один уровень с человеком, но только в одном тесте. Исследователи признают, что в шумных условиях, при распознавании речи с акцентом и расшифровке диалектов точность системы будет ниже. Еще одной целью ученых является научить компьютеры понимать услышанное, а не просто переводить его в текстовую форму.

Предыдущий рекорд точности распознавания речи принадлежал IBM, которая весной сообщила о снижении процента ошибочных слов до 5.5% (благодаря своей когнитивной системе Watson), но теперь в лидеры вырвалась Microsoft.

Источник: Microsoft



		Нейросеть Microsoft распознает речь лучше человека (и IBM Watson)
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Психология Работа головного мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовые компьютеры Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2017-08-22 13:10 ИТ-гиганты В конце прошлого года Microsoft представила алгоритм распознавания речи, который ошибается не чаще, чем профессиональный стенографист с коэффициентом ошибочных слов 5.9%. Теперь специалистам компании удалось снизить процент ошибок до рекордных 5.1%. При такой точности можно говорить о том, что система достигла уровня человека. За последний год Microsoft улучшила свой результат на 12%. Компания использует искусственную нейронные сети и акустические модели, постоянно совершенствуя их. В частности, искусственный интеллект научился анализировать контекст и предсказывать, какие слова или фразы могут последовать дальше. Таким образом повышается точность расшифровки аудиозаписи. Эффективность подобных систем проверяют на сборнике из 2400 записей телефонных разговоров на общие темы, этот тест называется Switchboard. Показатель в 5.1% ошибок сопоставим с результатами работы нескольких специалистов, которым разрешили прослушать аудиозапись несколько раз и общаться друг с другом. Если Microsoft планирует использовать алгоритм в своих сервисах, скоро голосовой помощник Cortana станет лучше понимать пользователей. Технология также может найти применение в офисном пакете компании (например, для перевода презентаций) и Microsoft Cognitive Services. Есть куда расти Нейросеть Microsoft вышла на один уровень с человеком, но только в одном тесте. Исследователи признают, что в шумных условиях, при распознавании речи с акцентом и расшифровке диалектов точность системы будет ниже. Еще одной целью ученых является научить компьютеры понимать услышанное, а не просто переводить его в текстовую форму. Предыдущий рекорд точности распознавания речи принадлежал IBM, которая весной сообщила о снижении процента ошибочных слов до 5.5% (благодаря своей когнитивной системе Watson), но теперь в лидеры вырвалась Microsoft. Источник: Microsoft Комментарии:

Нейросеть Microsoft распознает речь лучше человека (и IBM Watson)

Комментарии: