IBM сократила время обучения распознаванию речи с недели до 11 часов |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-04-12 10:45 Обычно на обучение модели распознаванию естественного языка уходят тысячи часов аудиозаписей и миллионы слов, не говоря уж о мощных процессорах, которые нужны, чтобы обработать огромный поток информации в разумные сроки. IBM описала новую архитектуру обработки данных, которая работает в 15 раз быстрее. Обучение систем автоматического распознавания речи, таких как Siri, Google Assistant или Alexa, требует применения сложных систем кодировки для преобразования голоса в функции, которые понимают машины, и обратного декодирования в понятный человеку текст. Такие модели получаются довольно большими, что усложняет их тренировку, пишет VentureBeat. Решением инженеров IBM стало увеличение объема партии, или числа образцов, которые можно обработать единовременно, но не без разбора — это бы негативно повлияло на точность. Поэтому они применили метод распределенного глубокого обучения — асинхронный децентрализованный параллельный стохастический градиентный спуск (ADPSGD). Специалисты компании описали новую архитектуру распределенной обработки данных, которая в 15 раз ускоряет процесс обучения без потери точности. Если ее развернуть на системе с несколькими графическими картами, она сократит общее время тренировки с недель до дней. Сокращение времени обучения позволит исследователям увеличить число итераций при разработке новых алгоритмов. Особенно это важно для нестандартных случаев, когда необходимо добиться высоких уровней точности, говорится в статье, которую сотрудники IBM представят на международной конференции ICASSP в следующем месяце. Алгоритм распознавания речи, который без ошибок работает на недорогих смартфонах, разработан в Канаде. Одна из моделей показала 97-процентную точность распознавания речи, превзойдя все известные результаты. Источник: hightech.plus Комментарии: |
|