IBM сократила время обучения распознаванию речи с недели до 11 часов |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2019-04-12 10:45 Обычно на обучение модели распознаванию естественного языка уходят тысячи часов аудиозаписей и миллионы слов, не говоря уж о мощных процессорах, которые нужны, чтобы обработать огромный поток информации в разумные сроки. IBM описала новую архитектуру обработки данных, которая работает в 15 раз быстрее. Обучение систем автоматического распознавания речи, таких как Siri, Google Assistant или Alexa, требует применения сложных систем кодировки для преобразования голоса в функции, которые понимают машины, и обратного декодирования в понятный человеку текст. Такие модели получаются довольно большими, что усложняет их тренировку, пишет VentureBeat. Решением инженеров IBM стало увеличение объема партии, или числа образцов, которые можно обработать единовременно, но не без разбора — это бы негативно повлияло на точность. Поэтому они применили метод распределенного глубокого обучения — асинхронный децентрализованный параллельный стохастический градиентный спуск (ADPSGD). Специалисты компании описали новую архитектуру распределенной обработки данных, которая в 15 раз ускоряет процесс обучения без потери точности. Если ее развернуть на системе с несколькими графическими картами, она сократит общее время тренировки с недель до дней. Сокращение времени обучения позволит исследователям увеличить число итераций при разработке новых алгоритмов. Особенно это важно для нестандартных случаев, когда необходимо добиться высоких уровней точности, говорится в статье, которую сотрудники IBM представят на международной конференции ICASSP в следующем месяце. Алгоритм распознавания речи, который без ошибок работает на недорогих смартфонах, разработан в Канаде. Одна из моделей показала 97-процентную точность распознавания речи, превзойдя все известные результаты. Телеграм: t.me/ainewsline Источник: hightech.plus Комментарии: |
|