Ученые ТУСУРа изучают шепот, чтобы научить машины распознавать речь. |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2018-02-11 04:30 Исследователи Томского госуниверситета систем управления и радиоэлектроники (ТУСУР) изучают устную речь человека с помощью уникального математического аппарата, чтобы разработать принципиально новые алгоритмы распознавания речи для создания интерфейсов человек-компьютер, сообщает в четверг инновационный портал Томской области. Уточняется, что существующие системы распознавания устной речи не учитывают вариативность окончаний и других особенностей спонтанной устной речи, неспособны определять "на слух" аббревиатуры "съедающиеся" при беглой речи звуки. Математический аппарат, разработанный в ТУСУРе, позволяет распознавать ударные звуки, даже произнесенные шепотом, с надежностью не менее 70%. "На кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) ТУСУР с помощью созданного здесь уникального математического аппарата проводятся исследования по распознаванию речи человека на уровне параметров речевого сигнала (шепота). Их результатом может стать создание новых алгоритмов… для корректного и более точного распознавания речи", – говорится в сообщении. Своей задачей ученые кафедры называют определение более точных параметров звуков по сравнению с уже существующими системами распознавания речи, в том числе с помощью изучения шепота. "Есть классический термин – форманта – максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений", – цитирует портал сотрудника КИБЭВС Антона Конева. Точное распознавание речи, которое станет доступно в результате исследований, будет полезно для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов, подчеркивается в сообщении. Источник: РИА Томск Комментарии: |
|