Математическую модель распознавания речи, превосходящую аналоги по отдельным параметрам в несколько раз, создали ученые ТУСУРа

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Математическую модель распознавания речи, превосходящую аналоги по отдельным параметрам в несколько раз, создали ученые ТУСУРа. Разработка может стать основой комплексной системы цифровой идентификации личности, а также позволит легче управлять "умной" техникой с помощью голоса.

Определение личности по голосу с помощью распознавания речи – активно развивающийся подход к цифровой безопасности, применяемый при управлении техникой и в системах безопасности банковских сервисов дистанционного обслуживания.

Ученые Томского государственного университета систем управления и радиоэлектроники (ТУСУР) разработали новую математическую модель распознавания речи, превосходящую аналоги по точности и позволяющую корректно идентифицировать говорящего.

Погрешность при распознавании основного тона речи у новой системы в четыре раза меньше, чем у лучших мировых аналогов. Это позволяет разработке намного лучше справляться с распознаванием обычной спонтанной речи или даже пения.

Эта возможность поможет, например, общаться с "умными" системами не с помощью формальных команд, а почти так же, как с обычным живым собеседником.

Разработка особенно эффективна при распознавании различных аббревиатур, редко встречающихся слов и фраз. Отдельное направление – выделение ключевых слов из речи, распознавание которых может стать заменой формальных команд при управлении "умной" техникой.

Одним из результатов работы должна стать система продленной аутентификации, которая позволит в течение всего сеанса связи удостоверять личность собеседника. Это позволит полностью исключить некоторые типы мошенничества.

Кроме инструментов повышения цифровой безопасности, связанных с речью, специалисты ТУСУРа также создают нейросетевые инструменты, ориентированные на работу с текстом. Такой подход позволит проверять авторство различных текстовых материалов, от сообщений в социальных сетях до исходного кода программного обеспечения.

В дальнейшем научный коллектив намерен разработать комплексное программное решение, которое позволит контролировать присутствие конкретного абонента в чате, веб-конференции или переписке в электронной почте, а также отличать бота от реального человека.

Работа по данному направлению ведется в рамках государственной программы Минобрнауки "Приоритет-2030".


Источник: vk.com

Комментарии: