Функция потери глубокого обучения, основанная на сжатии слуховой мощности для улучшения речи

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Технология глубокого обучения широко применяется для улучшения речи. Проверяя эффективность различных сетевых структур, исследователи также изучают вопрос улучшения функции потерь, используемой при обучении сети. Хотя существующие методы учитывают слуховые характеристики речи или разумное выражение отношения сигнал/шум, корреляция со слуховым оценочным баллом и применимость расчета для оптимизации градиента все еще нуждаются в улучшении.

В данной работе предлагается функция потерь отношения сигнал/шум, основанная на компрессии слуховой мощности. Экспериментальные результаты показывают, что общая корреляция между предложенной функцией и показателями объективной разборчивости речи лучше, чем у других функций потерь. Для одной и той же модели улучшения речи эффект обучения данного метода также лучше, чем у других методов сравнения.

Статья: https://arxiv.org/pdf/2108.11877v1.pdf

Github: https://github.com/wangtianrui/APC-SNR


Источник: github.com

Комментарии: