Функция потери глубокого обучения, основанная на сжатии слуховой мощности для улучшения речи |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-08-29 15:53 Технология глубокого обучения широко применяется для улучшения речи. Проверяя эффективность различных сетевых структур, исследователи также изучают вопрос улучшения функции потерь, используемой при обучении сети. Хотя существующие методы учитывают слуховые характеристики речи или разумное выражение отношения сигнал/шум, корреляция со слуховым оценочным баллом и применимость расчета для оптимизации градиента все еще нуждаются в улучшении. В данной работе предлагается функция потерь отношения сигнал/шум, основанная на компрессии слуховой мощности. Экспериментальные результаты показывают, что общая корреляция между предложенной функцией и показателями объективной разборчивости речи лучше, чем у других функций потерь. Для одной и той же модели улучшения речи эффект обучения данного метода также лучше, чем у других методов сравнения. Статья: https://arxiv.org/pdf/2108.11877v1.pdf Github: https://github.com/wangtianrui/APC-SNR Источник: github.com Комментарии: |
|