Учёные научили нейросеть петь с интонацией

Теперь исполняет треки Бруно Марса и испанских поп-групп.

Фото с презентации WaveNet

Сотрудники университета Помпеу Фабра в Испании Хорди Бонада (Jordi Bonada) и Мерлижин Блаау (Merlijn Blaauw) опубликовали работу, посвящённую их собственному алгоритму на основе нейросетей. По словам учёных, их разработка может не только успешно синтизировать человеческий голос, но и «научить» его петь.

Нейронный параметрический синтезатор пения (A Neural Parametric Singing Synthesizer) является модифицированной версией синтеза речи от компании Google DeepMind под названием WaveNet, представленного осенью 2016 года. С помощью нейросетей программа сама обучается с использованием базы из реальных человеческих голосов. Из-за этого алгоритм генерирует более естественный голос, чем конкуренты.

Специалисты из испанского университета смогли настроить разработку Google DeepMind так, что синтезатор смог различать высоту голоса и его тембр. Благодаря этому нейросеть смогла не просто синтезировать человеческую речь, используя в качестве голоса материал из случайных предзаписанных отрывков, но и пропеть некоторые известные хиты с характерной интонацией — обычные синтезаторы речи так не умеют.

Для тестирования система авторы работы использовали три голоса: женский и мужской на английском языке, а также женский испанский. В общей сложности было записано несколько сотен коротких отрывков с пение приблизительно на 50 минут, включая паузы. Создатели проекта признали, что эта база данных совсем небольшая, но отметили, что записывать профессиональных певцов очень дорого.

Некоторые результаты синтеза пения авторы работы показали в своём исследовании. Например, учёные сгенерировали машинную версию песни Бруно Марса «Locked Out of Heaven».

Также они протестировали алгоритм на других языках, включая испанский. По словам разработчиков, нейросеть может подстраиваться не только под характеристики голоса, но и под лингвистические особенности речи.

Incredible! A Neural Parametric Singing Synthesizer #ML https://t.co/7X5Cq3SZb7 Female Spanish voice is outstanding… https://t.co/sFlaz8m2VE
— Alex J. Champandard (@alexjc)



		Учёные научили нейросеть петь с интонацией
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Психология Работа головного мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовые компьютеры Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2017-04-14 20:30 нейросети новости Теперь исполняет треки Бруно Марса и испанских поп-групп. Фото с презентации WaveNet Сотрудники университета Помпеу Фабра в Испании Хорди Бонада (Jordi Bonada) и Мерлижин Блаау (Merlijn Blaauw) опубликовали работу, посвящённую их собственному алгоритму на основе нейросетей. По словам учёных, их разработка может не только успешно синтизировать человеческий голос, но и «научить» его петь. Нейронный параметрический синтезатор пения (A Neural Parametric Singing Synthesizer) является модифицированной версией синтеза речи от компании Google DeepMind под названием WaveNet, представленного осенью 2016 года. С помощью нейросетей программа сама обучается с использованием базы из реальных человеческих голосов. Из-за этого алгоритм генерирует более естественный голос, чем конкуренты. Специалисты из испанского университета смогли настроить разработку Google DeepMind так, что синтезатор смог различать высоту голоса и его тембр. Благодаря этому нейросеть смогла не просто синтезировать человеческую речь, используя в качестве голоса материал из случайных предзаписанных отрывков, но и пропеть некоторые известные хиты с характерной интонацией — обычные синтезаторы речи так не умеют. Для тестирования система авторы работы использовали три голоса: женский и мужской на английском языке, а также женский испанский. В общей сложности было записано несколько сотен коротких отрывков с пение приблизительно на 50 минут, включая паузы. Создатели проекта признали, что эта база данных совсем небольшая, но отметили, что записывать профессиональных певцов очень дорого. Некоторые результаты синтеза пения авторы работы показали в своём исследовании. Например, учёные сгенерировали машинную версию песни Бруно Марса «Locked Out of Heaven». Также они протестировали алгоритм на других языках, включая испанский. По словам разработчиков, нейросеть может подстраиваться не только под характеристики голоса, но и под лингвистические особенности речи. Incredible! A Neural Parametric Singing Synthesizer #ML https://t.co/7X5Cq3SZb7 Female Spanish voice is outstanding… https://t.co/sFlaz8m2VE — Alex J. Champandard (@alexjc) Источник: tjournal.ru Комментарии:

Учёные научили нейросеть петь с интонацией

Комментарии: