Бесплатный датасет с транскрибацией речи

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Создание алгоритма для задач NLP требует сотни часов размеченной живой речи. А конкретно для этой задачи нужна подробная транскрибация. Проще говоря, перевод голоса - в текст.

В сети можно найти много бесплатных датасетов на разных языках для решения этой задачи. Однако, в основном используется чистая и "здоровая" речь. Вместе с тем на свете есть множество людей с дефектами речи. Нейронка, которую не обучали на соответствующих примерах, может не справиться с распознанием слов.

Мы в LabelMe решили коснуться этой темы и подготовили небольшой датасет по услуге транскрибации на основе выступлений и интервью стэндап-комика Сергеича (Сергея Кутергина). Он родился с диагнозом ДЦП, что в том числе отразилось и на функциях речевого аппарата. В общей сложности мы перевели 60 минут записей живой речи и извлекли порядка 6909 слов.

Скачать его вы можете абсолютно бесплатно в каталоге датасетов на нашем сайте. Ссылка ниже.

Датасет с транскрибацией речи Сергеича: https://labelme.ru/datasets-catalog/627962557991


Источник: labelme.ru

Комментарии: