Бесплатный датасет с транскрибацией речи |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-11-16 16:00 Создание алгоритма для задач NLP требует сотни часов размеченной живой речи. А конкретно для этой задачи нужна подробная транскрибация. Проще говоря, перевод голоса - в текст. В сети можно найти много бесплатных датасетов на разных языках для решения этой задачи. Однако, в основном используется чистая и "здоровая" речь. Вместе с тем на свете есть множество людей с дефектами речи. Нейронка, которую не обучали на соответствующих примерах, может не справиться с распознанием слов. Мы в LabelMe решили коснуться этой темы и подготовили небольшой датасет по услуге транскрибации на основе выступлений и интервью стэндап-комика Сергеича (Сергея Кутергина). Он родился с диагнозом ДЦП, что в том числе отразилось и на функциях речевого аппарата. В общей сложности мы перевели 60 минут записей живой речи и извлекли порядка 6909 слов. Скачать его вы можете абсолютно бесплатно в каталоге датасетов на нашем сайте. Ссылка ниже. Датасет с транскрибацией речи Сергеича: https://labelme.ru/datasets-catalog/627962557991 Источник: labelme.ru Комментарии: |
|