Распознавание речи: как сделать Speech-to-Text для call-центра своими руками / Иван Бондаренко (МФТИ)

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


7 лет преподавал в университете, некоторое время работал C/C++-разработчиком в аутсорсе, четыре года занимался исследованиями в области машинного обучения в 2ГИС. Сейчас работает в МФТИ в проекте iPavlov, а также в компании Data Monsters как специалист по компьютерной лингвистике и анализу текстов на естественных языках.
Интересы: распознавание образов, машинное обучение, компьютерная лингвистика.

Задумываетесь над автоматизацией call-центра или хотите поговорить с «умным» домом? Время для системы распознавания устной речи. На рынке предложений хоть отбавляй — тут и гиганты IT-индустрии, и фирмы «калибром» поменьше.

А что, если хочется создать собственную систему — бесплатно и кастомно, под конкретную задачу? Расскажу, как это сделать. Начнём с акустических, лингвистических и математических аспектов распознавания речи. Затем перейдём к практике и узнаем, из каких opensource-компонент собрать собственный Speech-to-Text для небольшого call-центра, где взять данные для обучения и как понять, хорошо получилось или так себе.
 

00:06 всем привет меня зовут
00:08 иван меня уже представили я хочу вам
00:11 сегодня
00:11 о способах и технологиях созда
00:14 система распознавания устной речи для
00:17 русского языка своими руками из open
00:19 source ных компонент бесплатно и без sms
00:22 вот но прежде чем об этом рассказать
00:24 пару слов скажу о себе я работаю в
00:27 московском физтехе по проекту а и павлов
00:30 этот проект посвящен созданию открытой
00:33 системой диалогового искусственного
00:34 интеллекта
00:34 также я работаю в компании да это монстр
00:37 с который занимается внедрением
00:38 результатов по диалогам и с интеллекту
00:40 для практических задач и наконец я еще
00:43 немного преподаю в новосибирском
00:45 госуниверситете
00:46учу будущих разработчиков искусственного
00:49 интеллекта чтобы они смогли подхватить
00:51 за нами из наших ослабевших рук через
00:53 некоторое время вот а еще я люблю театр
00:57 новосибирск театральный город здесь
00:59 много всяких интересных театров и один
01:01 из самых интересных на мой взгляд театр
01:03 старый дом вот вы видите вход в него
01:06 действительно очень выглядит антуражно
01:08 там ставит интересной пьесы в частности
01:11 в конце сентября будет премьера
01:12 спектакля пыль этот спектакль
01:14 документальный посвящен исследованием в
01:17 области искусственно интеллекта и
01:19 машинного обучение в новосибирске
01:20 поскольку спектакль документальный я
01:23 кстати советую вам на него сходить будет
01:25 интересно поскольку стык так
01:26 документальной актеры
01:29 имеют реальных прототипов и ребята
01:32 михаил подклассов режиссер алина
01:35 свирского драматург и другие ребята и в
01:37 помощники они собирают интервью с
01:40 множеством людей которые потом станут
01:42 про образами героев спектакля они
01:46 собирают интервью
01:47 общаются записывают это все на диктофон
01:50 людей много звука запись интервью очень
01:53 много потом их брать и расшифровать
01:56 вручную это просто адская задача
01:58 бывает что и час беседуют и больше людей


Источник: www.highload.ru

Комментарии: