Распознавание речи: как сделать Speech-to-Text для call-центра своими руками / Иван Бондаренко (МФТИ)

2020-07-09 09:03

алгоритмы распознавания речи, распознавание образов, алгоритмы машинного обучения

7 лет преподавал в университете, некоторое время работал C/C++-разработчиком в аутсорсе, четыре года занимался исследованиями в области машинного обучения в 2ГИС. Сейчас работает в МФТИ в проекте iPavlov, а также в компании Data Monsters как специалист по компьютерной лингвистике и анализу текстов на естественных языках.
Интересы: распознавание образов, машинное обучение, компьютерная лингвистика.

Задумываетесь над автоматизацией call-центра или хотите поговорить с «умным» домом? Время для системы распознавания устной речи. На рынке предложений хоть отбавляй — тут и гиганты IT-индустрии, и фирмы «калибром» поменьше.

А что, если хочется создать собственную систему — бесплатно и кастомно, под конкретную задачу? Расскажу, как это сделать. Начнём с акустических, лингвистических и математических аспектов распознавания речи. Затем перейдём к практике и узнаем, из каких opensource-компонент собрать собственный Speech-to-Text для небольшого call-центра, где взять данные для обучения и как понять, хорошо получилось или так себе.

00:06 всем привет меня зовут
00:08 иван меня уже представили я хочу вам
00:11 сегодня
00:11 о способах и технологиях созда
00:14 система распознавания устной речи для
00:17 русского языка своими руками из open
00:19 source ных компонент бесплатно и без sms
00:22 вот но прежде чем об этом рассказать
00:24 пару слов скажу о себе я работаю в
00:27 московском физтехе по проекту а и павлов
00:30 этот проект посвящен созданию открытой
00:33 системой диалогового искусственного
00:34 интеллекта
00:34 также я работаю в компании да это монстр
00:37 с который занимается внедрением
00:38 результатов по диалогам и с интеллекту
00:40 для практических задач и наконец я еще
00:43 немного преподаю в новосибирском
00:45 госуниверситете
00:46учу будущих разработчиков искусственного
00:49 интеллекта чтобы они смогли подхватить
00:51 за нами из наших ослабевших рук через
00:53 некоторое время вот а еще я люблю театр
00:57 новосибирск театральный город здесь
00:59 много всяких интересных театров и один
01:01 из самых интересных на мой взгляд театр
01:03 старый дом вот вы видите вход в него
01:06 действительно очень выглядит антуражно
01:08 там ставит интересной пьесы в частности
01:11 в конце сентября будет премьера
01:12 спектакля пыль этот спектакль
01:14 документальный посвящен исследованием в
01:17 области искусственно интеллекта и
01:19 машинного обучение в новосибирске
01:20 поскольку спектакль документальный я
01:23 кстати советую вам на него сходить будет
01:25 интересно поскольку стык так
01:26 документальной актеры
01:29 имеют реальных прототипов и ребята
01:32 михаил подклассов режиссер алина
01:35 свирского драматург и другие ребята и в
01:37 помощники они собирают интервью с
01:40 множеством людей которые потом станут
01:42 про образами героев спектакля они
01:46 собирают интервью
01:47 общаются записывают это все на диктофон
01:50 людей много звука запись интервью очень
01:53 много потом их брать и расшифровать
01:56 вручную это просто адская задача
01:58 бывает что и час беседуют и больше людей

Источник: www.highload.ru



		Распознавание речи: как сделать Speech-to-Text для call-центра своими руками / Иван Бондаренко (МФТИ)
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2020-07-09 09:03 алгоритмы распознавания речи, распознавание образов, алгоритмы машинного обучения 7 лет преподавал в университете, некоторое время работал C/C++-разработчиком в аутсорсе, четыре года занимался исследованиями в области машинного обучения в 2ГИС. Сейчас работает в МФТИ в проекте iPavlov, а также в компании Data Monsters как специалист по компьютерной лингвистике и анализу текстов на естественных языках. Интересы: распознавание образов, машинное обучение, компьютерная лингвистика. Задумываетесь над автоматизацией call-центра или хотите поговорить с «умным» домом? Время для системы распознавания устной речи. На рынке предложений хоть отбавляй — тут и гиганты IT-индустрии, и фирмы «калибром» поменьше. А что, если хочется создать собственную систему — бесплатно и кастомно, под конкретную задачу? Расскажу, как это сделать. Начнём с акустических, лингвистических и математических аспектов распознавания речи. Затем перейдём к практике и узнаем, из каких opensource-компонент собрать собственный Speech-to-Text для небольшого call-центра, где взять данные для обучения и как понять, хорошо получилось или так себе. 00:06 всем привет меня зовут 00:08 иван меня уже представили я хочу вам 00:11 сегодня 00:11 о способах и технологиях созда 00:14 система распознавания устной речи для 00:17 русского языка своими руками из open 00:19 source ных компонент бесплатно и без sms 00:22 вот но прежде чем об этом рассказать 00:24 пару слов скажу о себе я работаю в 00:27 московском физтехе по проекту а и павлов 00:30 этот проект посвящен созданию открытой 00:33 системой диалогового искусственного 00:34 интеллекта 00:34 также я работаю в компании да это монстр 00:37 с который занимается внедрением 00:38 результатов по диалогам и с интеллекту 00:40 для практических задач и наконец я еще 00:43 немного преподаю в новосибирском 00:45 госуниверситете 00:46учу будущих разработчиков искусственного 00:49 интеллекта чтобы они смогли подхватить 00:51 за нами из наших ослабевших рук через 00:53 некоторое время вот а еще я люблю театр 00:57 новосибирск театральный город здесь 00:59 много всяких интересных театров и один 01:01 из самых интересных на мой взгляд театр 01:03 старый дом вот вы видите вход в него 01:06 действительно очень выглядит антуражно 01:08 там ставит интересной пьесы в частности 01:11 в конце сентября будет премьера 01:12 спектакля пыль этот спектакль 01:14 документальный посвящен исследованием в 01:17 области искусственно интеллекта и 01:19 машинного обучение в новосибирске 01:20 поскольку спектакль документальный я 01:23 кстати советую вам на него сходить будет 01:25 интересно поскольку стык так 01:26 документальной актеры 01:29 имеют реальных прототипов и ребята 01:32 михаил подклассов режиссер алина 01:35 свирского драматург и другие ребята и в 01:37 помощники они собирают интервью с 01:40 множеством людей которые потом станут 01:42 про образами героев спектакля они 01:46 собирают интервью 01:47 общаются записывают это все на диктофон 01:50 людей много звука запись интервью очень 01:53 много потом их брать и расшифровать 01:56 вручную это просто адская задача 01:58 бывает что и час беседуют и больше людей Источник: www.highload.ru Комментарии:

Распознавание речи: как сделать Speech-to-Text для call-центра своими руками / Иван Бондаренко (МФТИ)

Комментарии: