Алгоритмы распознавания речи

МЕНЮ


Искусственный интеллект. Новости
Поиск

ТЕМЫ


Новости ИИРабота разумаВнедрение ИИРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

RSS


RSS новости

Авторизация



Новостная лента форума ailab.ru

Последние новости

 

Главные новости

2017-11-08 14:09

Задача распознавания речи пока не решена


алгоритмы распознавания речи, распознавание образов

С тех пор, как на сцену распознавания речи вышло глубинное обучение, количество ошибок в распознавании слов кардинально уменьшилось. Но, несмотря на все те статьи, которые вы могли читать, у нас до сих пор нет распознавания речи человеческого уровня. У распознавателей речи много видов отказов. Для дальнейшего улучшения их нужно выделить и постараться устранить. Это единственный способ перейти от распознавания, подходящего для некоторых людей большую часть времени, к распознаванию, работающему

2017-11-03 13:14

Как оптимизировать сайт под голосовой поиск


алгоритмы распознавания речи, распознавание образов

В настоящее время мобильные устройства и алгоритмы распознавания речи очень быстро прогрессируют. Таким образом, всё больше людей начинают пользоваться именно голосовым поиском для нахождения нужной информации.

Одной из особенностей такого поиска является то, что информация пользователю нужна здесь и сейчас. Поэтому предпочтение отдается именно голосовому набору, а не клавиатурному. Примеры таких запросов это «Лучший кинотеатр в Москве», «Как доехать до парка Горького», «Кто такой

2017-10-17 21:11

Создать толкового голосового помощника очень непросто, а научить его понимать живую человеческую речь и того сложнее


голосовые помощники, алгоритмы распознавания речи, распознавание образов

Создать толкового голосового помощника очень непросто, а научить его понимать живую человеческую речь и того сложнее. В статье рассказывается, с какими проблемами сталкиваются разработчики Алисы, Сири и других виртуальных ассистентов. Перевод с немецкого языка.

Распознавание речи — задача не из легких

За последние несколько лет цифровая обработка голоса сделала большой шаг вперед — но трудностей не становится меньше. Перед вами несколько причин, почему сложилась такая ситуация, и как

2017-09-11 13:00

Федор Беломоев из Санкт-Петербурга изобрел устройство, которое заменяет слепоглухим людям слух и голос


алгоритмы распознавания речи, распознавание образов

Федор Беломоев из Санкт-Петербурга изобрел устройство, которое заменяет слепоглухим людям слух и голос.

«До последнего времени меня не окружали люди, которые были бы инвалидами по зрению или слуху, но идея не пришла мне в голову случайно. Как-то в одной из популярных газет я читал статью о жизни слепоглухих людей, о трудностях, с которыми им приходится сталкиваться, о низкой средней продолжительности жизни, хотя бы просто потом, что в их мозг не поступает никаких сигналов, понимаете? В

2017-07-21 12:45

Mozilla развивает свою систему распознавания речи


распознавание образов, алгоритмы распознавания речи, новости ит

В рамках проекта по развитию собственной открытой системы распознавания речи компания Mozilla ввела в строй сервис Common Voice, нацеленный на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или поучаствовать в оценке качества данных, добавленных другими пользователями.

Целью инициативы является накопление 10 тысяч часов c записями различного произношения

2017-07-07 11:11

Как это работает? | распознавание речи


алгоритмы распознавания речи, распознавание образов

Первое устройство для распознавания речи появилось в 1952 году, оно могло понимать произнесённые человеком цифры. 40 лет спустя были представлены первые коммерческие программы, распознающие речь человека. Они были предназначены для людей, которые в силу физиологических особенностей не могли набирать текст вручную. Сейчас же функция распознавания речи есть практически в любом смартфоне, она позволяет нам взаимодействовать голосом с приложениями, облегчая и упрощая нашу жизнь. Как же работает

2016-12-28 14:02

Полиция хочет допросить Алексу из колонки Amazon Echo по делу об убийстве


интернет вещей, алгоритмы распознавания речи, распознавание образов, кибербезопасность, искусственный интеллект

Умный динамик Amazon Echo — 24-сантиметровая цилиндрическая колонка с микрофонной решёткой. Прибор устанавливается в квартире, управляется голосом и реагирует на женское имя Алекса (сайт вашей Алексы открывается по личному паролю). Очень полезная вещь: активированная голосовой командой Алекса записывает речь пользователя, распознаёт её (в облаке), хранит записи разговоров (их можно удалить через приложение), выполняет команды — читает книги, играет музыку, устанавливает будильник. Или просто

2016-12-25 13:04

Как мы слышим друг друга сквозь шум


Головной мозг, алгоритмы распознавания речи, распознавание образов

Чтобы услышать правильное слово среди окружающего шума, наш мозг использует хитроумный нейронный механизм.

Мы редко задумываемся об этом, но на самом деле у нашего слуха есть одна удивительная способность – умение расслышать то, что нужно, даже если вокруг очень шумно.

Чтобы услышать правильное слово среди окружающего шума, наш мозг использует хитроумный нейронный механизм. (Фото monkeybusiness / ru.depositphotos.com.)Чтобы услышать правильное слово среди окружающего шума, наш мозг

2016-11-07 21:31

Нейросеть LipNet читает по губам с точностью 93,4%


искусственные нейронные сети, алгоритмы распознавания речи, распознавание образов

Командир Дэйв Боумен и второй пилот Фрэнк Пул, не доверяя компьютеру, решили отключить его от управления кораблём. Для этого они совещаются в звукоизолированной комнате, но HAL 9000 читает их разговор по губам. Кадр из фильма «Космическая одиссея 2001 года»

Чтение по губам играет важную роль в общении. Ещё эксперименты 1976 года показали, что люди «слышат» совершенно другие фонемы, если наложить неправильный звук на движение губ (см. "Hearing lips and seeing voices", Nature 264, 746-748, 23

2016-11-01 00:01

«Исторический прорыв Microsoft» был совершен с помощью российских разработчиков


методы распознавания образов, алгоритмы распознавания речи

Российский рекорд на английском языке

Как стало известно CNews, группа исследователей Microsoft в области искусственного интеллекта по автоматическому распознаванию телефонных разговоров удалось добиться рекордного результата с помощью методики, разработанной резидентом «Сколково», компанией «ЦРТ-инновации», входящей в группу ЦРТ, «Центр речевых технологий». 

На днях компания Microsoft объявила, что ее система распознавания речи по уровню точности

2016-06-14 17:01

Обзор российских голосовых помощников: «Дуся», «Ассистент на русском», Speaktoit и «Собеседник HD»


ИИ проекты, искусственный интеллект, распознавание образов, большие данные, алгоритмы распознавания речи

Обозреватель vc.ru изучила рынок интеллектуальных ассистентов, описала несколько российских сервисов и опросила экспертов о перспективах речевых технологий.

Мировой рынок интеллектуальных ассистентов с 2012 года по 2014 год вырос с $352 млн до $572,2 млн. К 2020 году ожидается рост рынка до $3,07 млрд, что составит 31% по сравнению с ростом в 2013 году.

Пока одни компании концентрируются на создании виртуальных помощников на веб-страницах, другие уделяют внимание мобильным. На мировом

2016-01-26 15:20

Новый алгоритм помогает машинам учиться так же быстро, как людям


искусственный интеллект, распознавание образов, алгоритмы распознавания речи

Прорывом искусственного интеллекта из университетов Нью-Йорка, Торонто и Массачусетского технологического института является демонстрация впечатляющей способности искусственного интеллекта узнавать визуальные концепции с одного снимка и манипулировать ими способами, подобными человеку.

Продвижение может привести к более умным телефонам, значительно улучшенному распознаванию речи и компьютерам, которые лучше понимают мир вокруг них.

Эффект Чубакки

Человеческие существа проявляют
 

2018-01-18 14:14

Прошлое, настоящее и будущее технологий распознавания речи


алгоритмы распознавания речи, распознавание образов, голосовые помощники

Голос — это будущее. Мировые технологические гиганты требуют жизненно важной доли рынка, а ComScore прогнозирует, что «до 50% всех поисковых запросов будут выполняться голосом уже к 2020 году».

Однако исторические антецеденты, которые привели нас к этому моменту, столь же важны, как и удивительны. В этом отчете мы отправляемся в путешествие по истории технологии распознавания речи, прежде чем предоставлять всеобъемлющий обзор текущего ландшафта, и даём советы, которые должны учитывать все

2018-01-09 23:25

Безлимитное распознавание речи. Или как я перевожу в боте голосовые сообщения в текст


чатботы новости, алгоритмы распознавания речи, распознавание образов, Реализация ИИ

Привет, хабр. Обычно я пишу программы для неговорящих людей, но решил ударится в крайности и сделать продукт для говорящих людей. Я хочу рассказать о разработке бота для VK, который переводит пересланные ему голосовые сообщения в текст. Сначала я использовал Yandex SpeechKit, но потом уперся в дневной лимит распознаваемых единиц и перешел на wit.ai, об этом и хочу рассказать, а также о фреймворке для создания ботов vk с помощью node.js, болтовне гугловского dialogflow.

0. ТЗ

Сделать

2017-12-07 09:00

Музыкальное образование помогло разобрать речь на фоне шума


алгоритмы распознавания речи, распознавание образов

giphy.com

Группа канадских ученых проследила за активностью головного мозга музыкантов во время выполнения задания на различение речи на фоне стороннего шума. Исследователи, работа которых опубликована в журнале Proceedings of the National Academy of Sciences, обнаружили в мозге музыкантов повышенную активность участков, отвечающих за обработку речи.

Нарушение способности различать определенные звуки (например, речь) при повышенном уровне шума наблюдается у людей в пожилом

2017-11-05 20:10

Доступно о машинном обучении: распознавание речи


алгоритмы распознавания речи, распознавание образов, машинное обучение Python

Компания Google задалась вопросом объяснения принципов машинного обучения на примерах повседневных проблем и способах их решения. Первая из серии статей была посвящена классификации входящих электронных писем. Во второй публикации просто и наглядно рассказывается об одной из основополагающих концепций системы распознавания голоса — распознавание отдельных фонем.

Электронная почта — это лишь один из способов взаимодействия клиентов

2017-08-22 16:01

Будущее веб-технологий: создаём интеллектуального чат-бота, который может слышать и говорить


алгоритмы распознавания речи, распознавание образов, компьютерная лингвистика, голосовые помощники, искусственный интеллект, чат-боты

Голосовые интерфейсы в наши дни вездесущи. Во-первых — всё больше пользователей мобильных телефонов используют голосовых помощников, таких как Siri и Cortana. Во-вторых — устройства, вроде Amazon Echo и Google Home, становятся привычным элементом интерьера. Эти системы построены на базе программного обеспечения для распознавания речи, которое позволяет пользователям общаться с машинами с помощью голосовых команд. Теперь же эстафета, в обличье Web Speech API, переходит к браузерам.

В ходе

2017-07-26 14:08

Случайный лес vs нейросети: кто лучше справится с задачей распознавания пола из аудио (ч.1)


методы распознавания образов, алгоритмы распознавания речи

Исторически сложилось так, что наибольшего успеха глубокое обучение достигло в задачах image processing – распознавания, сегментации и обработки изображений. Однако не сверточными сетями едиными, как говорится, живет наука о данных.

Мы попробовали составить гайд по решению задач, связанных с обработкой речи. Самой популярной и востребованной из них является, вероятно, распознавание того, что именно говорят, анализ на семантическом уровне, но мы обратимся к более простой задаче – определению

2017-06-13 09:39

Искусственный интеллект научился грамотно распознавать речь среди шума


искусственный интеллект, алгоритмы распознавания речи, распознавание образов

Виртуальные ассистенты и системы распознавания голоса достаточно хорошо научились «узнавать» то, что им говорит человек, и выполнять его команды.

Но для корректной работы тех же Siri и Cortana посторонний шум может стать большой проблемой. Справиться с этой технической недоработкой могут помочь эксперты компании Mitsubishi Electric, которые представили новую технологию выделения речи одного человека из общего шума.

Технология японской компании получила название Deep Clustering,

2017-01-24 12:55

Распознавание и синтез речи. Классические методы распознавания речи


алгоритмы распознавания речи, распознавание образов, искусственные нейронные сети, реализация нейронной сети

Распознавание и синтез речи. Классические методы распознавания речи

- Как звук преобразуется в текст?

- Извлечение признаков

- Аккустическое моделирование

Распознавание речи можно разделить на две фазы: акустическое моделирование и декодирование. На лекции были разобраны генеративные и дискриминативные подходы к акустическому моделированию, а также упрощенно показано, как выглядит построение HCLG-графа, и как происходит декодирование с его помощью.

В области синтеза речи лектор

2017-01-11 21:30

Введение в глубинное обучение


искусственные нейронные сети, машинное обучение Python, реализация нейронной сети, алгоритмы распознавания речи, распознавание образов

Из статьи вы узнаете, что такое глубинное обучение. Также статья содержит множество ресурсов, которые вы сможете использовать для освоения этой области.

В современном мире, начиная со здравоохранения и заканчивая мануфактурным производством, повсеместно используется глубинное обучение. Компании обращаются к этой технологии для решения сложных проблем, таких как распознавание речи и объектов, машинный перевод и так далее.

Одним из самых впечатляющих достижений этого года был AlphaGo,

2016-12-14 20:39

Распознавание речи — самая актуальная и сложная задача, над которой работают в отделе голосовых технологий Яндекса.


алгоритмы распознавания речи, распознавание образов

Мы постоянно стараемся повышать качество распознавания речи. Например, в узких тематиках, таких как геозапросы, мы хороши: там около 5% ошибок, то есть, мы распознаем речь как человек (люди тоже делают ошибки). Но в более широких тематиках вроде голосового поиска ошибок уже в районе 15%. Наша цель — снизить долю ошибок в голосовом поиске до 5% и даже обогнать человека.

В принципе, машина может распознавать речь лучше и быстрее человека. Скорость важна, потому что машина может очень

2016-11-11 20:31

«СМИ приукрашивают возможности искусственного интеллекта»


искусственный интеллект, ИИ проекты, алгоритмы распознавания речи, распознавание образов

Издание Harvard Business Review опубликовало колонку создателя подразделения Google Brain и основателя сервиса онлайн-обучения Coursera Эндрю Ына о том, на что способны и не способны современные технологии искусственного интеллекта. Редакция vc.ru публикует адаптированный перевод материала.

«В последнее время руководители компаний часто спрашивают меня, на что сейчас способны технологии искусственного интеллекта. Они хотят понять, как использовать такие технологии в работе своей

2016-10-20 20:05

Нейросети научились распознавать устную речь не хуже человека


искусственные нейронные сети, алгоритмы распознавания речи, распознавание образов

Microsoft / Youtube

Компания Microsoft усовершенствовала систему распознавания устной речи, работа которой основана на использовании нейросетей. Теперь система делает меньше ошибок, чем профессиональный специалист по набору текста. Статья ученых, описывающая программу, выложена на сервере препринтов ArXiv.Точный перевод устной речи в письменную - это одна из наиболее актуальных задач в области искусственного интеллекта. Технология преобразования речи в текст используется в

2016-03-29 20:35

Введение в распознавание образов


методы распознавания образов, алгоритмы распознавания речи

Введение в распознавание образов

1. Введение в распознавание образов

Лекция является введением в теорию распознавания образов. В ней раскрываются вопросы параметризации, нормализации, классификации и т.д.

2. Введение в распознавание речи