Алгоритмы распознавания речи

МЕНЮ


Искусственный интеллект. Новости
Поиск
Тарифы
Регистрация на сайте

ТЕМЫ


Новости ИИРазработка ИИРабота разума и сознаниеВнедрение ИИРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

RSS


RSS новости

Авторизация



Новостная лента форума ailab.ru

Последние новости

 

Главные новости

2018-02-28 13:29

Месяц назад случилась еще одна тихая революция, а мы и не заметили.


алгоритмы распознавания речи, распознавание образов

Месяц назад случилась еще одна тихая революция, а мы и не заметили.

Распознавание речи - такая часть NLP, которая обычно выделяется в отдельное направление, и специалистов в ней гораздо меньше, чем в тематиках, связанных непосредственно с текстом. Разработка систем распознавания речи традиционно считалась очень дорогой, и позволить ее могли себе лишь крупные компании. Теперь все изменится:

Facebook выпустил wav2letter - опен-сорсную библиотеку для распознавания звучащей речи в текст.

2017-11-08 14:09

Задача распознавания речи пока не решена


алгоритмы распознавания речи, распознавание образов

С тех пор, как на сцену распознавания речи вышло глубинное обучение, количество ошибок в распознавании слов кардинально уменьшилось. Но, несмотря на все те статьи, которые вы могли читать, у нас до сих пор нет распознавания речи человеческого уровня. У распознавателей речи много видов отказов. Для дальнейшего улучшения их нужно выделить и постараться устранить. Это единственный способ перейти от распознавания, подходящего для некоторых людей большую часть времени, к распознаванию, работающему

2017-11-03 13:14

Как оптимизировать сайт под голосовой поиск


алгоритмы распознавания речи, распознавание образов

В настоящее время мобильные устройства и алгоритмы распознавания речи очень быстро прогрессируют. Таким образом, всё больше людей начинают пользоваться именно голосовым поиском для нахождения нужной информации.

Одной из особенностей такого поиска является то, что информация пользователю нужна здесь и сейчас. Поэтому предпочтение отдается именно голосовому набору, а не клавиатурному. Примеры таких запросов это «Лучший кинотеатр в Москве», «Как доехать до парка Горького», «Кто такой

2017-10-17 21:11

Создать толкового голосового помощника очень непросто, а научить его понимать живую человеческую речь и того сложнее


голосовые помощники, алгоритмы распознавания речи, распознавание образов

Создать толкового голосового помощника очень непросто, а научить его понимать живую человеческую речь и того сложнее. В статье рассказывается, с какими проблемами сталкиваются разработчики Алисы, Сири и других виртуальных ассистентов. Перевод с немецкого языка.

Распознавание речи — задача не из легких

За последние несколько лет цифровая обработка голоса сделала большой шаг вперед — но трудностей не становится меньше. Перед вами несколько причин, почему сложилась такая ситуация, и как

2017-09-11 13:00

Федор Беломоев из Санкт-Петербурга изобрел устройство, которое заменяет слепоглухим людям слух и голос


алгоритмы распознавания речи, распознавание образов

Федор Беломоев из Санкт-Петербурга изобрел устройство, которое заменяет слепоглухим людям слух и голос.

«До последнего времени меня не окружали люди, которые были бы инвалидами по зрению или слуху, но идея не пришла мне в голову случайно. Как-то в одной из популярных газет я читал статью о жизни слепоглухих людей, о трудностях, с которыми им приходится сталкиваться, о низкой средней продолжительности жизни, хотя бы просто потом, что в их мозг не поступает никаких сигналов, понимаете? В

2017-07-21 12:45

Mozilla развивает свою систему распознавания речи


теория распознавания образов, алгоритмы распознавания речи, новости ит

В рамках проекта по развитию собственной открытой системы распознавания речи компания Mozilla ввела в строй сервис Common Voice, нацеленный на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или поучаствовать в оценке качества данных, добавленных другими пользователями.

Целью инициативы является накопление 10 тысяч часов c записями различного произношения

2017-07-07 11:11

Как это работает? | распознавание речи


алгоритмы распознавания речи, распознавание образов

Первое устройство для распознавания речи появилось в 1952 году, оно могло понимать произнесённые человеком цифры. 40 лет спустя были представлены первые коммерческие программы, распознающие речь человека. Они были предназначены для людей, которые в силу физиологических особенностей не могли набирать текст вручную. Сейчас же функция распознавания речи есть практически в любом смартфоне, она позволяет нам взаимодействовать голосом с приложениями, облегчая и упрощая нашу жизнь. Как же работает

2017-06-13 09:39

Искусственный интеллект научился грамотно распознавать речь среди шума


искусственный интеллект, алгоритмы распознавания речи, распознавание образов

Виртуальные ассистенты и системы распознавания голоса достаточно хорошо научились «узнавать» то, что им говорит человек, и выполнять его команды.

Но для корректной работы тех же Siri и Cortana посторонний шум может стать большой проблемой. Справиться с этой технической недоработкой могут помочь эксперты компании Mitsubishi Electric, которые представили новую технологию выделения речи одного человека из общего шума.

Технология японской компании получила название Deep Clustering,

2016-12-28 14:02

Полиция хочет допросить Алексу из колонки Amazon Echo по делу об убийстве


интернет вещей, алгоритмы распознавания речи, распознавание образов, кибербезопасность, искусственный интеллект

Умный динамик Amazon Echo — 24-сантиметровая цилиндрическая колонка с микрофонной решёткой. Прибор устанавливается в квартире, управляется голосом и реагирует на женское имя Алекса (сайт вашей Алексы открывается по личному паролю). Очень полезная вещь: активированная голосовой командой Алекса записывает речь пользователя, распознаёт её (в облаке), хранит записи разговоров (их можно удалить через приложение), выполняет команды — читает книги, играет музыку, устанавливает будильник. Или просто

2016-12-25 13:04

Как мы слышим друг друга сквозь шум


Головной мозг, алгоритмы распознавания речи, распознавание образов

Чтобы услышать правильное слово среди окружающего шума, наш мозг использует хитроумный нейронный механизм.

Мы редко задумываемся об этом, но на самом деле у нашего слуха есть одна удивительная способность – умение расслышать то, что нужно, даже если вокруг очень шумно.

Чтобы услышать правильное слово среди окружающего шума, наш мозг использует хитроумный нейронный механизм. (Фото monkeybusiness / ru.depositphotos.com.)Чтобы услышать правильное слово среди окружающего шума, наш мозг

2016-11-07 21:31

Нейросеть LipNet читает по губам с точностью 93,4%


искусственные нейронные сети, алгоритмы распознавания речи, распознавание образов

Командир Дэйв Боумен и второй пилот Фрэнк Пул, не доверяя компьютеру, решили отключить его от управления кораблём. Для этого они совещаются в звукоизолированной комнате, но HAL 9000 читает их разговор по губам. Кадр из фильма «Космическая одиссея 2001 года»

Чтение по губам играет важную роль в общении. Ещё эксперименты 1976 года показали, что люди «слышат» совершенно другие фонемы, если наложить неправильный звук на движение губ (см. "Hearing lips and seeing voices", Nature 264, 746-748, 23

2016-11-01 00:01

«Исторический прорыв Microsoft» был совершен с помощью российских разработчиков


теория распознавания образов, алгоритмы распознавания речи

Российский рекорд на английском языке

Как стало известно CNews, группа исследователей Microsoft в области искусственного интеллекта по автоматическому распознаванию телефонных разговоров удалось добиться рекордного результата с помощью методики, разработанной резидентом «Сколково», компанией «ЦРТ-инновации», входящей в группу ЦРТ, «Центр речевых технологий». 

На днях компания Microsoft объявила, что ее система распознавания речи по уровню точности

2016-06-14 17:01

Обзор российских голосовых помощников: «Дуся», «Ассистент на русском», Speaktoit и «Собеседник HD»


ИИ проекты, искусственный интеллект, распознавание образов, большие данные big data, алгоритмы распознавания речи

Обозреватель vc.ru изучила рынок интеллектуальных ассистентов, описала несколько российских сервисов и опросила экспертов о перспективах речевых технологий.

Мировой рынок интеллектуальных ассистентов с 2012 года по 2014 год вырос с $352 млн до $572,2 млн. К 2020 году ожидается рост рынка до $3,07 млрд, что составит 31% по сравнению с ростом в 2013 году.

Пока одни компании концентрируются на создании виртуальных помощников на веб-страницах, другие уделяют внимание мобильным. На мировом

2016-01-26 15:20

Новый алгоритм помогает машинам учиться так же быстро, как людям


искусственный интеллект, распознавание образов, алгоритмы распознавания речи

Прорывом искусственного интеллекта из университетов Нью-Йорка, Торонто и Массачусетского технологического института является демонстрация впечатляющей способности искусственного интеллекта узнавать визуальные концепции с одного снимка и манипулировать ими способами, подобными человеку.

Продвижение может привести к более умным телефонам, значительно улучшенному распознаванию речи и компьютерам, которые лучше понимают мир вокруг них.

Эффект Чубакки

Человеческие существа проявляют
 

2018-03-18 21:01

Распознавание речи на python с помощью pocketsphinx или как я пытался сделать голосового ассистента


алгоритмы распознавания речи, распознавание образов, голосовые помощники

Это туториал по использованию библиотеки pocketsphinx на Python. Надеюсь он поможет вам побыстрее разобраться с этой библиотекой и не наступать на мои грабли.

Началось все с того, что захотел я сделать себе голосового ассистента на python. Изначально для распознавания решено было использовать библиотеку speech_recognition. Как оказалось, я не один такой. Для распознавания я использовал Google Speech Recognition, так как он единственный не требовал никаких ключей, паролей и т.д. Для

2018-02-25 14:00

Технологии распознавания речи. Системы искусственного интеллекта, распознающие речь, прошли большой путь развития от появления в 1970-х годах до наших дней.


алгоритмы распознавания речи, распознавание образов

В рамках проекта «Банк знаний», созданного вместе с Корпоратив ным университетом Сбербанка и посвященного современным технологиям и новым компетенциям, о развитии систем распознавания речи рассказывает Андрей Савченко, доктор технических наук, профессор кафедры информационных систем и технологий НИУ ВШЭ в Нижнем Новгороде.

Системы искусственного интеллекта, распознающие речь, прошли большой путь развития от появления в 1970-х годах до наших дней. Прогресс связан не только с тем, что возникли

2018-02-11 04:30

Ученые ТУСУРа изучают шепот, чтобы научить машины распознавать речь.


алгоритмы распознавания речи, распознавание образов

Исследователи Томского госуниверситета систем управления и радиоэлектроники (ТУСУР) изучают устную речь человека с помощью уникального математического аппарата, чтобы разработать принципиально новые алгоритмы распознавания речи для создания интерфейсов человек-компьютер, сообщает в четверг инновационный портал Томской области.

Уточняется, что существующие системы распознавания устной речи не учитывают вариативность окончаний и других особенностей спонтанной устной речи, неспособны

2018-01-18 14:14

Прошлое, настоящее и будущее технологий распознавания речи


алгоритмы распознавания речи, распознавание образов, голосовые помощники

Голос — это будущее. Мировые технологические гиганты требуют жизненно важной доли рынка, а ComScore прогнозирует, что «до 50% всех поисковых запросов будут выполняться голосом уже к 2020 году».

Однако исторические антецеденты, которые привели нас к этому моменту, столь же важны, как и удивительны. В этом отчете мы отправляемся в путешествие по истории технологии распознавания речи, прежде чем предоставлять всеобъемлющий обзор текущего ландшафта, и даём советы, которые должны учитывать все

2018-01-09 23:25

Безлимитное распознавание речи. Или как я перевожу в боте голосовые сообщения в текст


чатботы новости, алгоритмы распознавания речи, распознавание образов, примеры ии

Привет, хабр. Обычно я пишу программы для неговорящих людей, но решил ударится в крайности и сделать продукт для говорящих людей. Я хочу рассказать о разработке бота для VK, который переводит пересланные ему голосовые сообщения в текст. Сначала я использовал Yandex SpeechKit, но потом уперся в дневной лимит распознаваемых единиц и перешел на wit.ai, об этом и хочу рассказать, а также о фреймворке для создания ботов vk с помощью node.js, болтовне гугловского dialogflow.

0. ТЗ

Сделать

2017-12-07 09:00

Музыкальное образование помогло разобрать речь на фоне шума


алгоритмы распознавания речи, распознавание образов

giphy.com

Группа канадских ученых проследила за активностью головного мозга музыкантов во время выполнения задания на различение речи на фоне стороннего шума. Исследователи, работа которых опубликована в журнале Proceedings of the National Academy of Sciences, обнаружили в мозге музыкантов повышенную активность участков, отвечающих за обработку речи.

Нарушение способности различать определенные звуки (например, речь) при повышенном уровне шума наблюдается у людей в пожилом

2017-11-05 20:10

Доступно о машинном обучении: распознавание речи


алгоритмы распознавания речи, распознавание образов, алгоритмы машинного обучения

Компания Google задалась вопросом объяснения принципов машинного обучения на примерах повседневных проблем и способах их решения. Первая из серии статей была посвящена классификации входящих электронных писем. Во второй публикации просто и наглядно рассказывается об одной из основополагающих концепций системы распознавания голоса — распознавание отдельных фонем.

Электронная почта — это лишь один из способов взаимодействия клиентов

2017-08-22 16:01

Будущее веб-технологий: создаём интеллектуального чат-бота, который может слышать и говорить


алгоритмы распознавания речи, распознавание образов, компьютерная лингвистика, голосовые помощники, искусственный интеллект, чат-боты

Голосовые интерфейсы в наши дни вездесущи. Во-первых — всё больше пользователей мобильных телефонов используют голосовых помощников, таких как Siri и Cortana. Во-вторых — устройства, вроде Amazon Echo и Google Home, становятся привычным элементом интерьера. Эти системы построены на базе программного обеспечения для распознавания речи, которое позволяет пользователям общаться с машинами с помощью голосовых команд. Теперь же эстафета, в обличье Web Speech API, переходит к браузерам.

В ходе

2017-07-26 14:08

Случайный лес vs нейросети: кто лучше справится с задачей распознавания пола из аудио (ч.1)


методы распознавания образов, алгоритмы распознавания речи

Исторически сложилось так, что наибольшего успеха глубокое обучение достигло в задачах image processing – распознавания, сегментации и обработки изображений. Однако не сверточными сетями едиными, как говорится, живет наука о данных.

Мы попробовали составить гайд по решению задач, связанных с обработкой речи. Самой популярной и востребованной из них является, вероятно, распознавание того, что именно говорят, анализ на семантическом уровне, но мы обратимся к более простой задаче – определению

2017-01-24 12:55

Распознавание и синтез речи. Классические методы распознавания речи


алгоритмы распознавания речи, распознавание образов, искусственные нейронные сети, реализация нейронной сети

Распознавание и синтез речи. Классические методы распознавания речи

- Как звук преобразуется в текст?

- Извлечение признаков

- Аккустическое моделирование

Распознавание речи можно разделить на две фазы: акустическое моделирование и декодирование. На лекции были разобраны генеративные и дискриминативные подходы к акустическому моделированию, а также упрощенно показано, как выглядит построение HCLG-графа, и как происходит декодирование с его помощью.

В области синтеза речи лектор

2017-01-11 21:30

Введение в глубинное обучение


искусственные нейронные сети, алгоритмы машинного обучения, реализация нейронной сети, алгоритмы распознавания речи, распознавание образов

Из статьи вы узнаете, что такое глубинное обучение. Также статья содержит множество ресурсов, которые вы сможете использовать для освоения этой области.

В современном мире, начиная со здравоохранения и заканчивая мануфактурным производством, повсеместно используется глубинное обучение. Компании обращаются к этой технологии для решения сложных проблем, таких как распознавание речи и объектов, машинный перевод и так далее.

Одним из самых впечатляющих достижений этого года был AlphaGo,

2016-12-14 20:39

Распознавание речи — самая актуальная и сложная задача, над которой работают в отделе голосовых технологий Яндекса.


алгоритмы распознавания речи, распознавание образов

Мы постоянно стараемся повышать качество распознавания речи. Например, в узких тематиках, таких как геозапросы, мы хороши: там около 5% ошибок, то есть, мы распознаем речь как человек (люди тоже делают ошибки). Но в более широких тематиках вроде голосового поиска ошибок уже в районе 15%. Наша цель — снизить долю ошибок в голосовом поиске до 5% и даже обогнать человека.

В принципе, машина может распознавать речь лучше и быстрее человека. Скорость важна, потому что машина может очень

2016-11-11 20:31

«СМИ приукрашивают возможности искусственного интеллекта»


искусственный интеллект, ИИ проекты, алгоритмы распознавания речи, распознавание образов

Издание Harvard Business Review опубликовало колонку создателя подразделения Google Brain и основателя сервиса онлайн-обучения Coursera Эндрю Ына о том, на что способны и не способны современные технологии искусственного интеллекта. Редакция vc.ru публикует адаптированный перевод материала.

«В последнее время руководители компаний часто спрашивают меня, на что сейчас способны технологии искусственного интеллекта. Они хотят понять, как использовать такие технологии в работе своей

2016-10-20 20:05

Нейросети научились распознавать устную речь не хуже человека


искусственные нейронные сети, алгоритмы распознавания речи, распознавание образов

Microsoft / Youtube

Компания Microsoft усовершенствовала систему распознавания устной речи, работа которой основана на использовании нейросетей. Теперь система делает меньше ошибок, чем профессиональный специалист по набору текста. Статья ученых, описывающая программу, выложена на сервере препринтов ArXiv.Точный перевод устной речи в письменную - это одна из наиболее актуальных задач в области искусственного интеллекта. Технология преобразования речи в текст используется в

2016-03-29 20:35

Введение в распознавание образов


методы распознавания образов, алгоритмы распознавания речи

Введение в распознавание образов

1. Введение в распознавание образов

Лекция является введением в теорию распознавания образов. В ней раскрываются вопросы параметризации, нормализации, классификации и т.д.

2. Введение в распознавание речи