Алгоритмы распознавания речи

МЕНЮ


Искусственный интеллект. Новости
Поиск
Регистрация на сайте
Сбор средств на аренду сервера для ai-news

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематика

Авторизация



RSS


RSS новости

Новостная лента форума ailab.ru

 

2018-08-14 19:47

Siri научат различать пользователей по голосу


голосовые помощники, алгоритмы распознавания речи, распознавание образов

Голосовой помощник станет умнее.

Siri в будущем будет различать голоса пользователей и на основе этих данных выполнять различные действия. Об этом свидетельствует патент, который Apple получила на этой неделе.

По данным AppleInsider, в документе описывается метод идентификации профиля пользователя с помощью биометрич

2018-07-11 13:47

Ученые приблизились к имитации естественного распознавания речи


новости нейронных сетей, алгоритмы распознавания речи, распознавание образов

Голосовые помощники уже разработаны каждым уважающим себя IT-гигантом. И кажется, что они даже становятся полезными, а не только залихватски шутят. Однако можно все чаще услышать, что алгоритмы, по которым работают такие системы, далеки от того, как воспринимает речь или другие смысловые идентификаторы человек.

Группа Александра Жданов

2018-07-07 10:57

Pitch-tracking, или определение частоты основного тона в речи, на примерах алгоритмов Praat, YAAPT и YIN


алгоритмы распознавания речи, распознавание образов

В сфере распознавания эмоций голос – второй по важности после лица источник эмоциональных данных. Голос можно охарактеризовать по нескольким параметрам. Высота голоса – одна из основных таких характеристик, однако в сфере акустических технологий корректнее называть этот параметр частотой основного тона.
Частота основного тона имеет непосредст

2018-03-18 21:01

Распознавание речи на python с помощью pocketsphinx или как я пытался сделать голосового ассистента


алгоритмы распознавания речи, распознавание образов, голосовые помощники

Это туториал по использованию библиотеки pocketsphinx на Python. Надеюсь он поможет вам
побыстрее разобраться с этой библиотекой и не наступать на мои грабли.

Началось все с того, что захотел я сделать себе голосового ассистента на python. Изначально для распознавания решено было использовать библиотеку speech_recognition

2018-02-28 13:29

Месяц назад случилась еще одна тихая революция, а мы и не заметили.


алгоритмы распознавания речи, распознавание образов

Месяц назад случилась еще одна тихая революция, а мы и не заметили.

Распознавание речи - такая часть NLP, которая обычно выделяется в отдельное направление, и специалистов в ней гораздо меньше, чем в тематиках, связанных непосредственно с текстом. Разработка систем распознавания речи традиционно считалась очень дорогой, и позволить ее

2018-02-25 14:00

Технологии распознавания речи. Системы искусственного интеллекта, распознающие речь, прошли большой путь развития от появления в 1970-х годах до наших дней.


алгоритмы распознавания речи, распознавание образов

В рамках проекта «Банк знаний», созданного вместе с Корпоративным университетом Сбербанка и посвященного современным технологиям и новым компетенциям, о развитии систем распознавания речи рассказывает Андрей Савченко, доктор технических наук, профессор кафедры информационных систем и технологий НИУ ВШЭ в Нижнем Новгороде.

Системы искусстве

2018-02-11 04:30

Ученые ТУСУРа изучают шепот, чтобы научить машины распознавать речь.


алгоритмы распознавания речи, распознавание образов

Исследователи Томского госуниверситета систем управления и радиоэлектроники (ТУСУР) изучают устную речь человека с помощью уникального математического аппарата, чтобы разработать принципиально новые алгоритмы распознавания речи для создания интерфейсов человек-компьютер, сообщает в четверг инновационный портал Томской области.

Уточняе

2018-01-18 14:14

Прошлое, настоящее и будущее технологий распознавания речи


алгоритмы распознавания речи, распознавание образов, голосовые помощники

Голос — это будущее. Мировые технологические гиганты требуют жизненно важной доли рынка, а ComScore прогнозирует, что «до 50% всех поисковых запросов будут выполняться голосом уже к 2020 году».

Однако исторические антецеденты, которые привели нас к этому моменту, столь же важны, как и удивительны. В этом отчете мы отправляемся в путешеств

2018-01-09 23:25

Безлимитное распознавание речи. Или как я перевожу в боте голосовые сообщения в текст


создание чат-ботов, алгоритмы распознавания речи, распознавание образов, примеры ии

Привет, хабр. Обычно я пишу программы для неговорящих людей, но решил ударится в крайности и сделать продукт для говорящих людей. Я хочу рассказать о разработке бота для VK, который переводит пересланные ему голосовые сообщения в текст. Сначала я использовал Yandex SpeechKit, но потом уперся в дневной лимит распознаваемых единиц и перешел на wit.ai

2017-12-07 09:00

Музыкальное образование помогло разобрать речь на фоне шума


алгоритмы распознавания речи, распознавание образов

giphy.com

Группа канадских ученых проследила за активностью головного мозга музыкантов во время выполнения задания на различение речи на фоне стороннего шума. Исследователи, работа которых опубликована в журнале Proceedings of the National Academy of Sciences, обнаружили в мозге музыкантов повышенную активность участков, отвечающих

2017-11-08 14:09

Задача распознавания речи пока не решена


алгоритмы распознавания речи, распознавание образов

С тех пор, как на сцену распознавания речи вышло глубинное обучение, количество ошибок в распознавании слов кардинально уменьшилось. Но, несмотря на все те статьи, которые вы могли читать, у нас до сих пор нет распознавания речи человеческого уровня. У распознавателей речи много видов отказов. Для дальнейшего улучшения их нужно выделить и постар

2017-11-05 20:10

Доступно о машинном обучении: распознавание речи


алгоритмы распознавания речи, распознавание образов, алгоритмы машинного обучения

Компания Google задалась вопросом объяснения принципов машинного обучения на примерах повседневных проблем и способах их решения. Первая из серии статей была посвящена классификации входящих электронных писем. Во второй публикации просто и наглядно рассказывается об одной из основополагающих концепций сист

2017-11-03 13:14

Как оптимизировать сайт под голосовой поиск


алгоритмы распознавания речи, распознавание образов

В настоящее время мобильные устройства и алгоритмы распознавания речи очень быстро прогрессируют. Таким образом, всё больше людей начинают пользоваться именно голосовым поиском для нахождения нужной информации.

Одной из особенностей такого поиска является то, что информация пользователю нужна здесь и сейчас. Поэтому предпочтение отдае

2017-10-17 21:11

Создать толкового голосового помощника очень непросто, а научить его понимать живую человеческую речь и того сложнее


голосовые помощники, алгоритмы распознавания речи, распознавание образов

Создать толкового голосового помощника очень непросто, а научить его понимать живую человеческую речь и того сложнее. В статье рассказывается, с какими проблемами сталкиваются разработчики Алисы, Сири и других виртуальных ассистентов. Перевод с немецкого языка.

Распознавание речи — задача не из легких

За последние несколько ле

2017-09-11 13:00

Федор Беломоев из Санкт-Петербурга изобрел устройство, которое заменяет слепоглухим людям слух и голос


алгоритмы распознавания речи, распознавание образов

Федор Беломоев из Санкт-Петербурга изобрел устройство, которое заменяет слепоглухим людям слух и голос.

«До последнего времени меня не окружали люди, которые были бы инвалидами по зрению или слуху, но идея не пришла мне в голову случайно. Как-то в одной из популярных газет я читал статью о жизни слепоглухих людей, о трудностях, с котор

2017-08-22 16:01

Будущее веб-технологий: создаём интеллектуального чат-бота, который может слышать и говорить


алгоритмы распознавания речи, распознавание образов, компьютерная лингвистика, голосовые помощники, искусственный интеллект, разработка чат-ботов

Голосовые интерфейсы в наши дни вездесущи. Во-первых — всё больше пользователей мобильных телефонов используют голосовых помощников, таких как Siri и Cortana. Во-вторых — устройства, вроде Amazon Echo и Google Home, становятся привычным элементом интерьера. Эти системы построены на базе программного обеспечения для распознавания речи, которое позво

2017-07-26 14:08

Случайный лес vs нейросети: кто лучше справится с задачей распознавания пола из аудио (ч.1)


методы распознавания образов, алгоритмы распознавания речи

Исторически сложилось так, что наибольшего успеха глубокое обучение достигло в задачах image processing – распознавания, сегментации и обработки изображений. Однако не сверточными сетями едиными, как говорится, живет наука о данных.

Мы попробовали составить гайд по решению задач, связанных с обработкой речи. Самой популярной и востребованн

2017-07-21 12:45

Mozilla развивает свою систему распознавания речи


теория распознавания образов, алгоритмы распознавания речи, новости ит

В рамках проекта по развитию собственной открытой системы распознавания речи компания Mozilla ввела в строй сервис Common Voice, нацеленный на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или поучаствовать в оц

2017-07-07 11:11

Как это работает? | распознавание речи


алгоритмы распознавания речи, распознавание образов

Первое устройство для распознавания речи появилось в 1952 году, оно могло понимать произнесённые человеком цифры. 40 лет спустя были представлены первые коммерческие программы, распознающие речь человека. Они были предназначены для людей, которые в силу физиологических особенностей не могли набирать текст вручную. Сейчас же функция распознаван

2017-06-13 09:39

Искусственный интеллект научился грамотно распознавать речь среди шума


искусственный интеллект, алгоритмы распознавания речи, распознавание образов

Виртуальные ассистенты и системы распознавания голоса достаточно хорошо научились «узнавать» то, что им говорит человек, и выполнять его команды.

Но для корректной работы тех же Siri и Cortana посторонний шум может стать большой проблемой. Справиться с этой технической недоработкой могут помочь эксперты компании Mitsubishi Electric, кото

2017-01-24 12:55

Распознавание и синтез речи. Классические методы распознавания речи


алгоритмы распознавания речи, распознавание образов, новости нейронных сетей, реализация нейронной сети

Распознавание и синтез речи. Классические методы распознавания речи

- Как звук преобразуется в текст?

- Извлечение признаков

- Аккустическое моделирование

Распознавание речи можно разделить на две фазы: акустическое моделирование и декодирование. На лекции были разобраны генеративные и дискриминативные под

2017-01-11 21:30

Введение в глубинное обучение


нейросети новости, машинное обучение python, архитектура нейронных сетей, алгоритмы распознавания речи, распознавание образов

Из статьи вы узнаете, что такое глубинное обучение. Также статья содержит множество ресурсов, которые вы сможете использовать для освоения этой области.

В современном мире, начиная со здравоохранения и заканчивая мануфактурным производством, повсеместно используется глубинное обучение. Компании обращаются к этой технологии для решения

2016-12-28 14:02

Полиция хочет допросить Алексу из колонки Amazon Echo по делу об убийстве


интернет вещей, алгоритмы распознавания речи, распознавание образов, кибербезопасность, искусственный интеллект

Умный динамик Amazon Echo — 24-сантиметровая цилиндрическая колонка с микрофонной решёткой. Прибор устанавливается в квартире, управляется голосом и реагирует на женское имя Алекса (сайт вашей Алексы открывается по личному паролю). Очень полезная вещь: активированная голосовой командой Алекса записывает речь пользователя, распознаёт её (в облаке),

2016-12-25 13:04

Как мы слышим друг друга сквозь шум


Головной мозг, алгоритмы распознавания речи, распознавание образов

Чтобы услышать правильное слово среди окружающего шума, наш мозг использует хитроумный нейронный механизм.

Мы редко задумываемся об этом, но на самом деле у нашего слуха есть одна удивительная способность – умение расслышать то, что нужно, даже если вокруг очень шумно.

Чтобы услышать правильное слово среди окружающего шума, н

2016-12-14 20:39

Распознавание речи — самая актуальная и сложная задача, над которой работают в отделе голосовых технологий Яндекса.


алгоритмы распознавания речи, распознавание образов

Мы постоянно стараемся повышать качество распознавания речи. Например, в узких тематиках, таких как геозапросы, мы хороши: там около 5% ошибок, то есть, мы распознаем речь как человек (люди тоже делают ошибки). Но в более широких тематиках вроде голосового поиска ошибок уже в районе 15%. Наша цель — снизить долю ошибок в голосовом поиске до 5% и

2016-11-11 20:31

«СМИ приукрашивают возможности искусственного интеллекта»


искусственный интеллект, ИИ проекты, Трансгуманизм, алгоритмы распознавания речи, распознавание образов

Издание Harvard Business Review опубликовало колонку создателя подразделения Google Brain и основателя сервиса онлайн-обучения Coursera Эндрю Ына о том, на что способны и не способны современные технологии искусственного интеллекта. Редакция vc.ru публикует адаптированный перевод материала.

«В последнее время руководители компани

2016-11-07 21:31

Нейросеть LipNet читает по губам с точностью 93,4%


новости нейронных сетей, алгоритмы распознавания речи, распознавание образов

Командир Дэйв Боумен и второй пилот Фрэнк Пул, не доверяя компьютеру, решили отключить его от управления кораблём. Для этого они совещаются в звукоизолированной комнате, но HAL 9000 читает их разговор по губам. Кадр из фильма «Космическая одиссея 2001 года»

Чтение по губам играет важную роль в общении. Ещё эксперименты 1976 года показали,

2016-11-01 00:01

«Исторический прорыв Microsoft» был совершен с помощью российских разработчиков


теория распознавания образов, алгоритмы распознавания речи

Российский рекорд на английском языке

Как стало известно CNews, группа исследователей Microsoft в области искусственного интеллекта по автоматическому распознаванию телефонных разговоров удалось добиться рекордного результата с помощью методики, разработанной резидентом «Сколково», компанией «ЦРТ-инновации», входящей в&

2016-10-20 20:05

Нейросети научились распознавать устную речь не хуже человека


новости нейронных сетей, алгоритмы распознавания речи, распознавание образов

Microsoft / Youtube

Компания Microsoft усовершенствовала систему распознавания устной речи, работа которой основана на использовании нейросетей. Теперь система делает меньше ошибок, чем профессиональный специалист по набору текста. Статья ученых, описывающая программу, выложена на сервере препринтов ArXiv.

Точный перевод устной речи в

2016-06-14 17:01

Обзор российских голосовых помощников: «Дуся», «Ассистент на русском», Speaktoit и «Собеседник HD»


ИИ проекты, искусственный интеллект, распознавание образов, большие данные big data, алгоритмы распознавания речи

Обозреватель vc.ru изучила рынок интеллектуальных ассистентов, описала несколько российских сервисов и опросила экспертов о перспективах речевых технологий.

Мировой рынок интеллектуальных ассистентов с 2012 года по 2014 год вырос с $352 млн до $572,2 млн. К 2020 году ожидается рост рынка до $3,07 млрд, что составит 31% по сравнению с р

2016-03-29 20:35

Введение в распознавание образов


методы распознавания образов, алгоритмы распознавания речи

Введение в распознавание образов

1. Введение в распознавание образов

Лекция является введением в теорию распознавания образов. В ней раскрываются вопросы параметризации, нормализации, классификации и т.д.

2. Введение в распознавание речи

2016-01-26 15:20

Новый алгоритм помогает машинам учиться так же быстро, как людям


искусственный интеллект, распознавание образов, алгоритмы распознавания речи

Прорывом искусственного интеллекта из университетов Нью-Йорка, Торонто и Массачусетского технологического института является демонстрация впечатляющей способности искусственного интеллекта узнавать визуальные концепции с одного снимка и манипулировать ими способами, подобными человеку.

Продвижение может привести к более умным телефона