Нейросеть учится восстанавливать речь из мозговой активности

2019-01-31 15:45

Фото: www.technologyreview.com

Импланты в мозге, нейронные сети и синтезатор голоса превратили мозговую активность человека в членораздельную речь. Люди, которые услышали её, смогли распознать слова в 75% случаев.

Вокодер (кодировщик голоса) пока воспроизвел только цифры, но подобные разработки в дальнейшем приведут к созданию нейроинтерфейсов, которые смогут расшифровывать человеческие мысли и переводить их в речь. Люди с боковым амиотрофическим склерозом и люди, перенесшие инсульт, смогут поддерживать контакт с окружением, используя синтезаторы речи.

Алгоритм восстановления речи

Датчики в мозге снимают паттерны мозговой активности при произношении цифр. Глубокая нейронная сеть, реконструирующая признаки с шагом в 300 мс, состоит из двух частей: локально-связанная нейронная сеть (LCN) извлекает признаки из спектрограммы, полносвязная сеть (FCN) суммирует получившиеся признаки. Получившиеся признаки сжимаются с 516 до 256 с помощью автокодировщика, вокодер восстанавливает параметры из этого сжатого состояния с помощью декодера и воспроизводит звук. Параметры вокодера состоят из огибающей спектра, основной частоты (f0), структуры (voicing) и апериодичности.

Эксперимент

Когда люди говорят или слушают, у них в мозге возникают определенные паттерны активности. Исследователи Колумбийского университета поместили электроды в слуховую кору пациентов, которые лечатся от эпилепсии, чтобы отследить и записать эти сигналы.

Участники эксперимента слушали записи, в которых другие люди зачитывали цифры от 0 до 9. Сигналы их мозга были пропущены через вокодер. Синтезатор речи генерировал звуки, которые обрабатывались нейронной сетью, чтобы повысить четкость произношения. В результате технология, похожая на те, которые используются в Amazon Echo и Siri, воспроизводила нужную последовательность чисел. Прослушать получившуюся речь можно здесь.

Ограничения и будущие исследования

Работа опубликована в журнале Nature. На данный момент технология может воспроизводить только те слова, которые слышали выбранные пять пациентов и не работает ни для кого другого. Кроме того, это все ещё не собственная речь пациентов, а только то, что они прослушали.

В дальнейшем команда ученых планирует протестировать разработку на более сложных словах и предложениях. После этого они смогут начать эксперименты с отделами мозга, которые отвечают за синтез речи. Конечная цель — создать имплант, подобный тем, которые носят пациенты с эпилепсией, чтобы переводить мысли непосредственно в слова.

Источник: neurohive.io



		Нейросеть учится восстанавливать речь из мозговой активности
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Психология Работа головного мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовые компьютеры Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-01-31 15:45 работа головного мозга Фото: www.technologyreview.com Импланты в мозге, нейронные сети и синтезатор голоса превратили мозговую активность человека в членораздельную речь. Люди, которые услышали её, смогли распознать слова в 75% случаев. Вокодер (кодировщик голоса) пока воспроизвел только цифры, но подобные разработки в дальнейшем приведут к созданию нейроинтерфейсов, которые смогут расшифровывать человеческие мысли и переводить их в речь. Люди с боковым амиотрофическим склерозом и люди, перенесшие инсульт, смогут поддерживать контакт с окружением, используя синтезаторы речи. Алгоритм восстановления речи Схема алгоритма восстановления речи Датчики в мозге снимают паттерны мозговой активности при произношении цифр. Глубокая нейронная сеть, реконструирующая признаки с шагом в 300 мс, состоит из двух частей: локально-связанная нейронная сеть (LCN) извлекает признаки из спектрограммы, полносвязная сеть (FCN) суммирует получившиеся признаки. Получившиеся признаки сжимаются с 516 до 256 с помощью автокодировщика, вокодер восстанавливает параметры из этого сжатого состояния с помощью декодера и воспроизводит звук. Параметры вокодера состоят из огибающей спектра, основной частоты (f0), структуры (voicing) и апериодичности. Эксперимент Когда люди говорят или слушают, у них в мозге возникают определенные паттерны активности. Исследователи Колумбийского университета поместили электроды в слуховую кору пациентов, которые лечатся от эпилепсии, чтобы отследить и записать эти сигналы. Участники эксперимента слушали записи, в которых другие люди зачитывали цифры от 0 до 9. Сигналы их мозга были пропущены через вокодер. Синтезатор речи генерировал звуки, которые обрабатывались нейронной сетью, чтобы повысить четкость произношения. В результате технология, похожая на те, которые используются в Amazon Echo и Siri, воспроизводила нужную последовательность чисел. Прослушать получившуюся речь можно здесь. Ограничения и будущие исследования Работа опубликована в журнале Nature. На данный момент технология может воспроизводить только те слова, которые слышали выбранные пять пациентов и не работает ни для кого другого. Кроме того, это все ещё не собственная речь пациентов, а только то, что они прослушали. В дальнейшем команда ученых планирует протестировать разработку на более сложных словах и предложениях. После этого они смогут начать эксперименты с отделами мозга, которые отвечают за синтез речи. Конечная цель — создать имплант, подобный тем, которые носят пациенты с эпилепсией, чтобы переводить мысли непосредственно в слова. Источник: neurohive.io Комментарии:

Нейросеть учится восстанавливать речь из мозговой активности

Комментарии: