В июле 2025 Nature объявил о технологическом прорыве в нейроимплантах, который даже назвал «священным Граалем» этого жанра

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Раньше даже самые продвинутые мозго-речевые интерфейсы выдавали результат с диким опозданием — целых три секунды после того, как пользователь мысленно дописывал целое предложение. А ведь нормальная речь — это не монолог в пустоту. Без мгновенной обратной связи (когда слышишь свой голос тут же) всё превращается в «пинг-понг вслепую».

Команда из Калифорнийского университета в Дэвисе переписала правила игры. Их новейший нейроинтерфейс, где ИИ расшифровывает электрический гул моторной коры, бьет рекорды сразу по двум фронтам.

Во-первых , скорость. Нейронный сигнал «Щас скажу!» становится звуком уже через 10 миллисекунд. До свидания, трехсекундные паузы — здравствуй, реальное время.

Во-вторых, выразительность. Девайсы прошлого бубнили монотонно (как робот). Этот же — впервые — ловит всю музыку живой речи: вопросительные виражи интонации, высоту тона, акценты (хочешь слово выделить — держи!), и даже пение. Участник исследования, 45-летний мужчина с БАС (болезнь, бьющая по мышцам, включая речевые), теперь не только говорит, но и напевает мелодии на разных высотах. Это очень далекий шаг вперед по сравнению с речью «а ля Стивен Хокинг».

Несколько слов о том, как все это работает. В речевой моторный центр участника вживили имплант с 256 микроскопическими кремниевыми электродами (всего по 1,5 мм). Алгоритмы глубокого обучения сканируют сигналы коры каждые 10 мс. Причем отлавливаются не слова или фонемы, а сами звуки, которые человек пытается издать. Любые — от четких слов до междометий («Ага!»), нечленораздельных возгласов («М-м-м!») или философского бульканья. То есть человеку возвращается утраченная свобода самовыражения и он не ограничен словарем робота.

Но вишенка на торте — это персонализация. ИИ обучили на архивных записях самого пациента (его интервью до болезни), и теперь цифровой голос звучит как его собственный. Пациент признается: чувствует этот голос своим и говорит, что счастлив. Он говорит что хочет, отвечает на открытые вопросы, используя слова, которые декодер раньше не слышал. Без клише, без лишних битов — чистая речь.


Источник: vk.com

Комментарии: