Можно ли научить макак читать, или так ли сильно мы отличаемся?

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



Часть 3. Как мозг «собирает» образы: от пикселей к узнаванию

Зрительная система приматов работает по принципу гигантского пазла. Процесс можно описать поэтапно:

1. Разбиение.

Сетчатка «разбирает» изображение на миллионы элементарных единиц — своего рода «пикселей».

2. Последовательная обработка.

Информация передаётся из первичной зрительной коры (в задней части головы) к переднему краю височного полюса через множество последовательных связей.

3. Постепенная сборка.

На каждом этапе нейроны объединяют информацию от предыдущего уровня, создавая всё более сложные представления.

Что происходит на каждом иерархическом уровне:

- Усложнение распознаваемых образов.

В первичной зрительной коре достаточно простой диагональной линии, чтобы вызвать реакцию нейрона. На более высоких уровнях клетки реагируют на сложные кривые, фрагменты объектов и целые объекты и лица.

- Расширение рецептивных полей.

Каждая клетка «отвечает» за определённый участок сетчатки. На каждом уровне этот участок увеличивается в 2–3 раза, позволяя нейронам реагировать на более крупные фрагменты изображения.

- Рост инвариантности.

Нейроны низших уровней чувствительны к малейшим изменениям положения, размера и освещения объекта. На высших уровнях клетки «терпимы» к таким вариациям — они узнают объект независимо от угла обзора и условий освещения.

Японский нейробиолог Кэйдзи Танака сделал ключевое открытие: мозг обезьяны содержит своеобразный «нейронный алфавит» — набор нейронов, специализирующихся на элементарных формах (линиях, углах, кривых). Комбинируя их активность, мозг может описать любой сложный объект.

Его ученик Манабу Танифудзи развил эти идеи с помощью инновационной методики — оптической записи активности коры. Он демонстрировал обезьянам различные объекты (в том числе незнакомые, вроде огнетушителя) и фиксировал появление уникальных «пятен» нейронной активности для каждого объекта, изменение паттерна активности при модификации объекта (например, удалении рукоятки у огнетушителя) и специализацию нейронов на конкретных элементах формы (V?образные линии, изогнутые контуры и т. п.).

Таким образом, зрительная кора использует два фундаментальных принципа:

- иерархичность (последовательное усложнение представлений от простых элементов к сложным образам)

- комбинаторность (создание новых представлений путём объединения активности нейронов предыдущих уровней).

Эта система чрезвычайно эффективна:

несмотря на медлительность отдельных нейронов (около 10 мс на операцию), благодаря параллельной работе миллионов клеток мозг способен распознать лицо за 1/6 секунды независимо от его ориентации и условий освещения.

Интересно, что эта биологическая архитектура вдохновила разработчиков искусственного интеллекта. Современные нейросети для распознавания образов воспроизводят те же принципы: иерархическую обработку и комбинаторное кодирование признаков.


Телеграм: t.me/ainewsline

Источник: vk.com

Комментарии: