Идеи нейрофизиологии в искусственном интеллекте — Александр Панов

МЕНЮ


Искусственный интеллект. Новости
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАТрансгуманизмЛингвистика, обработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

RSS


RSS новости

Авторизация



Новостная лента форума ailab.ru

Специалист по Computer Science Александр Панов о сверточных нейронных сетях, подходах к созданию искусственного интеллекта и науках, у которых они заимствуются

ПостНаука продолжает рассказывать о современных технологиях в проекте «Банк знаний», подготовленном совместно с Корпоративным университетом Сбербанка.

Искусственный интеллект — это очень интересная наука. Начнем хотя бы с того, что идеи, которые в ней используются, всегда черпаются из других наук или из размышлений специалистов по искусственному интеллекту о том, что происходит у них в голове. Откуда специалисты по искусственному интеллекту могут черпать свои идеи? Из двух других намного более старших по времени наук — психологии и наук о живом, например нейрофизиологии.

Нейрофизиологические исследования в настоящее время являются одними из передовых и самых востребованных в мире. В Европе и Америке выделяется очень большое количество средств на то, чтобы понять, как устроен мозг человека, как в нем вырабатывается мысль и почему некоторые повреждения в структурах мозга вызывают те или иные болезни. Например, в Европе один из таких проектов — это Human Brain Project. На него выделяется около одного триллиона евро. В Америке тоже есть такой проект. Он называется Brain — его объявил еще Обама, и по финансированию он соперничает с Human Brain Project. Выделение таких средств предполагает, что будут получены значимые результаты.

Однако сложность работы мозга, одной из самых развитых структур, которые когда-либо создавала природа, влечет за собой то, что данных, собираемых о его работе, очень много. Они могут храниться в терабайтах информации, записи об активации различных структур мозга. К сожалению, до настоящего времени не удается собрать эти данные, структурировать их, построить некоторую модель, тем более предсказательную, показывающую, что бы случилось, если бы активность в мозге изменилась или нарушилась. Существуют некоторые идеи и некоторые мелкие модели работы тех или иных функций. Именно этими моделями и идеями пользуются в искусственном интеллекте, чтобы создать более продвинутые алгоритмы.

Хороший пример использования такой идеи — это очень популярные в настоящее время сверточные нейронные сети. Какое-то время назад была построена модель работы первичных отделов коры головного мозга — не самых главных в работе, но находящих в затылочных отделах и отвечающих за первичную переработку сенсорного сигнала. Было обнаружено, что эта переработка имеет иерархическое строение, и образование новых синапсов и их укрепление происходит в связи с этой иерархией постепенно: сначала в первичных отделах, потом во вторичных и третичных. Этот вывод был использован для обучения нейронной сети. Почему бы не обучить большую структуру нейронной сети послойно? Эта, казалось бы, такая простая идея, подсмотренная в нейрофизиологии, оказалась очень продуктивной. Стало возможным обучение не глубоких (shadow) нейронных сетей — преодоление проблемы, которая еще 10 лет назад была неразрешенной. Послойное обучение приводит к тому, что большие структуры обучаются и показывают более хорошие результаты.

Другая идея исходит из того, что синапс между нейронами — не единственное место распространения сигнала. При существующих и использующихся в том числе и в искусственном интеллекте моделях нейрона считается, что передача идет только по синапсам, то есть электрический сигнал существует в некотором зазоре между мембранами нейронов. Но информация в мозгу передается не только за счет такого распространения электрического сигнала, а также за счет диффузии, в межклеточное пространство разных нейромедиаторов. Такое распространение является не таким направленным, как распространение электрического импульса, однако играет очень большую роль, обеспечивает локальное взаимодействие нейронов между собой в небольшой группе. Сейчас создаются модели сети нейронов, в которых распространяется не только спайковая активность за счет резкого возбуждения одного нейрона и передачи сигнала другим, но и за счет диффузного распространения сигнала вокруг. Такие модели помогут решить существующие проблемы с построением спайковых нейронных сетей, те, которые базируются на том, что там моделируется распространение активности по сети.

Такие небольшие идеи не очень сильно продвигают искусственный интеллект и помогают решить лишь некоторые мелкие задачи. На самом деле существует направление, которое называется биологически инспирированные когнитивные архитектуры, в котором проблема решается в более глобальном смысле, ведутся попытки создать целую систему, которая бы работала на принципах работы головного мозга и не обязательно бы использовала в своей основе нейронные сети. Это базируется на идее необязательности точного моделирования каждого элемента головного мозга, высказанной Саймоном и Ньюэллом еще в эпоху зарождения искусственного интеллекта. Нет необходимости повторять структуру нейрона: эволюция не обязательно создавала все так эффективно, что нужно в точности это копировать. Можно попробовать проследить потоки информации, смоделировать ее переработку в отдельных отделах мозга и попробовать собрать из этой информации некую глобальную систему управления виртуальным агентом или робототехнической системой. Такое направление, когнитивные архитектуры, развивалось десять лет назад, и сейчас все больше опирается на данные о связях между отделами коры головного мозга, которые предоставляет нам нейрофизиология.

На такую структуру головного мозга можно наложить три типа обучения. Во-первых, обучение без учителя: когда не мы говорим системе, что правильно или неправильно, а она сама пытается распознать некоторые закономерности в поступающем сигнале. Именно за это отвечают первичные и моторные отделы коры головного мозга. Следующий тип — это обучение с учителем. Это значит, что мы подаем некоторый ответ, говорим, правильно ли, что был распознан тот или иной паттерн, правильно ли, что мы пытаемся ту или иную закономерность выявить. На этой основе работают некоторые подкорковые отделы, например, части мозжечка, запоминающие автоматические операции: кора, которая распознала паттерны, в том числе и моторные, говорит более мелким нейронам мозжечка о том, что нужно запомнить, правильно ли он формирует связи между нейронами, чтобы воспроизвести ту или иную функцию. И наконец, обучение с подкреплением — когда мы точно не знаем, правильный это паттерн или нет, но у нас есть некоторый ответ из внешней среды, который говорит, что движение идет в правильном направлении. За это отвечают другие подкорковые структуры, например, базальные ганглии, позволяющие нам вырабатывать более длительные планы действий за счет того, что раньше мы эти цепочки действий хорошо применяли для достижения некоторых целей.

Такая глобальная структура, которая накладывается на схему строения мозга, сейчас является одной из самых перспективных. Развитие ее более мелких деталей, например, понимание того, как базальные ганглии связаны с другим важным отделом, таламусом и неокортексом, самым верхним, новым разделом мозга, и как образованы связи между ними, помогает исследователям в области когнитивных архитектур соединить алгоритмы: допустим, совместить обучение без учителя с обучением с подкреплением и выяснить, как одна система будет помогать работать другой.

Такие идеи, которые специалисты в искусственном интеллекте стараются перенимать у исследователей из других областей, иногда критикуются теми же специалистами нейрофизиологии. Иногда они говорят, что их выводы интерпретируются недостаточно полно, но специалисты в искусственном интеллекте справедливо замечают, что даже некоторое упрощение — это шаг вперед. Мы должны не зацикливаться на деталях и стараться разобраться в каждом мелком процессе, а пытаться разглядеть это со стороны, попробовать выработать некую универсальную глобальную теорию, которая бы помогла создать сильный искусственный интеллект.


Источник: postnauka.ru