Чего не хватает искусственному интеллекту

2021-02-19 15:00

Глядя на последние достижения в сфере искусственного интеллекта, можно подумать, что машины превосходят людей и скоро поработят нас. Но на самом деле большинство когнитивистов понимают ограниченность возможностей. «Наш мозг гораздо гибче. Получив информацию, он быстро расставляет приоритеты и по возможности выводит общие, логические, эксплицитные принципы», — пишет нейробиолог Станислас Деан. Отвечая на вопрос, чего не хватает искусственному интеллекту, автор выявляет уникальные характеристики человеческой способности к научению. Публикуем отрывок из книги «Как мы учимся», где Деан перечисляет функции мозга, отсутствующие у современных искусственных систем.

Усвоение абстрактных понятий

Большинство искусственных нейросетей воспроизводит только самые первые стадии обработки информации — анализ изображения, который зрительные области нашего мозга осуществляют менее чем за пятую долю секунды. Алгоритмы глубокого обучения далеко не так глубоки, как утверждают некоторые. По словам Йошуа Бенжио, одного из изобретателей алгоритмов глубокого обучения, такие системы в основном схватывают поверхностные, статистические закономерности в данных, а не абстрактные понятия высокого уровня. Например, чтобы распознать объект, алгоритмы глубокого обучения часто полагаются на те или иные очевидные особенности изображения — скажем, определенный цвет или форму. Измените эти детали — и производительность алгоритма резко упадет: современные сверточные нейронные сети не способны распознать, что составляет сущность объекта. Они не понимают, что стул остается стулом независимо от того, сколько у него ножек (четыре или только одна) или из чего он сделан (из стекла, металла или пластика). Тенденция обращать внимание на поверхностные признаки делает эти сети восприимчивыми к ошибкам. Написано множество статей о том, как обмануть нейронную сеть: возьмите банан, измените несколько пикселей или прицепите к нему определенную наклейку. Вуаля! — нейронная сеть подумает, что это тостер!

Разумеется, человек, которому показали изображение на долю секунды, иногда совершает те же промахи, что и машина, и может принять собаку за кошку. Однако, если ему дать чуть больше времени, он тут же исправит ошибку. В отличие от компьютера мы обладаем способностью подвергнуть сомнению наши убеждения и переориентировать внимание на те аспекты образа, которые не согласуются с первым впечатлением. Этот второй анализ, сознательный и разумный, задействует наши общие способности к рассуждению и абстракции.

Искусственные нейронные сети упускают из виду одну очень важную вещь: человеческое научение — это не просто настройка фильтра распознавания образов, это построение абстрактной модели мира.

Когнитивист Дуглас Хофштадтер однажды сказал, что распознать букву А — настоящая проблема для искусственного интеллекта! Данное язвительное замечание, несомненно, является сильным преувеличением, но доля истины в нем есть: даже в таком тривиальном контексте люди умело справляются с абстракциями. Этот наш дар лежит в основе одного забавного явления повседневной жизни капчи — коротенькой последовательности букв, которую просят распознать некоторые сайты, дабы убедиться, что вы человек, а не машина. Многие годы капчи успешно противостояли машинам. Но компьютерная наука развивается быстро: в 2017 году искусственной системе удалось распознать капчу почти на человеческом уровне. Неудивительно, что этот алгоритм имитирует человеческий мозг сразу в нескольких отношениях. Совершая истинный tour de force, он умудряется извлечь скелет каждой буквы, внутреннюю сущность буквы А, после чего использует все ресурсы статистического мышления, чтобы проверить, применима ли эта абстрактная идея к имеющемуся образу. И все же этот компьютерный алгоритм, каким бы сложным он ни был, работает только с капчами. Наш мозг применяет способность распознавать абстракции во всех аспектах повседневной жизни.

Эффективная обработка данных

Все согласятся с тем, что современные нейронные сети обучаются слишком медленно: им требуются тысячи, миллионы, даже миллиарды элементов данных, чтобы сформировать представление об определенной области. У нас даже есть экспериментальные доказательства этой медлительности. Например, чтобы научиться приемлемо играть на консоли Atari, нейронной сети, раз- работанной DeepMind, необходимо минимум 900 часов, а человеку — всего 2!

Другой пример — овладение речью. По оценкам психолингвиста Эммануэля Дюпу, в большинстве французских семей дети слышат от 500 до 1000 часов речи в год; этого более чем достаточно для усвоения языка Декарта, даже с такими мудреностями, как soixante douze («семьдесят два») или s’il vous pla?t («пожалуйста»). С другой стороны, в племени цимане, населяю- щем север боливийской Амазонки, дети слышат только 60 часов речи в год, но это отнюдь не мешает им отлично говорить на языке цимане.

Для сравнения: лучшие современные компьютерные системы от Apple, Baidu и Google требуют в 20–1000 раз больше данных, чтобы достичь даже мизерной языковой компетенции. В плане научения эффективность человеческого мозга остается непревзойденной: машины способны поглощать огромное количество информации, зато мы способны обрабатывать ее более эффективно. Иными словами, из минимума данных люди умеют извлекать максимум.

Социальное научение

Человек — единственный вид, который добровольно делится информацией: мы многому учимся у других людей благодаря речи. Данная способность до сих пор остается вне досягаемости современных искусственных нейросетей. В искусственных моделях знания зашифрованы, рассеяны в значениях сотен миллионов синаптических весов. В этой скрытой, имплицитной форме их нельзя извлечь и избирательно передать другим. Мы, напротив, можем эксплицитно сообщить другим информацию самого высокого уровня — ту, которая достигает нашего сознания. Сознательное знание неразрывно связано с возможностью его вербального выражения: всякий раз, когда мы приходим к более или менее четкому пониманию некоего явления, ментальная формула находит отклик в нашем языке мышления, и мы можем сообщить о ней окружающим с помощью речи. Необычайная эффективность, с которой человек делится своими знаниями с другими, используя минимальное количество слов («Чтобы попасть на рынок, поверните направо, на маленькую улочку за церковью»), до сих пор беспрецедентна как для животного мира, так и для мира компьютеров.

Научение с одной попытки

Ярчайший пример такой эффективности — усвоение нового материала с первой попытки. Если я употреблю новый глагол, скажем, «курдячить», хотя бы один раз, вы тоже сможете его использовать. Конечно, некоторые искусственные нейросети могут запомнить мою фразу. Но что машины пока не умеют делать хорошо, так это интегрировать новую информацию в существующую сеть знаний — а человеческому мозгу это отлично удается. Вы не только запоминаете новый глагол «курдячить», но и мгновенно понимаете, как его спрягать и вставлять в другие предложения: вы часто курдячите? я курдячил вчера, а они курдячат сегодня. Когда я говорю: «Давайте покурдячим завтра» — вы не просто узнаете новое слово, вы вставляете его в обширную систему символов и правил. Например, «курдячить» — личный глагол II спряжения (я курдячу, ты курдячишь, он курдячит и т. д.). Научиться — значит успешно внедрить новые знания в существующую сеть.

Систематичность и язык мышления

Грамматические правила — лишь один из примеров необычайного таланта нашего мозга: способности обнаруживать общие законы, лежащие в основе конкретных случаев. Будь то математика, язык, наука или музыка, человеческий мозг ухитряется извлекать из них абстрактные принципы, систематические правила, которые он может вновь применить в самых разных контекстах. Возьмем, к примеру, арифметику: наша способность складывать два числа носит очень общий характер — как только мы научились этой процедуре на малых числах, мы без труда можем применить ее к произвольно большим числам. Но главное — мы умеем делать обобщающие выводы. Многие дети в возрасте пяти-шести лет обнаруживают, что за каждым числом n следует число n + 1 и что последовательность целых чисел, следовательно, бесконечна — наибольшего числа просто не существует. Лично я до сих пор с трепетом вспоминаю момент, когда я это осознал — на самом деле, это была моя первая математическая теорема. Какие необыкновенные способности к абстракции! Каким образом нашему мозгу, состоящему из конечного числа нейронов, уда- ется концептуализировать бесконечность?

Современным искусственным нейросетям недоступен даже такой простой абстрактный закон, как «за каждым числом следует другое число». Абсолютные истины — не их конек. Систематичность, способность к обобщению на основе некоего символического правила, а не поверхностного сходства по-прежнему ускользает от большинства современных алгоритмов. Иронично, но так называемые алгоритмы глубокого обучения практически не приспособлены к глубокому анализу.

Наш мозг, напротив, превосходно умеет выводить формулы на своем собственном, ментальном языке. Например, он может выразить понятие бесконечного множества, ибо обладает внутренним языком, наделенным такими абстрактными функциями, как отрицание и квантификация (бесконечное = не конечное = за пределами любого числа). Американский философ Джерри Фодор (1935–2017) предложил теоретическое объяснение этой способности: он утверждал, что мы мыслим символами, которые комбинируются в соответствии с систематическими правилами особого «языка мышления». Возможности такого языка обусловлены его рекурсивной природой: каждый вновь созданный объект (скажем, понятие бесконечности) может быть немедленно использован в новых комбинациях, без ограничений. Сколько существует бесконечностей? Этот, казалось бы, абсурдный вопрос задал себе математик Георг Кантор (1845–1918) и сформулировал теорию трансфинитных чисел. Способность «бесконечно использовать конечный набор средств», согласно Вильгельму фон Гумбольдту (1767–1835), характеризует все человеческое мышление.

Некоторые искусственные модели пытаются имитировать усвоение абстрактных математических правил у детей, но для этого они должны овладеть совсем иной формой научения — той, которая опирается на уже существующий набор правил и базовых положений и предполагает быстрый выбор самых емких и правдоподобных из них. С этой точки зрения научение становится похожим на программирование: оно состоит в выборе простейшей внутренней формулы среди всех доступных на языке мышления.

Современные нейронные сети по большей части не способны репрезентировать весь спектр абстрактных фраз, формул, правил и теорий, с помощью которых мозг Homo sapiens моделирует мир.

Едва ли это случайно: в этом есть нечто сугубо человеческое, нечто такое, чего нет в мозге других видов животных и что современная нейробиология еще не успела изучить подробно — поистине уникальный признак нашего вида. По всей видимости, люди — единственные приматы, чей мозг репрезентирует наборы символов, которые комбинируются в соответствии со сложным древовидным синтаксисом. В частности, сотрудники моей лаборатории доказали: услышав последовательность звуков — например, бип-бип-бип-буп, — человеческий мозг мгновенно строит теорию относительно лежащей в ее основе абстрактной структуры (три идентичных звука плюс один непохожий). Оказавшись в аналогичной ситуации, обезьяна обнаруживает последова- тельность из четырех звуков, понимает, что последний отличается, но, похоже, не интегрирует эти фрагментарные знания в единую формулу. Откуда нам это известно? Изучая мозговую деятельность обезьян, мы видим, как отдельные нейронные сети реагируют на количество и последовательности, но не наблюдаем интегрированного паттерна активности в области, отвечающей за речь у людей.

По аналогии с этим потребуются десятки тысяч попыток, прежде чем обезьяна поймет, как изменить порядок последовательности (с АБВГ на ГВБА), хотя четырехлетнему ребенку достаточно пяти. Младенец, который родился всего несколько месяцев назад, уже кодирует внешний мир с помощью абстрактных и систематических правил — это способность, которой напрочь лишены не только классические искусственные нейросети, но и другие виды приматов.

Компоновка

Как только я научусь складывать два числа (к примеру), этот навык станет неотъемлемой частью моего репертуара талантов: иными словами, я немедленно смогу его применить для решения любых других задач. Я смогу использовать его как подпрограмму в десятках различных контекстов — скажем, чтобы оплатить счет в ресторане или проверить налоговую декларацию. Но главное — я смогу комбинировать его с другими приобретенными навыками: например, без труда взять некое число, прибавить к нему 2 и определить, что больше: новое число или 526.

Удивительно, но современные искусственные нейросети до сих пор не проявляют такой гибкости. Знание, которое они усвоили, остается изолированным в скрытых, недоступных связях, что препятствует его повторному использованию в других, более сложных задачах.

В отличие от человека искусственные модели не умеют сочетать ранее приобретенные навыки, то есть рекомбинировать их для решения новых задач.

Для современного искусственного интеллекта характерна чрезвычайно узкая специализация. Программа AlphaGo, которая может победить любого чемпиона по игре в го, — упрямый эксперт, неспособный обобщить свои таланты и применить их в другой, даже очень похожей игре (например, AlphaGo отлично умеет играть в го на стандартном гобане 19?19, но не на доске 15?15). В человеческом мозге, напротив, научение почти всегда означает преобразование знаний в эксплицитную форму, позволяющую их использовать повторно, рекомбинировать и объяснять другим. Здесь мы снова сталкиваемся с уникальным аспектом человеческого мозга, который тесно связан с речью и который, как оказалось, крайне трудно воспроизвести в машине.

Разум — универсальное орудие нашей психики. Умственные способности, перечисленные Декартом, предполагают наличие второй системы научения, иерархически занимающей более высокое положение, чем первая, и основанной на правилах и символах. На ранних стадиях наша зрительная система отдаленно напоминает современные искусственные нейросети: она учится фильтровать поступающие образы и распознавать часто встречающиеся конфигурации. Этого достаточно, чтобы определить лицо, слово или расположение камней на гобане. Но затем стиль обработки информации кардинально меняется: научение становится больше сродни рассуждению, логическому выводу, имеющему своей целью выявить основополагающие правила изучаемой области. Создание машин, которым доступен этот второй уровень интеллекта, — сложнейшая задача. Но что конкретно делают люди, когда учатся на этом втором уровне, и что именно ускользает от большинства современных алгоритмов машинного обучения?

Источник: m.vk.com

Чего не хватает искусственному интеллекту

Комментарии: