Мышление современной нейросети и человека. В чем отличие?

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2021-10-26 10:34

ИИ теория

В свете разговоров про применение искусственного интеллекта во всех областях жизни (включая определение будущей профессии для школьника) интересно разобраться, насколько похоже «мышление» актуального на сегодняшний день нейросетевого искусственного интеллекта на человеческое.

Собственно, наблюдаемый нами прорыв в области нейросетевого искусственного интеллекта (с массовым внедрением камер распознавания лиц) случился в 2012 году и назывался мудрёным нерусским словосочетанием «deep learning» (глубокое обучение). Тут надо понимать, что нейросети (состоящие из математических нейронов, воспроизводящих понимание некоторых аспектов работы нейронов биологических) для создания искусственного интеллекта предлагали использовать с давних пор.

Перцептрон (однослойную нейронную сеть) изобрели ещё в конце пятидесятых годов прошлого века. Помню, как я в институте в самом начале 2000-х писал программу на базе перцептрона для сдачи курсового — и она сносно распознавала нарисованную от руки цифру. Обучать многослойные нейросети тоже научились давно, при помощи метода обратного распространения ошибки — в 1970-х. Однако все достижения искусственного интеллекта прошлых лет лежали по большей части в области формально-логического «мышления» (типа алгоритмов, обыгрывающих людей в шашки и шахматы), а более приближенные к биологии нейросети долгое время показывали недостаточно высокие проценты распознавания образов.

Что же такое случилось в 2012 году, что нейросети вдруг «выстрелили»? Дело в том, что сошёлся прогресс по трём направлениям. Во-первых, была разработана новая архитектура нейросети — так называемая свёрточная нейросеть, которая была создана по мотивам недавних исследований структуры глазного нерва. В такой нейросети получилось много слоёв, каждый из которых обобщал данные из некоторой небольшой области предыдущего слоя.

Такую многослойную нейросеть из десятков и сотен тысяч математических нейронов обучить методом обратного распространения ошибки достаточно дорого — но тут подоспел прогресс в области видеокарт. Видеокарта при выводе изображений 60 раз в секунду по два миллионов точек (при разрешении высокой чёткости) должна с большой степенью параллельности производить сравнительно несложные однотипные расчёты. И такая архитектура хорошо легла на расчёты функций активации сотен тысяч нейронов — появилась возможность сравнительно дёшево (за счёт бытовых видеокарт) обеспечивать расчёты сложных нейросетей.

Но даже прогресса в архитектуре и вычислениях было бы недостаточно, чтобы обучить глубокую нейросеть — потому что она учится не как человек, который достаточно быстро обобщает немногие факты об окружающем мире. Ей нужно много данных и много-много циклов обучения — и тут тоже случился прорыв с появлением баз данных в миллионы изображений, причём каждое изображение было подписано текстом — что изображено на картинке, кошечка, собачка, человек или что-то другое.

Вот эти три сложившихся технологических прорыва и позволили сделать прорыв в области нейросетей, плоды которого мы сейчас пожинаем. И раздаются голоса, что надо поручить искусственному интеллекту даже контроль над государством. Но тут возникает вопрос — а насколько человеческим является мышление такой вот нейросети? Ну понятно, она «смотрит» на картинку и сообщает, что на ней «видит» — а насколько похожим на человеческое является это «мышление».

Вспоминаю историю про то, как нейросеть обучали определять скопление людей на платформе в метро (например, чтобы определять, когда чаще поезда начинать пускать). И нейросеть после обучения на выборке фотографий платформы вроде как начала сносно определять, что людей много — но при разборе, на какие области картинки она реагировала, оказалось, что она реагировала на показания часов, которые присутствовали в поле видимости смотрящей на платформу камеры.

И вот автор канала Two Minute Papers опубликовал разбор (на английском) того, насколько «мышление» современных нейросетей совпадает с человеческим при анализе картинки . С одной стороны, нейросеть при анализе образа опирается на характерные кусочки изображения. Это похоже на мышление человека. С другой стороны, как оказывается, современная нейросеть не анализирует образ целиком — она остаётся на уровне этих самых кусочков.

И эту особенность «мышления» ИИ можно остроумно показать — так, можно обучить нейросеть, чтобы она могла быстро адаптироваться к перетасовыванию кусков картинки на экране. После перетасовывания область зрения изменяется до неузнаваемости — но нейросеть быстро адаптируется к новой ситуации. Ведь ей для определения управляющего воздействия не нужна картинка целиком, ей нужны некоторые кусочки, которые при обучении нейросети показали наилучшее соотношение сигнал/шум. Посмотрите на видео — выглядит забавно.

В общем, полноценным мышлением в нынешних нейросетях пока и не пахнет. Искусственный интеллект не формирует целостной картины происходящего и не может критически относиться к увиденному.


Источник: m.vk.com

Комментарии: