lytdybr

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2022-10-20 02:36

ИИ теория

В Aisystant опубликован пререлиз (7 глав из 10) курса "Собранность". Это основной курс, проходить его нужно после онтологики и коммуникации, до практического системного мышления. В онтологике вас научат выбирать какие-то типизированные объекты внимания в разных предметных областях, но не более. Важно, что это не просто "что бросилось в глаза", а то, что заданного мета-моделью и мета-мета-моделью типа. Бороться и искать, найти и перепрятать -- вот до момента перепрятать. Перепрятать обычно не успевают, а если успевают, то забывают. Ибо это уже много времени проходит с момента "найти", внимание не удерживается -- что у индивида, что у фирмы таких индивидов. В собранности научат удерживать эти объекты внимания техническими, а не психологическими методами (грубо говоря: записывать, а не заучивать наизусть то, на что направлены камеры вашего внимания. Камер может быть несколько, и ими вы управляете сознательно, используя экзокортекс. И речь идёт не только о минутах и часах, но и неделях, месяцах, годах. И не только о собранности вас, но и о собранности предприятия). А затем в "Практическом системном мышлении" вам расскажут, что есть предписанные важные объекты внимания, и вы сможете использовать собранность не наобум, а с максимальной эффективностью. Дальше "Методология" добавит в объекты внимания способы работы (практики), а "Системная инженерия" расскажет, что есть предписанные важные способы работы, и вы сможете работать не наобум, а с максимальной эффективностью. И дальше будет "Системный менеджмент": как работать коллективом, а не в одиночку, помогая друг другу, а не мешая.

Ровно двадцать лет назад (19 октября 2002 года, https://ailev.livejournal.com/25715.html) я восхищался романовской никчемушкой https://old.computerra.ru/2002/465/200127/ про праксеологическое определение искусственного интеллекта в его отличии от естественного. Там всё прекрасно, начиная с эпиграфов. Кстати, нейросеть, натасканная на распознавание протекающих сальников в кранах, там тоже есть -- и это 2002 год, за 10 лет до первой такой сети, которую стало можно на такое натаскать! Про ходы на active inference я, конечно, молчу, они очевидны. Последняя там фраза: "давай-ка, Викторович, по маленькой, за искусственный интеллект. За то, чтоб он подальше держался от естественного. А то, говорят, с кем поведешься...". Майкрософт предложил универсальную для модальностей архитектуру трансформеров Magneto, и эта новая архитектура бьёт по стабильности обучения и результатам большинство известных специализированных вариантов -- https://arxiv.org/abs/2210.06423. В очередной раз повторю, почему это важно (для тех, кто плохо знаком с системным подходом и поэтому честно считает, что это всё "развитие идей тупика"). Нейросетки (не факт, что именно этой архитектуры, хорошо работающей на "традиционной цифровой электронной" аппаратуре, есть и другие варианты то ли электроники, то ли оптики, то ли квантовых сред) просто будут составными частями более сложных архитектур. Возьмём, например, фейсбук. LeCun говорил, что в фейсбуке порядка 400 разных нейросеток, которые заняты разными аспектами функционирования фейсбука как целого -- и то, как выглядит буквально каждый пиксель на экране каждого пользователя, определяется этими нейросетками. Но фейсбук ни разу не одна большая нейросетка, решающая все задачи, там есть и другие части архитектуры. Вот и AI будет состоять не только из одного суперуниверсального трансформера (например, Magneto), но и из других частей, и число этих частей может быть далеко больше 400: в когнитивную архитектуру там может много чего войти. В CYC отрабатывается подход с множеством специализированных машинок для рассуждений/inference, среди которых есть и нейросетевые, этих ускорителей там 1100 (https://ailev.livejournal.com/1610230.html), а центральный модуль вывода, к которому ускорители делали, потом удалили, ибо он практически перестал вносить вклад, всё стали делать ускорители. Но может быть и наоборот -- начинаем строить вокруг нейросети множество самых разных ускорителей и памятей, а потом удалить эту центральную нейросеть, останутся только сложным образом соединённые друг с другом логические, квантовоподобные, байесовские и "непонятные" нейросетевые вычислители. Ещё из простейших когнитивных архитектур помним всякие AlphaZero, которые играют во что-то друг с другом (то есть в архитектуре две сетки, а не одна и это даёт принципиальные некоторые качества, которых нет у одной нейросетки, эмерджентные свойства). Затем надо рассмотреть embodiment в какой-то мир (в случае DishBrain, который тоже "нейросетка" это мир Pong, но могут быть и разные другие миры -- и там тоже много софта и аппаратуры, не сводящейся к нейросеткам, или даже сводящейся, это неважно). А дальше обычное рассуждение: у когнитивной архитектуры в целом будут другие свойства, нежели у её составляющих. И если где-то там внутри сложной архитектуры сидит нейросетка Magneto, то не надо говорить о том, что и вся архитектура обладает свойствами этой сетки. Нет, у архитектуры другие, эмерджентные свойства. И часть этого появляется, когда рассматриваешь embodiment по линии мира, куда встраивается эта архитектура, и что там с active/embodied inference. Так что никакого "тупика в развитии AI" по линии улучшения нейросетей я не усматриваю. Просто нужно в рассмотрение включить не только сами сети, но и то, что происходит в их окружении внутри полной когнитивной архитектуры. Пока ругань идёт просто по линии foundation models (они уже не "языковые" давно, мультимодальны), она идёт мимо. Онтология и физика: вчера прошла конференция по многомировой онтологии (онтология эвереттовской интерпретации квантовой механики), есть видео -- https://www.youtube.com/watch?v=mvD4jZ2R-ps (7 часов видеозапись, правда, звук там время от времени исчезает). Вопрос ставится примерно так же вокруг "а чо такова": The MWI solves the measurement problem, avoids action at a distance and indeterminism and does not contradict empirical evidence. Why, then, it is not in the consensus? Там отмечается, что в связи с квантовыми компьютерами в предметную область квантовой физики вбрасывается огромное количество денег, но эти деньги идут приверженцам более старых и проблемных интерпретаций. Но почему? Вопрос про "взятие всерьёз" Дойча как раз был сформулирован в "Структуре реальности" на эту тему: выглядит безумно, но решает проблемы, известные в предыдущих теориях и не опровергнуто -- всё, надо "брать всерьёз", то есть делать основанием для действия (то есть использовать в текущей работе). Но идея бесконечного множества миров, конечно, выглядит более безумно, чем идея Земли, крутящейся вокруг Солнца, которое тоже куда-то несётся в Млечном пути, который тоже куда-то мчится. С этого момента "бесконечного множества миров" до обсуждения того, какие проблемы и как этот набор объяснений решает и насколько это не опровергнуто экспериментами, даже не доходит. Вдруг кому нужно: вот мартовский 2022 года учебник математики для компьютерных специализаций Пенсильванского университета на 2188 (две тысячи сто восемьдесят восемь) страниц -- https://www.cis.upenn.edu/~jean/math-deep.pdf. Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Machine Learning. Вот страница автора, Jean Gallier -- https://www.cis.upenn.edu/~jean/home.html. И у меня есть подозрение, что за время обучения в университете тамошние бакалавры и магистры computer science таки проходят весь этот учебник. Не факт, но подозреваю. Можно задаться вопросом: почему в университете такой объём и глубина изучения одного предмета (математика) допустим, но уже лет через пять после окончания университета такие объёмы для изучения представляются большинству выпускников универа уже невозможными. В любом случае, это неплохая оценка объёма: взяли и собрали из множества необходимых учебников один. Получили чуть больше двух тысяч страниц мелкого шрифта. Весь текст побит на махонькие подразделы: Definition, Example, Proposition, Theorem, Remark, (но этих remarks и даже теорем немного, главным образом определения, примеры сущностей из определений, и разные суждения на базе определений). Задачи/problems есть, но это "крупные задачи" и их немного в конце больших глав. Явно не сержантский метод, то есть не решение многих задач, но решение немногих проблем.Ладно, займусь делом: продолжу писать учебник системного менеджмента. Сегодня планирую закончить первую главу. Вот мем для этого:

UPDATE: обсуждение в чате блога -- с https://t.me/ailev_blog_discussion/17828

Источник: ailev.livejournal.com

Комментарии: