Перцептрон и исковое заявление. Нейронные сети для юристов

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Товарищи юристы, забудьте свою профессию. В прошлом году 450 юристов, которые у нас готовят иски, ушли в прошлое, были сокращены. У нас нейронная сетка готовит исковые заявления лучше, чем юристы, подготовленные Балтийским федеральным университетом.

Г. Греф (РБК, 23.07.2017)

Да что же такое, в конце концов, эти нейронные сети, о которых все говорят? 

Сразу скажу, что никаких нейронов в них нет.  Речь идет об «искусственной нейронной сети» (ИНС), которая отнюдь не состоит из нейронов или даже из «искусственных нейронов».  На самом деле это просто компьютерная программа, организованная особым образом.  Архитектура программы вдохновлена архитектурой нервной системы человека и животных, откуда и название. 

В «обычных» программах полученная компьютером информация последовательно обрабатывается шаг за шагом по определенному алгоритму.  Важнейшая особенность ИНС состоит в том, что вычисления в ней проводятся не «последовательно», а «параллельно».  Это значит, что кусочки полученной компьютером информации обрабатываются одновременно во множестве различных процессов, и лишь на выходе итоги вычислений объединяются в общий результат. 

При этом каждый из элементарных процессов очень прост (как прост алгоритм работы отдельного нейрона), а все полезные свойства программы обусловлены характеристиками связей между этими элементарными процессами.  Для достижения желаемых функций программы эти характеристики можно настраивать, в том числе интерактивно, что называют «обучением» нейронной сети. 

Для решения некоторых задач программы типа ИНС оказались весьма эффективными.  Как правило, это те задачи, которые люди решают без использования логических рассуждений,  на «интуитивном» уровне – такие как распознавание лиц и других образов.  Для решения других задач, таких как математические вычисления, по прежнему предпочтительны программы «обычной» последовательной архитектуры. 

***

Первые математические модели нейронных сетей появились в 1940-х годах. 

А в 1958 году Фрэнк Розенблатт (Rosenblatt) изобрел «перцептрон» (perceptron).  Так он назвал придуманный им алгоритм для распознавания образов, а также собранный самим изобретателем агрегат, реализующий этот алгоритм (агрегат получил собственное имя Mark I). 

Рис. 1. Фрэнк Розенблатт со своим творением — «Марк-1».

https://ru.wikipedia.org/w/index.php?curid=1154573

В перцептроне есть три типа элементов.  Как правило, в современных реализациях это «виртуальные» объекты, являющиеся лишь элементами архитектуры программы, а не реальными физическими устройствами.  С другой стороны, ничто не мешает воплотить эти элементы и «в железе», что, собственно, и сделал в свое время Розенблатт. 

Рис. 2. Логическая схема элементарного перцептрона.
Веса S—A связей могут иметь значения ?1, +1 или 0 (то есть отсутствие связи).
Веса A—R связей W могут быть любыми.

Автор: Alexander Krainov - self-work, CC BY-SA 3.0,
https://commons.wikimedia.org/w/index.php?curid=4008607

Элементы типа S – это «рецепторы», обеспечивающие ввод данных в программу.  Например, в задаче распознавания образов рецепторы могут получать данные с фотоэлементов, регистрирующих освещенность отдельных участков изображения.  Если участок темный, на выходе элемента 0, если светлый – на выходе 1. 

Элементы типа A – «ассоциативные».  Это и есть собственно «нейроны».  На вход каждого элемента подается сигнал с одного или нескольких рецепторов (каждый с положительным либо отрицательным знаком).  Алгоритм работы каждого ассоциативного элемента очень прост: если сумма полученных им сигналов превышает определенную величину, элемент выдает на выходе единицу, в противном случае – ноль.  В задаче распознавания образов это соответствует наличию или отсутствию светлого пятна в определенной области изображения. 

Сигнал от «нейронов» затем передается с определенными коэффициентами или весами (wi) на элемент типа R – сумматор.  Сумматор складывает полученные им сигналы и при превышении некого порога (?) выдает на выходе единицу, в противном случае – ноль.  В задаче распознавания образов это и будет итоговый ответ: «Вижу букву А» либо «Не вижу букву А».

Процесс обучения перцептрона состоит в том, что веса wi определенным образом меняются.  Изобретатель перцептрона предложил некий алгоритм обучения, то есть правила изменения весов в зависимости от выдаваемых перцептроном ответов (правильных либо ошибочных) при демонстрации ему образцов изображений.  Алгоритм тоже очень простой: если перцептрон дал правильный ответ, веса не меняются, а если неправильный – то вес каждого активного ассоциативного элемента увеличивается или уменьшается на единицу (знак выбирается в зависимости от знака ошибки). 

После окончания обучения перцептрон способен решать задачу, для которой он предназначен, например, распознавать букву А на изображении. 

Разумеется, можно также сделать перцептрон с несколькими разными сумматорами в последнем слое элементов, который будет распознавать, например, не только букву А, но и другие буквы алфавита.

***

Розенблатт доказал несколько важных математических теорем в области нейронных сетей (далее формулировки теорем приводятся в несколько упрощенной форме). 

В частности, он доказал, что для любой задачи классификации (такую как распознавание буквы А) существует решающий ее перцептрон.  Он также доказал теорему сходимости перцептрона, гласящую, что в процессе обучения перцептрон, независимо от начальных значений весов и последовательности показа образцов изображений, достигнет искомого решения за конечное число шагов.  («Решение» – это состояние перцептрона, разрешающее данную задачу классификации.)

Розенблатт также предложил ряд дальнейших усовершенствований идеи перцептрона, широко используемых в современных реализациях.  К ним относятся «многослойные» перцептроны (то есть сети не с одним, а с несколькими слоями ассоциативных элементов);  сети с «перекрестными связями» (связями внутри каждого слоя); а также сети с «обратными связями» (связями, передающими сигнал от последующего слоя к предыдущему), в настоящее время более известные как «рекуррентные нейронные сети».

Потом эти идеи получили дальнейшее развитие.  Сегодня исследователи выделяют множество типов нейронных сетей, но в целом все они продолжают идеи, заложенные в основополагающих работах изобретателя перцептрона.

Классификация нейронных сетей

Рис. 3.  Одна из классификаций нейронных сетей

Источник: AIportal.ru

В современных реализациях также широко применяются ИНС, в которых в процессе обучения настраиваются не только связи последнего слоя «нейронов» с сумматором, но и другие связи в системе. 

Для обучения современных многослойных ИНС используются более сложные алгоритмы обучения, такие как «алгоритм обратного распространения ошибки» (backpropagation).  В этом методе необходимые для настройки «сигналы ошибки» распространяются от выхода сети к ее входу, то есть в направлении, обратном направлению распространения обычного сигнала.   

Испольуются также ИНС, в который передаваемый сигнал является не дискретным (0 или 1), а непрерывным, что делает их еще более похожими на естественные нейронные сети...

***

Изобретение перцептрона произвело фурор.  Многие ждали, что буквально вот-вот на основе перцептрона будет создан искусственный субъект, который сможет ходить, говорить, видеть, писать, размножаться и осознавать свое существование (“walk, talk, see, write, reproduce itself and be conscious of its existence” – New York Times).

Этого, однако, не случилось.  Вскоре обнаружилось, что перцептрон довольно плохо приспособлен для решения многих классов задач (например, распознавание той же буквы А, но не стоящей вертикально, а лежащей на боку).  В 1969 году Марвин Мински и Сеймур Паперт (Marvin Minsky and Seymour Papert) показали, что идея перцептрона наталкивается на некоторые фундаметнальные проблемы. 

Во-первых, некоторые виды задач принципиально не разрешимы при помощи простейшего варианта перцептрона (хотя, не исключено, разрешимы при помощи тех или иных его модификаций).  Во-вторых, для решения более сложных задач, чем распознавание буквы А, необходимы сети очень большого размера, реализация которых требует значительной вычислительной мощности компьютеров, в то время недостижимой. 

После этого интерес к перцептронам надолго увял.  В области искусственного интеллекта получила развитие парадигма «символьных вычислений» (symbolic approach), конкурирующая с парадигмой нейронных сетей (neural approach).   

Интерес к ИНС возобновился лишь в конце 1980-х, когда производительность компьютеров наконец достигла необходимых для реализации нейронных сетей величин.  В настоящее время нейронные сети – опять модная тема.  Также нередко используются программы, соединяющие элементы двух конкурирующих подходов, то есть сочетающие «последовательные» и «параллельные» вычисления. 

Сегодня ИНС используются для выполнения самых разных функций: распознавание образов, распознавание речи, анализ содержания социальных сетей, компьютерные игры, медицинская диагностика, экономический анализ и многое другое.

По состоянию на 2017 год типичная ИНС имеет от нескольких тысяч до нескольких миллионов элементов и миллионы связей между ними.  Это уже превышает технические характеристики нервной системы некоторых червей! Так, гермафродитная взрослая особь нематоды сaenorhabditis elegans состоит из 959 клеток, включая 302 нейрона, связи между которыми полностью описаны.

***

Спрашивается, а при чем же здесь юристы? 

Да, в общем-то, не при чем.  ИНС – это всего лишь тип архитектуры компьютерных программ.  Такие программы, как и программы «обычной» архитектуры, могут эффективно использоваться в самых разных областях, включая и автоматизацию работы юриста. 

Не уверен, что составление исковых заявлений – это наилучшая область применения для ИНС (на мой вкус, тут более чем достаточно средств автоматизации, предлагаемых MS Office).  С другой стороны, почему бы и нет. 

Так что осваивать компьютерную науку юристу можно и нужно.

Но заменит ли нейронная сеть живого юриста?

Если квалификация юриста достаточна лишь для составления искового заявления из готовых блоков, то, пожалуй,  да: такого юриста можно без проблем заменить компьютерной программой.

Если же мыслительные способности юриста, задействованные в его работе, сколько-нибудь существенно превышают аналогичные способности сaenorhabditis elegans, то замена искусственным интеллектом такому юристу в ближайшее время вряд ли угрожает...


Источник: zakon.ru

Комментарии: