Почему машинное обучение так популярно сейчас и что с ним будет дальше

2017-10-13 16:41

Почему машинное обучение так популярно сейчас и что с ним будет дальше

В подходе к разработке искусственного интеллекта выделяют два основных подхода. Один имитирует логику. «Один из критериев хорошего алгоритма машинного обучения — его интерпретируемость. Это означает, что человек может понять, на основе каких признаков и взаимосвязей алгоритм делает выводы. Например, если алгоритм подсказывает не давать кредит заемщику, то это продиктовано тем, что у него одновременно много детей и мало стажа на новой работе. Таким образом, можно сказать, что алгоритмы мыслят, как человек», — говорит Николай.

Николай Князев. Фото предоставлено организаторами олимпиад НТИ

Другой подход представляет собой попытку сымитировать работу мозга, в котором за реакцию на стимулы отвечают связи между нейронами. «Особняком здесь стоят искусственные нейросети — их разрабатывали по аналогии со строением головного мозга, и многие функции являются приближением процесса мышления. Однако это вполне самостоятельный математический аппарат. Аналогия с человеческим мозгом служит хорошим подспорьем для понимания механизмов работы, но мы пока достоверно не знаем, ни как мыслит человеческий мозг, ни пределов применимости искусственных нейросетей. Вполне вероятно, что будут еще потрясающие открытия, основанные на схожести искусственных и биологических нейронных сетей», — продолжает рассказывать специалист по машинному обучению.

Первой нейронной сетью стал перцептрон американского психолога и нейрофизиолога Фрэнка Розенблатта. Идея была в том, что, когда мы получаем какой-то стимул, в мозге запускается цепь реакций: один нейрон активирует другие и так по цепочке. Когда мы учимся, наши действия получают обратную связь («правильно» / «неправильно»), что позволяет выработать определенный шаблон ответа. При этом в мозге связи между нейронами, отвечающими за этот шаблон, усиливаются, что позволяет выдавать на один и тот же стимул одну и ту же реакцию. В 1960 году ученый продемонстрировал компьютер, который был способен научиться распознавать зрительные образы, например простые геометрические фигуры и буквы. Для обучения компьютера ему предъявляли фигуры вместе с правильным ответом, чтобы, присваивая связям между «нейронами» определенные веса, он тренировался выдавать правильный ответ.

Правда, для более сложных задач перцептрон Розенблатта приспособить не удалось. В 1969 году легендарные Марвин Минский и Сеймур Пейперт написали книгу «Перцептроны», в которой весьма пессимистически оценивали возможности системы Розенблатта и ей подобных. Книга имела огромное влияние и чуть ли не в одиночку ответственна за начало одного из периодов «зимы искусственного интеллекта» (этим весьма спорным эпизодом в истории дисциплины даже социологи интересуются!). Многие исследователи потянулись вслед авторитетному мнению и решили, что раз идея самообучающихся компьютеров бесплодна, то следует сфокусироваться на создании компьютеров, имитирующих человеческую логику, а не сам процесс обучения. Сторонники «нейронок» много лет были очень обижены: некоторым, якобы чуть ли не со ссылкой на «Перцептроны», отказывали в финансировании исследований. Позже, в 1988 году, Минский и Пейперт выпустили расширенную и дополненную версию «Перцептронов», посвятив эпилог тому, как подействовала на исследования ИИ их оценка потенциала искусственных нейронных сетей, и отмечали, что их пессимизм был чересчур переоценен читателями. Минский, вспоминая об этом в 90-е, даже сравнивал эффект первого издания книги с «Некрономиконом» — вымышленной книгой из творчества Говарда Лавкрафта, которую начали «цитировать» другие писатели, а в результате многие теперь уверены, что она действительно существует. Вот и «Перцептроны», подозревал Минский, мало кто на самом деле читал.

Несмотря на «заморозки», где-то исследования в этой области все равно продолжались. В начале 1990-х Ян Лекун, французский информатик, работавший в «Лабораториях Белла», смог создать систему, которая могла читать цифры, написанные от руки.

Ян Лекун демонстрирует систему распознавания рукописного текста.

Эта система уже получила практическое применение: в конце 1990-х в Америке 10?20% банковских чеков, напечатанных или написанных от руки, читали машины с системой Лекуна. К 2010 году Microsoft, Google, и IBM стали использовать нейронные сети для распознавания речи. Однако по-настоящему популярными нейросети стали позже, когда в 2012 году коллеги Лекуна победили в соревновании по распознаванию образов Large Scale Visual Recognition Challenge, использовав подход на основе нейронной сети. Их система опознавала сотни объектов реального мира: от лис до акустических гитар.

Почему нейронные сети так долго не могли прижиться? Собеседник «Чердака» выделяет несколько причин: недостаток опыта применения математических моделей к задачам реального мира, малые объемы данных и медленные расчеты. В какой-то момент мы просто преодолели некоторый порог: процессоры стали достаточно мощны, а хранить и собирать данные стало достаточно дешево и просто, чтобы их стало по-настоящему много, плюс накопился опыт их использования.

«С появлением информации, которую можно анализировать, и возможности производить расчеты стало активно исследоваться возможность применения методов, разработанных еще десятилетия назад. Например, придуманные более полувека назад нейросети сейчас получили развитие в сверточных и рекуррентных нейросетях — специфических структурах, заточенных на анализ изображений и текста. Пока не появились задачи, никто не знал, что нам будут нужны именно сверточные нейросети, а сейчас это один из самых популярных инструментов в классификации изображений», — объясняет Николай.

Сегодня мы слышим про приложения на основе нейронных сетей чуть ли каждый день: автомобили без водителей, роботы, которые умеют разговаривать и торговаться, алгоритмы, которые обыгрывают человека практически во все мыслимые игры.

«Сложно назвать область, где анализ данных не мог бы существенно улучшить производительность. От определения лиц для вычисления преступников до автоматической классификации опухолей без медицинского вмешательства. Ключевым в анализе данных является определение свойств, по которым производится анализ, т.е. на основе каких данных делается вывод о неком свойстве объекта или принадлежности его к какому-то классу. Эти свойства определяет специалист области, в которой выполняется аналитика. Поэтому для успешного внедрения алгоритмов машинного обучения — совместная работа специалиста области и математика в области алгоритмов», — объяснил Николай Князев.

В результате роботы уже начинают теснить человека в таких профессиях, как рабочий, юрист и бухгалтер, водитель и журналист.

«Практически в любой деятельности, чем дальше тем больше, человека можно будет заменить искусственным интеллектом: от написания музыки и работы на пропускной системе до предсказания погоды и работы грузчиком на складе. Последние пять лет происходит взрывной рост технологий анализа данных. Появляются новые алгоритмы, основанные как на нейросетях, так и на решающих деревьях. С развитием проектов Hadoop и Spark мы получаем алгоритмы, которые обучаются на больших данных гораздо быстрее. А при наличии больших объемов данных оказывается возможным использовать „обучение без учителя“ или „с частичным привлечением учителя“, т. е искать закономерность в самих данных, не зная правильного ответа заранее. Это позволяет выходить на новый уровень анализа, который не требует предварительной долгой разметки данных, во что упираются многие задачи», — рассказал эксперт.

Николай Князев — эксперт Олимпиады НТИ для школьников, профиль «Большие данные и машинное обучение».

Источник: chrdk.ru

Почему машинное обучение так популярно сейчас и что с ним будет дальше

Комментарии: