«Машинное обучение меняет жизнь, но мы этого не замечаем — привыкли» |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2018-01-16 10:05 Профессор «Сколтеха» Евгений Бурнаев о том, как применять машинное обучение в бизнесе. Материал подготовлен при поддержке «Сколтеха»
О машинном обучении заговорили в 2012 году, в основном, из-за нейросетей. Как его применяют в бизнесе сейчас? Например, в банках. Условно, задачи в банках бывают двух видов: внутренние и инженерные. Первые связаны с принятием финансовых решений. Вторые — с обеспечением деятельности банка. Простой пример инженерной задачи: при оформлении кредита в банке клиент показывает паспорт, который на самом деле не принадлежит клиенту — просто похожа фотография — или же паспорт поддельный. В этом случае по фотографии с камеры, установленной у сотрудника банка, нужно выяснить, есть ли этот человек в базе мошенников — стоило нейросетям научиться этому, как они сразу стали востребованы на рынке. Благодаря нейросетям эволюционировали технологии распознавания документов (Optical Character Recognition). Эти технологии позволяют автоматически распознавать, сортировать и отправлять бумаги, что экономит время и деньги. Если программа ошибается, — а такое бывает, хоть и редко, — это не страшно, ведь задачи инженерные. Неправильно распознанный документ, хоть и добавляет работы, всё же не особенно вредит организации. Есть также классическая банковская процедура — кредитный скоринг (оценка кредитоспособности человека или организации — vc.ru). В ней задействованы автоматизированные системы: они запрашивают и анализируют кредитные истории, отслеживают движение денежных средств на счету заёмщика и выводят общий балл, оценивающий кредитоспособность. Основные модели, которые в настоящее время используются в скоринге — линейные. Балл, выставляемый заёмщику, является комбинацией различных характеристик заёмщика. Как следствие, довольно легко объяснить, почему банк принял то или иное решение. Учитывая «антидискриминационные» законы, в соответствии с которыми клиент может запросить у банка объяснения о причинах принятого решения, это свойство линейных моделей крайне полезно. Другое полезное свойство этих моделей — «робастность» (robust — (англ) крепкий, сильный — vc.ru), то есть даже если резко поменяется экономическая ситуация и текущая модель перестанет быть достаточно точной, количество ошибочных решений возрастёт незначительно. Эксперименты показывают, что использование более сложных нелинейных моделей, таких как ансамбли деревьев решений и нейросети, позволяет получить более точные прогнозы. Но если раньше сотрудники банков знали, почему программа приняла именно такое решение, сейчас они зачастую остаются в неведении. Слишком много данных, слишком сложные модели, которые их обрабатывают — нейросети состоят из десятков и сотен миллионов элементов. После того, как нейросети стали применять в бизнесе, они стали целью для мошенников. Злоумышленник может «скормить» нейросети картинку с небольшим, еле видимым глазом, искажением. Программа не сможет корректно распознать изображение и начнёт выдавать ошибки.
Есть и ещё один интересный эффект, связанный с обучением сложных моделей на больших выборках. Если нейросеть обучалась на неверных или неполных данных, любые отклонения от заданной нормы будут казаться ей неправильными. Например, если по каким-то причинам обучающая выборка собиралась в стране, в которой принято, что, в основном, работают мужчины, а женщины — занимаются домашним хозяйством, то нейросеть в итоге может посчитать менее кредитоспособными именно женщин. Словом, у нейросетей есть три больших минуса. Во-первых, из-за нелинейности работы разработчики не могут гарантировать, что нейросеть не начнёт врать. Во-вторых, людям сложно объяснить, как они работают. И в-третьих, из-за неправильных исходных данных у неё могут появиться «предрассудки». Какие ещё могут возникнуть проблемы, если методы машинного обучения будут применяться повсеместно или их будут меньше контролировать? Есть Базельские соглашения, регламентирующие банковскую деятельность вплоть до документооборота, систем безопасности и условий возврата денег клиентам. Эти стандарты гарантируют устойчивость банков, и они их принимают, чтобы быть надёжнее. Такой же регламент нужен и для машинного обучения. Чтобы можно было понять, почему модель приняла именно такое решение с математической точки зрения, и какими будут юридические последствия. При этом наличие такого регламента не только поможет гарантировать прозрачность решений и повысит их точность, но и потенциально повысит прибыль банка.
Всё как в любых сложных системах управления и контроля — в самолётах или, например, поездах. В самолёте сотни километров проводов, как гарантировать, что из-за того, что какой-то из них перегорит, не произойдет аварии? С помощью стандартов, контроля качества на производстве и сборке. Есть специальные процедуры оценки надежности, после которых становится ясно, с какой вероятностью выходит из строя каждый элемент системы и как следствие, и вся система в целом. В сфере машинного обучения со временем появятся такие же стандарты.
Какие виды нейросетей и других методов используются чаще всего, и насколько они зависят от области применения? Изображения распознают свёрточные сети, у которых много слоёв и в каждом слое – некоторый набор фильтров. Для прогнозирования — например, того, через какое время закончатся деньги в банкомате, — используются рекуррентные нейросети (они могут обрабатывать последовательности данных произвольной длины, основываясь на своей внутренней памяти — vc.ru). Для обработки логов пользователей можно использовать модели типа word-to-vector. В них каждому слову соответствует определённый набор из сотен или тысяч чисел — векторов, другими словами. Если с этими числами проводить какие-то операции, то будут меняться и соответствующие им слова. Стандартный пример: «Россия минус Москва плюс Париж равно Франция». Если связать числа с названиями городов и стран и провести с ними те же операции, получится вектор, очень похожий на тот, который соответствует слову Франция. Это специальный класс нейросетей, которые представляют объекты в виде чисел так, чтобы сохранялись некоторые свойства этих объектов. Например, у нас с вами телефоны похожи — значит, сходными будут и описывающие их вектора чисел. Затем строится модель, в которой вектора похожих объектов формируются так, что визуально они как бы притягиваются друг к другу, собираются в группы. В банковской деятельности, как и в любой сложной системе, данные очень разнообразны, так что используется весь арсенал методов машинного обучения.
Банкам машинное обучение помогает сократить издержки. А для клиентов какая польза? Мне кажется, что каким бы прекрасным ни было машинное обучение, если человеку хамят в отделении, он в банк больше не придёт. Лояльность клиентов зарабатывается решением их насущных проблем, а нейросети нужны, чтобы банки работали более эффективно и надежно. Клиенты не видят, что «под капотом», как устроены внутренние механизмы, но они замечают, что качество предоставляемых услуг изменилось в ту или иную сторону. С другой стороны, можно вводить услуги, основанные на машинном обучении, например рекомендательные сервисы. То есть из-за машинного обучения не будет революции? Допустим, в отношениях банка и клиента. Революция — понятие относительное. Человек из 1995 года удивился бы смартфону, а для нас они в порядке вещей. На мой взгляд, машинное обучение меняет жизнь. Просто мы этого не замечаем — привыкли. Есть много проблем, возникающих при переобучении алгоритмов и сетей — они уже решены? Нет, конечно. Это что-то вроде гонки: с одной проблемой разобрался, и тут же появилась другая. Этим занимаются компании или исследовательские организации? Сейчас сложилась занятная ситуация: компании вроде Google и Facebook заинтересованы в этой сфере и у них достаточно средств, чтобы заниматься исследованиями. Хотя в университетах и институтах тоже происходит много всего интересного, крупные компании в какой-то мере монополизировали машинное обучение. Во многом из-за того, что для него нужны значительные вычислительные ресурсы и доступ к массивам данных, а у таких компаний они есть в избытке. Назовите два-три самых интересных и небанальных примера использования машинного обучения. Например, компания «Минимакс» использует нейросети для прогнозирования температуры поверхности дороги. У неё есть погодные станции на автомагистралях, и каждая анализирует, кажется, шесть характеристик: ветер, давление, температуру воздуха и так далее. Компания принимает эти данные и прогноз от Росгидромета и генерирует собственный прогноз температуры поверхности дороги. Соответственно, с помощью современных методов машинного обучения этот прогноз можно сделать точнее. Узнать, будет ли обледенение, например. Есть другая компания, там тоже история с прогнозированием, но спроса, а не температуры. Допустим, вам интересен спрос на смартфоны. Но они ведь состоят из деталей, соответственно, производители смартфонов формируют спрос и на них, и его тоже нужно спрогнозировать. А детали эти могут применяться в других устройствах — получается дополнительный источник спроса. Чтобы всё это спрогнозировать и учесть вот эти нефиксированные зависимости между различными номенклатурами деталей, и нужно машинное обучение. Недавно я начал немного заниматься обработкой 3D-данных, компьютерной графики. Сейчас это очень популярно, потому что с такими данными работают лидары (лазерные радары — vc.ru), с помощью которых в пространстве ориентируются самоуправляемые автомобили. Многие корпорации внедряют машинное обучение — даже проводят соответствующие курсы для своих сотрудников. «Сбербанк», например. Да, и мы в этом активно участвуем. Вы в корпоративном университете «Сбербанка» преподаёте уже второй курс — чем он отличается от первого? Это скорее вторая итерация, а не продолжение первого курса. Мы проводим как семинары, так и лекции — учащиеся не только получают общее представление о машинном обучении, их ещё и учат решать конкретные технические задачи. Более того, они сдают зачеты, выполняют домашние задания и делают проекты. Двойки получают? Да. Там вообще жёсткая дисциплина: два человека не пришли на занятия, и их сразу исключили. И в целом это правильно, потому что когда у вас в подчинении тысячи людей, только так можно эффективно управлять оргструктурой.
Как устроены семинары «Сколтеха» в Корпоративном университете «Сбербанка»
Источник: vc.ru Комментарии: |
|