Нейронные сети – это не только развлекательная Prisma да FindFace. Сегодня машинное обучение и Big Data способны решать реальные бизнес-задачи. О новых технологиях в B2B-секторе знает бывший руководитель подразделения Data Science в МТС, разработчик алгоритма автодополнения запросов в поисковике «Яндекса» Дмитрий Бабаев.
Сейчас он работает исследователем в лаборатории искусственного интеллекта в Сбербанке. К сожалению, большинство разработок банка – коммерческая тайна, но обо всём, что было позволительно, специалист охотно рассказал.
Интервьюер: Дарья Козлова Респондент: Дмитрий Бабаев
У каких российских компаний есть своя лаборатория ИИ и Big Data?
В России у немногих компаний есть подобные лаборатории, поскольку это во многом академическая история. В «Яндексе» совершенно точно есть исследовательское подразделение. Они также имеются в зарубежных компаниях – например, Google, Microsoft, Facebook. В крупных и некоторых средних компаниях есть подразделения по Data Science, но в них обычно не уделяют много внимания теоретическим исследованиям.
Как вы считаете, какие задачи они пытаются решить?
В подразделениях по Data Science решают задачи, которые нужны бизнесу. Перед тем, как браться за задачу, там оценивают экономический эффект от её выполнения, на основе которого принимают решение, делать что-то или нет. А в исследовательских подразделениях с этим проще – потенциальная польза от решения исследовательских задач и так считается достаточно высокой.
Приведёте примеры?
Обычную задачу Data Science можно показать на примере из области телекомов: найти людей, которых заинтересует новый тариф. Ещё один пример: оптимизация ассортимента товаров в торговых сетях. Зачастую компаниям удаётся сэкономить очень большие суммы, просто привозя правильный ассортимент в правильные магазины, например, отправить дорогие товары в тот магазин, где их купят, а не тот, где они будут пылиться на полках.
Исследовательские задачи могут выглядеть по-разному. Пример такой задачи — это понять, почему нейросеть даёт тот или иной прогноз – для тех или иных входных данных. Но вообще RnD-задачи очень разнообразны.
Какие суммы вкладываются в разработки, связанные с ИИ и машинным обучением?
Зависит от компании. В больших корпорациях на это готовы тратить больше денег, в маленьких – меньше. В телекомах, по моим наблюдениям, на крупный проект, где объёмы данных – сотни терабайт, нужны от десятков до сотен миллионов рублей. С другой стороны, тут нет предела совершенству (улыбается – прим. ред.).
В «Яндексе» вы разработали механизм автодополнений поисковых запросов. Можно ли считать это технологией нейронной сети? Как работает алгоритм?
Нет, это был классический подход machine learning (ML), основанный на статистике поисковых запросов. В зависимости от введённого начала запроса и типичных запросов пользователя выбирались наиболее подходящие варианты автоматического дополнения из базы наиболее частых поисковых запросов. Это было до нейронных сетей, когда все считали их тупиковой технологией. Тогда они ещё уступали алгоритмам классического ML.
Расскажите о самых значительных российских достижениях в области ИИ.
Самый известный пример – это Prisma. Компания зарегистрирована не в России, но, тем не менее, костяк штата – отечественные специалисты. К слову, учёные, разработавшие метод обработки изображений, который используется в «Призме», также из России (группа Виктора Лемпицкого).
У «Яндекса» алгоритмы AI находятся в основе ранжирования результатов поиска. Алгоритм ранжирования по близости текста запроса и сайта с помощью нейросети называется «Палех».
Другой известный пример – FindFace компании NTechLab. Это демонстрации работы её алгоритма распознавания лиц, который она продаёт как коммерческий продукт.
На мировом рынке также известны и российские компании, которые занимаются голосовыми технологиями, например, “Центр Речевых Технологий”.
В Сбербанке, к слову, уже несколько лет применяется технология лицевой биометрии одной из российских компаний. Она используется для борьбы с кражей личности в розничном кредитовании. В лаборатории работают люди, которые участвовали в этом проекте.
Переход на новые технологии требует замены оборудования и ПО, что ощущает на себе конечный потребитель в виде сбоев и ошибок в сети. Как осуществить этап перехода как можно незаметнее для клиента?
На самом деле это классическая задача в разработке, её достаточно давно умеют решать. Один из методов – это тестирование. Прежде чем внедрить новую версию, её долго тестируют: проверяют граничные случаи, а также то, выдержит ли ПО требуемую нагрузку, после чего открывают новую версию для небольшой группы пользователей. В таком случае, если вдруг что-то пойдёт не так, пострадает наименьший процент пользователей.
Способен ли ИИ самостоятельно исправить ошибки и сбои в системе?
Есть алгоритмы, которые как раз предназначены для подобных ситуаций. Но их задача не обнаружить или исправить сбой, а спрогнозировать, что он скоро произойдёт, – увидеть аномальные паттерны в системе. Обычно в сложной системе очень много показателей того, в каком состоянии она сейчас находится. Обнаружив аномальный паттерн, искусственный интеллект может послать сообщение администраторам: что-то идёт не так – посмотрите что – надо что-то предпринять. Например, возросла нагрузка, необходимо добавить незадействованные мощности, чтобы система её выдержала.
На сегодня ИИ несёт наблюдательный характер и функцию обнаружения «заранее» (например, часа за два). А для устранения проблемы пока всё-таки нужен человек.
Над чем сейчас работают в лаборатории ИИ Сбербанка?
Лаборатория ИИ Сбербанка была создана для развития компетенции в области AI в организации. Сейчас, с появлением эффективных методов обучения глубинных нейронных сетей, эта область сильно продвинулась вперёд. Крупным компаниям нужны люди, разбирающиеся в новых технологиях ИИ, чтобы не отставать от стремительного прогресса. Также важно понять, в какие направления AI имеет смысл вкладывать усилия и деньги. Лаборатория поможет это выяснить.
Другая важная миссия лаборатории – собственные исследования в этой сфере, а также создание новых технологий, которые принесут пользу банку. Разумеется, мы занимаемся исследованиями, которые можно применить в банке, но также стараемся, чтобы наши результаты были полезны не только в финансовой области. Например, нам интересно направление анализа временных рядов; данных с такой структурой (транзакционных и других) очень много в банковской деятельности. Из работ с большей научной составляющей можно вспомнить исследования по созданию новых методов интерпретации результатов работы нейросети.
С кем сотрудничает Сбербанк?
Банк сотрудничает с несколькими университетами: МФТИ, ФКН ВШЭ, МГУ. Сейчас на слуху iPavlov, совместный проект с МФТИ. Это проект разработки диалоговых систем для общения с компьютером на естественном языке. Также есть очень интересные активности с другими университетами, от решения сложных оптимизационных задач до фундаментальных разработок по совершенствованию алгоритмов глубинного обучения. Еще существует много активностей по обучению и популяризации знаний – например, лекции по ИИ для школьников.
В чём специфика алгоритмов ИИ Сбербанка?
Существует классическая банковская часть. Например, скоринг – оценка кредитоспособности клиента. Во всех странах он регулируется Центробанками и во многом поэтому основан на хорошо интерпретируемых методах — логистической регрессии и деревьях решений. Эти классические методы надёжны и стабильны. В будущем, мы надеемся, регулятор разрешит использовать более сложные методы. Для этого необходимо доказать, что новые методы достаточно надежны.
В лаборатории ИИ Сбербанка мы занимаемся более сложными методами, в основном глубинными нейросетями и алгоритмами ИИ для данных, типичных для банков. Типичный вид данных для банков – это временной ряд: например, цены на какой-нибудь товар (цена вчера, позавчера и т.д.).
19 апреля вы выступите в качестве спикера на AI Conference. О чём расскажете посетителям?
В последние несколько лет методы глубинного обучения продемонстрировали потрясающий успех. Они уже решают задачи, к которым раньше боялись подступиться. Например, они достигли уровня человеческого качества в speech-to-text и text-to-speech в распознавании изображений. Но у них есть свои ограничения, которые мешают двигаться дальше. Об этом я хочу рассказать, а также о подходах, благодаря которым их, возможно, удастся обойти. Во многом это пока область исследований, а не готовые решения для использования в повседневной работе. Однако есть обоснованные надежды на будущее с ещё более эффективными технологиями ИИ.