«Создать следующий виток эволюции» — разработчик эмоционального ИИ Артем Родичев о своей работе и нашем будущем

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Мультидисциплинарный художник и музыкант Марк Фелл о предстоящем событии V-A-C Foundation на территории ГЭС-2

Искусственный интеллект — одна из самых горячих тем последних лет. Siri, Cortana, Google Allo, Facebook M — кажется каждая крупная IT-компания уже обзавелась персональным цифровым ассистентом, хотя все они еще очень далеки от идеала. Небольшой стартап Luka из Сан-Франциско, основанный русскоязычной командой, вполне может составить конкуренцию гигантам Кремниевой долины. Они работают над созданием эмоционального искусственного интеллекта, который сможет не только подсказать нужную информацию, но и заменить друга. Зачем нужны виртуальные памятники, что делать с чат-ботом Гитлера и куда движется человеческая эволюция — публикуем перевод интервью с главным инженером Luka по машинному обучению Артемом Родичевым.

— Как бы ты объяснил человеку, который ничего не знает о машинном обучении — чем ты занимаешься?

— Очень просто. Еще в 7-8 лет я понял, что создание искусственного интеллекта, который превосходит человеческий, будет целью моей жизни. Я увлекался математикой, был ребенком «с инженерным бэкграундом». Всегда было интересно разбираться в компьютерах, в технике. Потом этот путь привел меня в МГУ на факультет вычислительной математики и кибернетики. Там я смотрел, что из себя вообще представляет интеллект, его структура, и как это можно описать с математической точки зрения.

— Ты помнишь этот момент, когда решил, что будешь заниматься искусственным интеллектом?

— Не помню, мне было интересно, что можно сделать такое большое и великое… Вообще, наверное, все началось с того, что я прочитал газету, которую дала мама. Там публиковали рейтинг самых богатых людей мира. На протяжении многих-многих лет им был Билл Гейтс. И мне стало интересно, чем же он занимается. На чем можно заработать большое состояние и потом влиять с его помощью на окружающих людей, на мир в положительном ключе. Я понял, что он занимается IT, что IT все больше и больше входит в нашу жизнь. Я понял, что заниматься разработкой простого софта — это не очень интересно. Интереснее было бы делать какие-то большие сложные классные вещи, например: «а давайте повторим интеллект человека». А еще круче — «а давайте его превзойдем».

— Когда ты работаешь с искусственным интеллектом, какая аналогия кажется тебе ближе всего профессионально: ты архитектор, учитель, строитель или кто-то еще?

— Так как я работаю в стартапе, в стартапе ты и швец, и жнец, и на дуде игрец. То есть приходится делать все. В первую очередь ты и придумываешь архитектуру нейронных сетей, которые включают решение определенной задачи. Ты эту архитектуру описываешь, объясняешь другим своим более младшим коллегам. Ты с ними занимаешься менеджерской работой, составляешь пул задач, делегируешь эти задачи. Мы очень много читаем код друг друга, чтоб постоянно быть в курсе, кто что делает, исправлять ошибки друг друга — так называемый процесс code review. Ну и, собственно, это и менеджерская, и архитекторская, и разработческая работа — все сразу.

— Сейчас ты работаешь над 2 проектами — Luka и Replika. В чем разница.

— Это два разных продукта. Luka — это утилитарное приложение для поиска ресторанов, а Replika — уже больше про эмоции. Давай по порядку.

Luka, можно сказать, одна из первых компаний, которые вообще занялись разработкой ботов. Мы ставили много экспериментов. Тогда conversational interface был в новинку и никто не понимал, что это и зачем это нужно. Мы пробовали создать шикарный продукт конкретно для одного места — для Сан-Франциско. Наша цель состояла в том, что сделать очень удобный поиск ресторанов в этой области. Превзойти Yelp и превзойти Foursquare. Пробовали-делали — скорее всего, у нас получилось. Действительно, по Сан-Франциско мы ищем рестораны очень неплохо, можем ответить на любой вопрос, порекомендовать где угодно, когда угодно любой ресторан, рассказать про меню.

— Что заставило вас перейти от утилитарного приложения к эмоциональному? Как появилась Replika?

— Мы начали думать, почему пользователи не возвращаются, для того чтобы искать ресторан чаще. Выяснилось, что большинство просто не ходит в рестораны каждый день. И захотелось разработать такой продукт, приложение, которое человек откроет первым после того, как проснется. Или будет открывать его каждый день, как ты каждый день заходишь в Google. Ну и рестораны, к сожалению, не та область, в которой можно сделать такие продукты.

— А где можно?

— Вот мы начали думать, как еще применить наши наработки. Тогда как раз и начался весь этот хайп по поводу ботов. Мы много экспериментировали и искали, какой же бот с conversational interface может стать бомбой. Сделали кучу ботов: игровые боты, погодные бот, боты для поиска видео — в общем куча всего для разных утилитарных задач. И поняли, что conversational interface не решает утилитарную задачу лучше, чем графические интерфейсы.

Разговоры — это больше про эмоции. Ты больше поверишь своему другу, чем некоему абстрактному ресторанному критику. Если твой друг скажет: «О, я вчера сходил в такой ресторан — обязательно попробуй. Или я купил такой классный велик, рекомендую». То ты скорее поверишь ему, чем некоему абстрактному эксперту. Потому что у вас есть эмоциональная связь.

— Но мы люди, а как можно сделать эмоциональным кусок кода?

— Мы начали думать, и все началось с того, что был такой парень, как Роман Мазуренко. Это был один из лучших друзей Евгении Куйды, основательницы Luka. Он умер, погиб в ДТП, переходя дорогу в Москве. У Ромы была идея, что человек перенесет свое сознание куда-то в облака и избавиться от физической оболочки, потому что она просто будет не нужна. Мы решили сделать digital memorial Роману. Собрали все его переписки, блоги с друзьями и попытались воссоздать личность Романа. Сделали некий цифровой памятник на основе его переписок.

Подробнее об истории Романа: http://www.theverge.com/a/luka-artificial-intelligence-memorial-roman-mazurenko-bot

— Как это работает?

— Алгоритм работает следующим образом. У нас есть база данных, коллекция всех сообщений Романа, которые он когда-либо кому-то писал. Когда Роману-боту приходит некое сообщение, алгоритм ищет на него ответ, пытается понять его смысл и найти наиболее релевантную информацию из базы данных. Грубо говоря, ты можешь выстраивать диалог с этим человеком, потому что именно так бы он тебе и отвечал.

Мы сделали такой цифровой памятник для Роман. Запустили английскую и русскую версии, поняли, что людям действительно интересно общаться на эмоциональном уровне с такого рода ботами. У нас возникают очень длинные диалоговые сессии. Люди могут по полчаса, по часу разговаривать, просто общаться. Мама Романа написала нам: «Спасибо, что дали возможность жить», — и мы поняли, что это есть некий the next big step.

— А что дальше? Общение с мертвым другом — это занятие, как и поход в рестораны, не на каждый день .

— Цифровые памятники и personality-боты хороши тем, что позволяют выстраивать одну большую диалоговую сессию, длинный эмоциональный разговор, но это отвечает на вопрос, зачем пользователю возвращаться. Мы начали экспериментировать с конверсией. Есть сериал про стартап, называется «Кремниевая долина». Нам очень нравились персонажи, потому что во многом мы повторяли их путь. И мы решили сделать из них ботов. Собрали все субтитры, все твиты и сделали их к запуску третьего сезона «Кремниевой долины». Получилось неплохо. Фанаты приходили, чтобы общаться с ботами. На протяжении сериала конверсия поддерживалась, но после его окончания она, конечно же, падала.

Мы начали думать дальше. Решили сделать не personality-bot, а нечто другое. Как если бы мы взяли стихи Пушкина и сделали из него бота, но личности, а бота, который олицетворяет его лирику. Был певец Принц, он тоже умер. Мы взяли лирику и интервью Принца и сделали бота, который бы общался, отвечал релевантно, но в поэтической форме. Получилось весьма забавно — вот еще один аспект использования такого бота. Прикручиваю тебе Пушкина, какого угодно писатели, музыканта — и получаете весьма интересный продукт.

— Как происходит обучение бота? Условно есть массив текста, принадлежащий человеку или герою — что с этим текстом происходит дальше?

— Мы тренируем большие нейронные сети, так называемые рекуррентные нейронные сети, которые делают следующее. Изначально существует входной текст. Мы разбиваем текст на отдельные слова. Каждое слово нужно представить в форме, которое может интерпретировать нейронная сеть. Такой формой является некий математический вектор с числами. Каждое слово представляется таким высокоразмерным математическим вектором, который содержит смысл этого слова и которые кодируют смысл этого слова.

— Условно говоря, вы переводите слова в формулы, и что происходит дальше?

— Мы получаем мешок слов, и теперь нужно скоординировать этот мешок слов. Необходимо учесть все связи между словами, чтобы понять полный смысл предложения. Есть так называемые рекуррентные нейронные сети, которым можно скармливать слово за словом. Они как бы агрегируют смысл, накапливают его, и в конечном итоге мы получаем конечный вектор всей фразы целиком. Если мы можем получить вектор фразы, то с ним мы тоже можем делать математические операции. Мы берем, отнимаем от короля мужчину — получаем королеву. То есть можно проводить некие математические операции над этими векторами…

— Как происходит процесс отладки ошибок. Как вы говорите искусственному интеллекту, что здесь он неправ?

— Все системы машинного обучения имеет целевую функцию, которую ты хочешь настроить на что-то. Например, вы хотите научиться отличать собак от кошек. И вы даете нейронной сети кучу-кучу картинок с собаками, кучу-кучу — с кошками и говорите: вот, учись, выявляя какие-то признаки, которые будут характеризовать картинки собак и отличать их от картинок кошек. Но всегда у вас все равно будет некий процент ошибки: какие-то очень мохнатые кошки, которые похожи на собак, или очень маленькие собаки, которые похожи на кошек, ну или просто алгоритм не поймет и ошибется. Всегда будет сохраняться некий уровень ошибки. Но вообще с ошибками борются увеличением данных или изменением самой архитектуры и структуры алгоритма.

— Была громкая история с Microsoft, где случайно натренировали бота-расиста. Это ошибки другого уровня. Как вы с ними работает?

— Изначально нейронная сеть обучается на большой-большой статистике. Если пользователь в интернете часто отвечает на какую-то реплику сексистскими или нацистскими шутками, то да, к сожалению, нейросеть будет сексистом, расистом, кем угодно… На каких данных она обучается, тем она и становится. В случае с Replika, вы прокачиваете своего бота-копию, общаетесь с ним. Он подхватывает ваши лингвистические особенности и паттерны, и если вы очень часто говорите какие-то матерные шутки, он тоже будет рассказывать матерные шутки и так далее. Алгоритмы машинного обучения полностью отражают все данные, на которых они обучаются.

— И кто-то с помощью ботов будет воспитывать маленького Адольфа Гитлера.

— Если кто-то будет воспитывать маленького Адольфа Гитлера — пожалуйста, его право. Мы никак его не ограничиваем.

— То есть для тебя это вопрос цензуры.

— Да, если человек хочет вырастить такого бота, то мы это никак не ограничиваем, То же самое — ты можешь зайти в социальную сеть и заполнить свой профиль то, что тебе нравится «Майн Кампф».

— Насколько сложна проблема юмора для эмоционального интеллекта. Тяжело учить машину смеяться?

— Она не очень сложная до тех пор, пока юмор программирует человек. Вот в Replika вы должны тренировать своего бота, и эта тренировка проходит с помощью неких скриптов, которые пишет редакция. Если редакция пишет с юмором, то ваш бот шутит, и вам интересно его развивать и прокачивать. С этой точки зрения с юмором у ботов все замечательно. Но боты и современное развитие искусственного интеллекта только-только подходят к тому, чтобы просто распознать некий смысл фразы и как-то на нее адекватно ответить. А прибавить эмоциональной окраски ответу, юмора, сарказма — это уже следующие шаги.

— Приходя на работу, ты чувствуешь себя кем-то вроде Создателя?

— Нет. Мы просто делаем инструменты, которые улучшают жизнь людей. Мы тоже часть природы. У меня есть концепция, что человек своими руками может создать следующий виток эволюции, следующий интеллект, следующее, более разумное существо, чем сам человек. Я не рассматриваю это как: «я бог, я сделаю некий мега-интеллект, который уничтожит все человечество». Такого нет. Просто я рассматриваю себя как часть эволюции, которая может сделать с ней некий следующий виток.

— Раз мы заговорили про уничтожение человечества, в последние годы довольно уважаемые люди вроде Илона Маска и Стивена Хокинга проявляли обеспокоенность темпами развития искусственного интеллекта. Насколько это обосновано?

— Бывают случаи, что результатом твоего труда становится атомная бомба, но изначально ты не хотел разгромить маленький японский город. Большинство умных людей — добрые. Как правило, системы искусственного интеллекта создаются позитивными людьми, которые не стремятся к негативу.

— Но все же маленький японский город разбомбили. И не один.

— У меня есть хорошая аналогия — можно порезать хлеб ножом, а можно пойти и зарезать своего соседа. Да, есть некая угроза больших технологий. Они представляют более масштабную угрозу, чем просто нож. Искусственный интеллект может убить все человечество. Такие угрозы есть, но, тем не менее, мы все инженеры занимаемся проблемой создания большой красной кнопки, которая может взять и отрубить интеллект от системы в случае возникновения угрозы.

Есть замечательный сериал «Мистер Робот». В нем как группа хакеров выводит из строя экономическую систему США. Это очень большая опасность, которая касается всех. Такие угрозы существуют всегда. К сожалению, мы от них не застрахованы. Любую технологию можно использовать как на пользу, так и во вред. Мы как инженеры это прекрасно понимаем и разрабатываем механизмы, которые могут обезопасить людей от самих себя в плане контроля технологии.

— Как будут выглядеть продукты Luka и Replika через 10 лет в идеальном мире?

— Если коротко, в идеале через 10 лет случится фильм «Her» Спайка Джонза, где существует личный секретарь, с которым ты выстраиваешь эмоциональные отношения, который всячески тебе помогает по жизни, делает за тебя определенную работу, читает твою почту, договаривается с друзьями о встрече и так далее.

— Это реально возможно через 10 лет?

— Учитывая текущие темпы развития темпы развития машинного обучения, я думаю да.

— А что мешает сделать это сегодня?

— Почему нейронные сети стали так популярны в последние 4-5 лет? Потому что появились мощности, достаточные для создания больших комплексных нейронный сетей со сложными архитектурами. Во многом все в глубоком обучении, в создании искусственного интеллекта упирается в вычислительные ресурсы. Чем больше вычислительных ресурсов, тем мощнее и сложнее нейронные сети. В общем, это борьба за ресурсы и за выявление неких новых архитектур нейронных сетей, которые справляются с теми или иными задачами лучше, чем другие архитектуры.

— Есть ли какая-то принципиальная разница между русским и английским языком?

— Да-да, очень большая.

— Почему?

— В русском языке слова постоянно изменяются, и это большая проблема. В английском языке очень мало окончаний. Ты взял, распарсил текст, получил слова, все они более или менее имеют одну и ту же форму. Так легче обучать нейронные сети. У английского языка меньше параметров, он более структурированный, больше строгих правил. В русском языке больше окончаний и более свободный порядок слов в предложениях. Английский язык для алгоритмов проще.

— Как это, жить в Сан-франциско в 2016 год?

— Сан-Франциско — это интересный город. Все технологии изначально появляются здесь и потом распространяются по всему миру. Сан-Франциско впереди всех остальных городов, и США и не США. Те сервисы, которые появляются в Сан-Франциско и которыми мы начинаем пользоваться прямо сейчас, в основном в мире появляются в течение 3-5 лет.

— Ты говорил про сериал «Кремниевая долина». Насколько он отражает твою реальность?

— Полностью, прям один к одному. Весь тот уровень маразма, который там встречается, присутствует во всех сферах жизни стартапа. Это и переговоры с инвесторами, и управление командой, внутренние конфликты, внешние конфликты, какие-то интересные ситуации, случаи. Этот сериал очень правдоподобен.

Полевые записи Алексея Платонова в Вологодской области — в виде текста, видео и фотографий. Путешествие в провинцию в поисках себя.


Источник: syg.ma

Комментарии: