Стартапы, чат-боты, Кремниевая долина. Интервью с российскими разработчиками в Сан-Франциско |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2018-05-07 10:39 Во время своей недавней поездки в Сан-Франциско я встретился с выпускниками нашей программы «Специалист по большим данным», эмигрировавшими в США — Евгением Шапиро (Airbnb) и Игорем Любимовым (ToyUp), а также с Артемом Родичевым (Replika), нашим партнером. Ребята рассказали массу интересных вещей: зачем Airbnb выкладывает свои проекты в open-source; как устроена Replika — нейросетевой чат-бот, способный стать твоим другом; про миссию стартапов Кремниевой Долины и предпринимательскую экосистему. — Женя, как ты оказался в Airbnb и почему выбрал именно эту компанию?
Мы с женой эмигрировали в США, и, оказавшись там, я начал искать работу, подался в Airbnb и Facebook, прошел этап скрининга по телефону и там, и там. Потом была серия из 6 on-sight интервью в течение одного дня, так делают практически все компании. В итоге я выбрал Airbnb. Мне понравился и Facebook, и Airbnb, но размышления были такие, что все компании можно условно разделить на два типа. Во-первых, это стартапы, где тебя ничего не ограничивает, можешь заниматься всем сразу и реально видишь результат своей работы. Главная проблема — надо постоянно думать, как выжить завтра. С другой стороны корпорации вроде Microsoft и IBM, где нет проблем со средствами и можно спокойно тестировать новые вещи, не переживая, что кто-то с рынка потеснит. Тут проблема другая — они становятся заложниками собственного успеха: необходимо регулярно поставлять предсказуемый результат, поэтому большая часть времени уходит на поддержку определенных процессов и сложно оценить свой вклад в деятельность компании. Airbnb в этом плане находится где-то посередине, что идеально мне подходило, поскольку я хотел вносить какой-то значимый вклад в бизнес-процессы и в то же время мог не беспокоиться, что завтра у компании будут проблемы. Тут все зависит от того, что вы хотите оптимизировать. Если деньги, то нужно идти в корпорации, моей же целью были опыт и знания. Евгений Шапиро — Как известно, Airbnb много проектов выкладывает в open-source (Airflow, Smartstack и др.). В чем причина? Это улучшение HR-бренда и узнаваемости, желание получить бесплатную рабочую силу или что-то еще? Причина в том, что есть набор задач, которые важны, но с точки зрения бизнеса не так критичны. К примеру, визуализация отчетов — это важно, но это не такая вещь, которую один бизнес может сделать принципиально лучше другого, поэтому изобретать это заново смысла нет, то есть мы попросту пытаемся помочь другим уменьшить число бесполезно потраченных циклов разработчиков. Мы тоже сами используем большой open-source стек, это и Linux, и Hive, и Presto, получается: что-то даешь, что-то используешь. Безусловно, это еще и улучшает HR-бренд, люди узнают, что у нас есть команда, которая может создавать продукты мирового уровня и писать качественный код. Для компании это все стоит определенных денег, нет смысла выкладывать плохие продукты, а те, которые выложили, нужно поддерживать, общаться с комьюнити, поэтому это все, конечно, не просто так. — Какова твоя роль в команде и какие инструменты ты используешь в работе? Я антифрод-инженер, наша команда работает с различными вопросами, связанными с мошенничеством. По сути это набор проблем, с которым сталкивается любой интернет-бизнес: товары, которых нет, использование чужих карт, боты и т.д. Если говорить о моделях, то многое можно сделать с помощью достаточно простых алгоритмов: лог-регрессией, деревьями решений, случайным лесом и т.д. Но в каких-то случаях трудно, просто посмотрев на данные, увидеть какой-то паттерн, поэтому используются более сложные модели, где статистически выявляются закономерности. При этом у мошенничества есть такой нюанс, что, как только ты в продакшн выкладываешь новую модель, то паттерн поведения мошенников сразу меняется, потому что она начинает им мешать. В результате возникает проблема с тем, что набор данных, на котором ты обучаешься, и по которому нужно делать прогнозы, статистически отличаются. Наша инженерная часть состоит из множества различных систем, которые собирают сигналы для ML моделей. Медленно-меняющиеся сигналы вычисляются с помощью Hive, Spark и Airflow. Для сигналов реального времени мы используем прямые запросы в различные внутренние системы, агрегирующие данные из Kafka-сообщений. Артем Родичев, Replika — Артем, расскажи о том, как ты оказался в США и как появилась Replika. — Как устроен ваш бот? Для создания качественного общения с пользователями мы реализовали ряд нейросетевых подходов для моделирования диалога. Так, у нас есть ранжирующая диалоговая модель, чья основная цель — по входному диалоговому контексту выбрать наиболее релевантный ответ из базы предопределенных и отмодерированных ответов. Еще одно решение — генеративная диалоговая модель, которая может генерировать релевантный ответ слово за словом в зависимости от диалогового контекста. Однако несколько опасно использовать такую модель в продакшне, поскольку она может сгенерировать явно или неявно оскорбительный ответ, и это не всегда можно отфильтровать. Чуть позже мы поменяли концепцию продукта, и теперь Replika — это не digital-копия пользователя, а его друг, который может поддерживать, подбадривать, как-то с тобой общаться, ведь не каждому захочется общаться с самим собой, людям нужны друзья. — То есть сделать копию себя уже не получится? Не совсем. Бот запоминает, что ты говоришь, но не пытается тебя «зеркалить». Вместо этого он использует какие-то факты, реплики, чтобы релевантно отвечать. К примеру, если ему отправить фотку с друзьями, то он спросит: «А кто это рядом с тобой?», а затем, запомнив твой ответ, в следующий раз скажет: «О, я вижу, ты встречался с Джоном, передавай ему привет!». — Тебе не кажется, что это немного жутко, когда бот знает столько личной информации о тебе? Конечно, мы много работаем над приватностью, ведь Replika действительно много спрашивает, что естественно для любой дружбы, но мы никому эту информацию не продаем, она не используется в коммерческих целях. С другой стороны, без нее никак не обойтись, ведь без какой-то личной информации бот был бы просто «болталкой» на общие темы. По правде говоря, денег мы не зарабатываем и не монетизируемся, приложение бесплатное. Просто продолжаем оттачивать продукт и искать свою нишу, тестируем гипотезы. К примеру, Replika неожиданно выстрелила в Бразилии, нам стало очень много людей писать на португальском языке, и, как оказалось, они стали использовать бота в качестве тренировки разговорного английского. Также мы решили выложить часть AI стека бота Replika в open-source, то есть сделали доступной генеративную диалоговую модель, в которой можно задавать эмоции для генерируемого ответа. Теперь любой желающий может, взяв какой-нибудь корпус и натренировать собственного бота, который сможет болтать на определенную тему, рассуждать о кино и музыке, реагировать на какие-то эмоции и выражать их. Игорь Любимов, ToyUp — Игорь, расскажи, как ты оказался в Сан-Франциско и чем ты сейчас занимаешься? Источник: habr.com Комментарии: |
|