«Мы не Apple — у нас нет доступа к аппаратной части смартфона»

2017-02-28 17:02

Блог Backchannel опубликовал материал о том, как Facebook развивает и использует искусственный интеллект в своих продуктах — соцсети, мессенджере, а также в Instagram и WhatsApp. За это отвечает подразделение под названием AML — группа прикладного машинного обучения, созданная из бывших сотрудников компании Microsoft.

Начав с системы на основе искусственного интеллекта, способной предсказывать эффективность рекламных кампаний, разработчики AML создали корпоративные инструменты, которые помогают инженерам из других отделов использовать нейросети для своих продуктов. А после скандала с информационными вбросами, которые якобы привели к победе на президентских выборах США Дональда Трампа — алгоритм, который позволяет вычислять подозрительные публикации. Редакция vc.ru публикует адаптированный перевод материала.

Хоакин Кандела

Нынешний глава AML — группы прикладного машинного обучения Facebook — Хоакин Кандела неохотно согласился на эту должность. С 2012 года он занимался внедрением алгоритмов машинного обучения в рекламном отделении компании, после чего спонсорские публикации оказались более релевантными и эффективными.

Во многом это произошло потому, что он побуждал инженеров использовать искусственный интеллект, даже если у них не хватало знаний, и в результате общий уровень подготовки его команды вырос.

Однако он сомневался, удастся ли внедрить искусственный интеллект в масштабах всей соцсети, где коммуникация между сотнями миллионов людей происходит стихийно, в отличие от рекламных объявлений, которые опираются на точные данные.

Тем не менее, Кандела согласился, и в ноябре 2016 года во время нью-йоркской конференции разработчиков заявил, что «теперь Facebook не может обойтись без искусственного интеллекта».

Каждый раз, когда вы открываете Facebook, Instagram или Messenger, то сталкиваетесь с искусственным интеллектом, сами того не подозревая.
— Хоакин Кандела

В Facebook существует несколько подразделений, связанных с искусственным интеллектом — AML (Группа прикладного машинного обучения) и FAIR (Исследовательская группа Facebook в области искусственного интеллекта).

«FAIR недавно возглавил эксперт по нейросетям Янн Лекун. Группа является одним из главных поставщиков новейших технологий в области нейросетей, и все последние улучшения в том, как компьютеры видят, слышат и даже общаются — произошли во многом благодаря ей», — пишет автор Backchannel Стивен Леви.

Задача AML и Канделы — превращать теоретические наработки FAIR и других исследователей в новые продукты Facebook, а также создавать корпоративные инструменты, которые помогали бы инженерам Facebook интегрировать машинное обучение в свою работу.

Коллаборация

Визит Леви в офис Facebook совпал по времени со скандалом вокруг «информационных вбросов», которые якобы привели к победе Дональда Трампа на президентских выборах. «Марк Цукерберг заявил, что это чушь. Его комментарий ворвался в огонь общественного гнева словно грузовик с горючим. Пользователи обвиняли Facebook в том, что соцсеть является соучастником распространения дезинформации», — пишет автор Backchannel.

И хотя спор лежал за пределами компетенции Канделы, он знал, что «дезинформационный кризис» удастся решить только с помощью машинного обучения, и его команде предстоит сыграть в этом свою роль.

«Освобождаясь от представителя PR-одела, который присутствовал во время нашего интервью, Кандела решил показать мне воплощение работы его команды. К моему удивлению, он продемонстрировал приложение, которое превращает фотографии в картины разных художников, имитируя их стиль», — пишет Леви.

«В основе этого приложения лежит нейросеть, которая обучена "перерисовывать" оригинальные фотографии и видео в определенном художественном стиле. Самое удивительное здесь то, что не увидишь глазами: нейросеть создана таким образом, что все расчеты происходят на телефоне пользователя, а не в дата-центрах», — отмечает Кандела.

По словам автора Backchanel, впервые о возможности проведения расчетов нейросетей на смартфонах заявила Apple. Однако для Facebook реализация похожей технологии была сложнее, поскольку компания не может вмешиваться в аппаратную часть iPhone и других мобильных устройств.

«Мы смогли создать нечто похожее благодаря тому, что работа нашей группы носит кумулятивный характер — мы создаем каждый последующий проект быстрее, чем предыдущий. Кроме того, каждый проект создается таким образом, что в будущем инженерам потребуется меньше знаний и навыков, чтобы создавать похожие продукты на основе нейросетей. Чтобы создать это приложение, нам потребовалось всего восемь недель — начиная с момента работы до открытых тестов», — рассказывает Кандела.

Справа налево: Хоакин Кандела, руководитель AML; Манохар Палури, руководитель группы инженеров компьютерного зрения AML; Рита Акино, менеджер по продуктам AML; Раджен Субба, менеджер по проектным работам

Коллаборация — основа корпоративной культуры Facebook — это другой секрет быстрого запуска проектов. «Разные группы компании могут легко обмениваться опытом и знаниями. Инженеры Канделы посоветовались с инженерами из мобильной команды, знакомыми с аппаратной платформой iPhone. Это помогло им отказаться от обработки изображений в дата-центрах Facebook и перенести процесс на пользовательские устройства», — пишет Леви.

Это шаг вперед, который позволит сделать все продукты Facebook еще более мощными. В краткосрочной перспективе он позволит сократить время отклика при переводе с иностранных языков и распознавании текста. В долгосрочной перспективе он может обеспечить анализ в режиме реального времени всего того, что вы видите или говорите.
— Стивен Леви

«Мы говорим о секундах, даже о миллисекундах — вот что значит "в режиме реального времени". Мы же социальная сеть — если я собираюсь предсказать, как люди будут реагировать на ваш контент, моя система должна срабаывать немедленно», — рассуждает Кандела.

По словам руководителя отдела, когда вычисления нейросетей осуществляются на смартфоне, это делает искусственный интеллект общедоступным. «Такие вещи не происходят случайно. Это следствие того, как мы демократизировали искусственный интеллект внутри Facebook. Это был долгий путь», — рассказывает Кандела.

Почему инженеры уходят из Microsoft

Кандела родился в Испании, а затем вместе с семьей переехал в Марокко, где учился во французской языковой школе. И хотя его оценки были одинаково высоки и в точных и в гуманитарных дисциплинах, он решил освоить одну из самых сложных специальностей — телекоммуникационную инженерию. Для этого он отправился в Мадрид и поступил в колледж.

«Его специальность требовала разбираться не только в аппаратной части — антеннах и приемниках — но и в программной, работая с большим массивом данных. Он стал последователем своего преподавателя, который призывал использовать адаптирующиеся системы.

В университете Кандела построил «нейросеть-младенца» — систему, которая использовала «умные» фильтры для улучшения сигнала телефонов в роуминге. В 2000 году он отправился по программе обмена в Данию, где встретился с профессором Карлом Расмуссеном, изучавшим машинное обучение. Кандела окончательно увлекся обучаемыми алгоритмами.

В 2007 году он устроился на работу в Кембриджскую исследовательскую лабораторию Microsoft. «Вскоре после прибытия он узнал, что такое внутренняя конкуренция. Тогда компания собиралась выпустить свою поисковую систему Bing, однако ей требовалось улучшить ключевой компонент поисковой рекламы — систему предсказания количества пользователей, которые могут кликнуть на то или иное объявление», — пишет Леви.

Microsoft организовала внутренний конкурс среди разработчиков. Главным призом для команды, которая предложит лучшее решение, должна была стать путевка на Гавайи. Кандела и его команда победили, однако руководство компании объявило о том, что пока не готово использовать их алгоритм, и необходимо провести дополнительные тесты.

«Кандела не сдался, а вместо этого устроил "крестовый поход безумца", пытаясь уговорить руководство дать ему шанс. Он провел 50 внутренних бесед, создал симулятор, чтобы показать превосходство своего алгоритма и стал преследовать вице-президента компании, который должен был принять финальное решение», — пишет Леви.

Он оказывался рядом с ним в очереди в столовой, подкарауливал у туалета, переехал в свободную ячейку неподалеку от его стола, и неожиданно заходил к нему в офис, споря о том, что обещание было обещанием, и его алгоритм оказался самым лучшим. В 2009 году он добился своего, и его разработка была внедрена в Bing.
— Стивен Леви

В 2012 году Кандела зашел в офис Facebook в Менло-Парк к своему другу, где в итоге провел целый день. «Больше всего его удивило то, что в компании сотрудникам не нужно вымаливать у руководства разрешение на проведение тестов. Если им пришла в голову идея, они берут и тут же тестируют ее», — пишет Леви.

Спустя несколько дней Кандела пошел на собеседование, а в конце недели получил работу в отделе развития рекламных технологий. Его задачей было сделать так, чтобы пользователи видели более релевантные объявления. «И хотя в то время в системе уже использовалось машинное обучение, модели были не самые продвинутые. По правде говоря, они были довольно простыми», — рассказывает он.

Практически одновременно с Хоакином Канделой в Facebook устроился другой инженер из Microsoft — Хуссейн Механна, который сейчас занимает должность директора отдела центрального машинного обучения. Его также удивляло то, что соцсеть не торопится внедрять искусственный интеллект.

«Когда я смотрел на продукты Facebook со стороны, мне казалось, что они уже в неплохой форме, но я заблуждался. Я сказал Хоакину, что Facebook не хватает подходящей, первоклассной платформы для машинного обучения. У нас были машины, но не было программного обеспечения, которое помогало бы машинам учиться как можно скорее с помощью информации, которую генерируют пользователи», — рассказывает он.

«В контексте рекламы, Facebook требовалась система, которая делала бы то, на что не способен ни один человек: давала мгновенные (и точные) прогнозы о том, как много людей кликнет на на то или иное рекламное объявление», — поясняет редактор Backchannel.

Команда Канделы хотела превратить свою систему в платформу, которую могли бы использовать другие инженеры компании из рекламного отдела. Поэтому она создала ее так, что моделирование и обучение искусственного интеллекта может быть универсальным и воспроизводимым.

Один из главных факторов создания системы машинного обучения — это получение качественных данных. И чем их больше, тем лучше. К счастью, это один из главных активов Facebook: когда вашим продуктом пользуются более миллиарда людей, вы ежедневно получаете огромные массивы данных для обучения искусственного интеллекта.
— Стивен Леви

Благодаря этому команда Канделы смогла выпускать новую модель раз в несколько недель, а затем — несколько моделей раз в неделю. По его словам, другие команды тоже убедились, как искусственный интеллект может преобразить соцсеть: «Мы стали невероятно точно предсказывать количество кликов, лайков ответов и других вещей. Поэтому расширение этой идеи оставалось лишь вопросом времени».

В октябре 2015 года руководство Facebook приняло решение о создании Группы прикладного машинного обучения (AML), которую возглавил Хоакин Кандела. «Он поддерживает тесные отношения с Группой исследований в области искусственного интеллекта (FAIR), чьи инженеры бок о бок работают с сотрудниками AML», — пишет Леви.

Итогом сотрудничества стал продукт, который сейчас находится в разработке. Система на основе искусственного интеллекта анализирует фотографии, которые пользователи выкладывают в Facebook, и сопровождает их аудиоописаниями.

За последние несколько лет обучение систем искусственного интеллекта распознавать и давать общее описание изображений стало общей практикой. Например, сделано фото в помещении или снаружи, пишет Леви. «Однако исследователи из FAIR смогли натренировать нейросети так, что они могут выделить все интересные объекты на снимке, сопоставить их друг с другом и описать изображение в целом. Например, по позам и силуэтам нейросеть может сказать, что люди обнимаются, или кто-то катается верхом».

«Мы показали эту технологию парням из AML, — рассказывает руководитель FAIR Янн Лекун. — И они тут же придумали полезный продукт на ее основе». В результате появился прототип функции, которая поможет слепым или людям с нарушениями зрения «увидеть» контент. Для этого им необходимо прикоснуться к фото, а система расскажет им о том, что происходит на снимке.

Система понимания контента

По словам Канделы, работы в области искусственного интеллекта Facebook ведутся в четырех направлениях: это распознавание изображений, языка, речи и видео. В будущем это приведет к созданию «системы понимания контента».

«Это поможет алгоритмам Facebook определять намерения пользователя, читая комментарии, уточнять нюансы, слушая его речь, распознавать лица его друзей на видео, интерпретировать его высказывания и создавать его цифровую личность в виртуальной реальности», — рассказывает Леви.

«Сейчас мы работаем над генерализацией искусственного интеллекта. Количество контента, который нам необходимо проанализировать и понять, превосходит наши возможности», — поясняет Кандела.

По мнению руководителя AML, решение этой проблемы — создание генерализованных систем, при которых завершение одного проекта позволит увеличить производительность и эффективность инженеров, работающих над связанными проектами: «Если я смогу разработать алгоритмы, которые смогут передавать знания, накопленные во время работы над одним проектом — другим проектам — это будет здорово», — рассуждает Кандела.

Это позволит ускорить появление новых функций. Например, в Instagram. В начале 2016 года соцсеть отказалась от отображения фотографий в хронологическом порядке в пользу ранжирования по релевантности. «Хорошая новость заключалась в том, что мы уже внедрили машинное обучение в новостную ленту Facebook, поэтому инженерам Instagram не пришлось начинать все с нуля. Они смогли сделать такой эпохальный сдвиг всего за несколько месяцев», — рассказывает Кандела.

Это касается и новых возможностей соцсети. В качестве примера автор Backchannel приводит сервис под названием «Рекомендации». Около года назад несколько инженеров из отдела распространения контента Facebook обсуждали, что пользователи охотнее верят рекомендациям друзей, чем рекламе, и их доверие к тому или иному заведению будет выше, если его посоветуют знакомые люди. «Нам оставалось только придумать, как сделать так, чтобы пользователь обратил внимание на рекомендации друзей», — рассказывает менеджер по продуктам AML Рита Акино, также перешедшая в Facebook из Microsoft.

Первоначально инженеры отдела распространения пытались сделать это с помощью системы, которая искала совпадения характерных фраз, которые ассоциируются с просьбами дать совет. «Такой подход был не всегда точен, особенно в масштабе, потому что системе приходилось ежедневно сканировать миллиарды публикаций», — рассказывает Акино.

Акино предложила использовать искусственный интеллект и натренировать нейросеть так, чтобы она в режиме реального времени могла распознавать нюансы речи и определять, что именно требуется пользователю и в каком районе. Например — найти обувной магазин в Сан-Франциско.

После этого просьба пользователя отображалась бы на видном месте в новостной ленте его друзей из Сан-Франциско. «Следующий шаг — это натренировать нейросеть так, чтобы она могла вычислять наиболее подходящий вариант среди рекомендаций друзей и отмечать на карте в новостной ленте пользователя, где находится этот магазин», — пишет Леви.

Пользователи ожидают, что наши продукты будут становиться умнее. Другие команды внутри Facebook видят то, что делаем мы — например, «Рекомендации», — смотрят на наш код и спрашивают: «А как нам сделать что-то похожее?».
— Рита Акино

Чтобы и другие команды в Facebook тоже могли использовать функции обработки естественного языка, команда AML разработала внутренний инструмент под названием Deep Text, который используется для функции перевода публикаций на иностранных языках.

Для распознавания и обработки изображений и видео AML разработала платформу под названием Lumos. Стажеры FAIR Манохар Палури и Никил Джори представили ее первый прототип Марку Цукербергу в 2014 году во время внутреннего хакатона Facebook.

«Когда Кандела стал главой AML, он назначил Палури руководителем группы инженеров компьютерного зрения, поручив разработку Lumos. Закончив работы над платформой, AML открыла доступ для инженеров из других продуктов Facebook — Instagram, Messenger, WhatsApp и Oculus», — пишет Леви.

По словам Палури, благодаря Lumos «любой разработчик в компании может использовать возможности нейросетей, создавать модели для разных сценариев и наблюдать за их работой». Сейчас для контроля правильности работы нейросети и для ее обучения требуется человек, но в дальнейшем AML собирается создать автономную систему.

В качестве примера Палури продемонстрировал работу Lumos и процесс тренировки нейросети. «Он дал системе задачу — найти в Facebook пользовательские фото, где изображены вертолеты. Нейросеть нашла пять тысяч снимков, однако на некоторых были игрушечные вертолеты, или похожие предметы. Именно для этого и требуется контроль человека — отметить неподходящие снимки, чтобы в будущем нейросеть отображала более релевантные изображения в этой категории», — рассказывает Леви.

Наша цель — сократить количество правок со стороны человека в 100 раз к 2018 году
— Манохар Палури

В долгосрочной перспективе Facebook планирует объединить виуальную платформу и платформу для распознавания естественного языка, чтобы создать генерализованную «систему понимания контента», о которой говорил Кандела. «Я не сомневаюсь, что в конце концов нам это удастся. Тогда у нас получится просто кортекс», — рассуждает Палури.

Представители Facebook надеются, что в конечном счете технологии машинного обучения распространятся в другие сферы. «Представьте, какое влияние это окажет на медицину, безопасность и транспорт. Я думаю, что благодаря нашим платформам скорость создания приложений в этих сферах увеличится в сотни раз», — рассказывает Хуссейн Механна.

Машинное обучение и новостная лента

По словам главы Facebook Марка Цукерберга, миссия соцсети — содействие распространению общественного блага. «В своем манифесте о создании сообществ он как минимум семь раз упомянул искусственный интеллект и оценил его высокую роль для сохранения и информированности сообществ», — пишет Леви.

Даже машинное обучение не может решить все проблемы людей, которые возникают, когда твой продукт становится главным источником информации и создания личных связей для миллиарда пользователей. Поэтому Facebook постоянно возится с алгоритмами, которые определяют, что именно увидят люди в своих новостных лентах.
— Стивен Леви

«На мой взгляд, пока что это неразрешимая проблема. Если мы будем отображать случайные новости из разных источников — пользователи будут терять большую часть времени. Если будем показывать новости только из одного источника — победитель получит все внимание. Можно до бесконечности обсуждать проблему, но ни одна из этих крайностей нам не походит. С помощью машинного обучения мы пытаемся найти оптимальный вариант», — рассказывает Кандела.

Когда Facebook оказался в центре скандала, связанного с распространением неправдивых новостей в лентах пользователей, руководство соцсети дало задание своим командам, связанным с разработкой в области искусственного интеллекта, разработать такой инструмент, чтобы очистить Facebook от информационных вбросов.

В результате команда FAIR представила модель под названием World2Vec (не стоит путать с продуктом Google Word2Vec), которая наделяет нейросети «памятью». «Это помогает Facebook помечать каждую публикацию, указывая ее источник, а также пользователи, которые ей поделились. В результате нейросеть тренируется находить шаблоны распространения, свойственные информационным вбросам», — пишет Леви.

Оказалось, что процесс поиска информационных вбросов ничем не отличается от поиска для пользователя самых интересных страниц
— Янн Лекун

Благодаря ранее созданным платформам Кандела и его команда смогли быстрее разработать сервисы для очистки Facebook. «Будут ли они эффективными, или нет — это вопрос времени. Пока что Facebook не готова опубликовать данные об эффективности работы алгоритма по борьбе с информационными вбросами», — заключает Леви.

Присылайте свои колонки о том, как изменится наш мир, на future@vc.ru.

Телеграм: t.me/ainewsline

Источник: vc.ru

«Мы не Apple — у нас нет доступа к аппаратной части смартфона»

Комментарии: