«Мы не Apple — у нас нет доступа к аппаратной части смартфона» |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2017-02-28 17:02 Блог Backchannel опубликовал материал о том, как Facebook развивает и использует искусственный интеллект в своих продуктах — соцсети, мессенджере, а также в Instagram и WhatsApp. За это отвечает подразделение под названием AML — группа прикладного машинного обучения, созданная из бывших сотрудников компании Microsoft. Начав с системы на основе искусственного интеллекта, способной предсказывать эффективность рекламных кампаний, разработчики AML создали корпоративные инструменты, которые помогают инженерам из других отделов использовать нейросети для своих продуктов. А после скандала с информационными вбросами, которые якобы привели к победе на президентских выборах США Дональда Трампа — алгоритм, который позволяет вычислять подозрительные публикации. Редакция vc.ru публикует адаптированный перевод материала. Хоакин Кандела Нынешний глава AML — группы прикладного машинного обучения Facebook — Хоакин Кандела неохотно согласился на эту должность. С 2012 года он занимался внедрением алгоритмов машинного обучения в рекламном отделении компании, после чего спонсорские публикации оказались более релевантными и эффективными. Во многом это произошло потому, что он побуждал инженеров использовать искусственный интеллект, даже если у них не хватало знаний, и в результате общий уровень подготовки его команды вырос. Однако он сомневался, удастся ли внедрить искусственный интеллект в масштабах всей соцсети, где коммуникация между сотнями миллионов людей происходит стихийно, в отличие от рекламных объявлений, которые опираются на точные данные. Тем не менее, Кандела согласился, и в ноябре 2016 года во время нью-йоркской конференции разработчиков заявил, что «теперь Facebook не может обойтись без искусственного интеллекта».
В Facebook существует несколько подразделений, связанных с искусственным интеллектом — AML (Группа прикладного машинного обучения) и FAIR (Исследовательская группа Facebook в области искусственного интеллекта). «FAIR недавно возглавил эксперт по нейросетям Янн Лекун. Группа является одним из главных поставщиков новейших технологий в области нейросетей, и все последние улучшения в том, как компьютеры видят, слышат и даже общаются — произошли во многом благодаря ей», — пишет автор Backchannel Стивен Леви. Задача AML и Канделы — превращать теоретические наработки FAIR и других исследователей в новые продукты Facebook, а также создавать корпоративные инструменты, которые помогали бы инженерам Facebook интегрировать машинное обучение в свою работу. Коллаборация Визит Леви в офис Facebook совпал по времени со скандалом вокруг «информационных вбросов», которые якобы привели к победе Дональда Трампа на президентских выборах. «Марк Цукерберг заявил, что это чушь. Его комментарий ворвался в огонь общественного гнева словно грузовик с горючим. Пользователи обвиняли Facebook в том, что соцсеть является соучастником распространения дезинформации», — пишет автор Backchannel. И хотя спор лежал за пределами компетенции Канделы, он знал, что «дезинформационный кризис» удастся решить только с помощью машинного обучения, и его команде предстоит сыграть в этом свою роль. «Освобождаясь от представителя PR-одела, который присутствовал во время нашего интервью, Кандела решил показать мне воплощение работы его команды. К моему удивлению, он продемонстрировал приложение, которое превращает фотографии в картины разных художников, имитируя их стиль», — пишет Леви. «В основе этого приложения лежит нейросеть, которая обучена "перерисовывать" оригинальные фотографии и видео в определенном художественном стиле. Самое удивительное здесь то, что не увидишь глазами: нейросеть создана таким образом, что все расчеты происходят на телефоне пользователя, а не в дата-центрах», — отмечает Кандела. По словам автора Backchanel, впервые о возможности проведения расчетов нейросетей на смартфонах заявила Apple. Однако для Facebook реализация похожей технологии была сложнее, поскольку компания не может вмешиваться в аппаратную часть iPhone и других мобильных устройств. «Мы смогли создать нечто похожее благодаря тому, что работа нашей группы носит кумулятивный характер — мы создаем каждый последующий проект быстрее, чем предыдущий. Кроме того, каждый проект создается таким образом, что в будущем инженерам потребуется меньше знаний и навыков, чтобы создавать похожие продукты на основе нейросетей. Чтобы создать это приложение, нам потребовалось всего восемь недель — начиная с момента работы до открытых тестов», — рассказывает Кандела. Справа налево: Хоакин Кандела, руководитель AML; Манохар Палури, руководитель группы инженеров компьютерного зрения AML; Рита Акино, менеджер по продуктам AML; Раджен Субба, менеджер по проектным работам Коллаборация — основа корпоративной культуры Facebook — это другой секрет быстрого запуска проектов. «Разные группы компании могут легко обмениваться опытом и знаниями. Инженеры Канделы посоветовались с инженерами из мобильной команды, знакомыми с аппаратной платформой iPhone. Это помогло им отказаться от обработки изображений в дата-центрах Facebook и перенести процесс на пользовательские устройства», — пишет Леви.
«Мы говорим о секундах, даже о миллисекундах — вот что значит "в режиме реального времени". Мы же социальная сеть — если я собираюсь предсказать, как люди будут реагировать на ваш контент, моя система должна срабаывать немедленно», — рассуждает Кандела. По словам руководителя отдела, когда вычисления нейросетей осуществляются на смартфоне, это делает искусственный интеллект общедоступным. «Такие вещи не происходят случайно. Это следствие того, как мы демократизировали искусственный интеллект внутри Facebook. Это был долгий путь», — рассказывает Кандела. Почему инженеры уходят из Microsoft Кандела родился в Испании, а затем вместе с семьей переехал в Марокко, где учился во французской языковой школе. И хотя его оценки были одинаково высоки и в точных и в гуманитарных дисциплинах, он решил освоить одну из самых сложных специальностей — телекоммуникационную инженерию. Для этого он отправился в Мадрид и поступил в колледж. «Его специальность требовала разбираться не только в аппаратной части — антеннах и приемниках — но и в программной, работая с большим массивом данных. Он стал последователем своего преподавателя, который призывал использовать адаптирующиеся системы. В университете Кандела построил «нейросеть-младенца» — систему, которая использовала «умные» фильтры для улучшения сигнала телефонов в роуминге. В 2000 году он отправился по программе обмена в Данию, где встретился с профессором Карлом Расмуссеном, изучавшим машинное обучение. Кандела окончательно увлекся обучаемыми алгоритмами. В 2007 году он устроился на работу в Кембриджскую исследовательскую лабораторию Microsoft. «Вскоре после прибытия он узнал, что такое внутренняя конкуренция. Тогда компания собиралась выпустить свою поисковую систему Bing, однако ей требовалось улучшить ключевой компонент поисковой рекламы — систему предсказания количества пользователей, которые могут кликнуть на то или иное объявление», — пишет Леви. Microsoft организовала внутренний конкурс среди разработчиков. Главным призом для команды, которая предложит лучшее решение, должна была стать путевка на Гавайи. Кандела и его команда победили, однако руководство компании объявило о том, что пока не готово использовать их алгоритм, и необходимо провести дополнительные тесты. «Кандела не сдался, а вместо этого устроил "крестовый поход безумца", пытаясь уговорить руководство дать ему шанс. Он провел 50 внутренних бесед, создал симулятор, чтобы показать превосходство своего алгоритма и стал преследовать вице-президента компании, который должен был принять финальное решение», — пишет Леви.
В 2012 году Кандела зашел в офис Facebook в Менло-Парк к своему другу, где в итоге провел целый день. «Больше всего его удивило то, что в компании сотрудникам не нужно вымаливать у руководства разрешение на проведение тестов. Если им пришла в голову идея, они берут и тут же тестируют ее», — пишет Леви. Спустя несколько дней Кандела пошел на собеседование, а в конце недели получил работу в отделе развития рекламных технологий. Его задачей было сделать так, чтобы пользователи видели более релевантные объявления. «И хотя в то время в системе уже использовалось машинное обучение, модели были не самые продвинутые. По правде говоря, они были довольно простыми», — рассказывает он. Практически одновременно с Хоакином Канделой в Facebook устроился другой инженер из Microsoft — Хуссейн Механна, который сейчас занимает должность директора отдела центрального машинного обучения. Его также удивляло то, что соцсеть не торопится внедрять искусственный интеллект. «Когда я смотрел на продукты Facebook со стороны, мне казалось, что они уже в неплохой форме, но я заблуждался. Я сказал Хоакину, что Facebook не хватает подходящей, первоклассной платформы для машинного обучения. У нас были машины, но не было программного обеспечения, которое помогало бы машинам учиться как можно скорее с помощью информации, которую генерируют пользователи», — рассказывает он. «В контексте рекламы, Facebook требовалась система, которая делала бы то, на что не способен ни один человек: давала мгновенные (и точные) прогнозы о том, как много людей кликнет на на то или иное рекламное объявление», — поясняет редактор Backchannel. Команда Канделы хотела превратить свою систему в платформу, которую могли бы использовать другие инженеры компании из рекламного отдела. Поэтому она создала ее так, что моделирование и обучение искусственного интеллекта может быть универсальным и воспроизводимым.
Благодаря этому команда Канделы смогла выпускать новую модель раз в несколько недель, а затем — несколько моделей раз в неделю. По его словам, другие команды тоже убедились, как искусственный интеллект может преобразить соцсеть: «Мы стали невероятно точно предсказывать количество кликов, лайков ответов и других вещей. Поэтому расширение этой идеи оставалось лишь вопросом времени». В октябре 2015 года руководство Facebook приняло решение о создании Группы прикладного машинного обучения (AML), которую возглавил Хоакин Кандела. «Он поддерживает тесные отношения с Группой исследований в области искусственного интеллекта (FAIR), чьи инженеры бок о бок работают с сотрудниками AML», — пишет Леви. Итогом сотрудничества стал продукт, который сейчас находится в разработке. Система на основе искусственного интеллекта анализирует фотографии, которые пользователи выкладывают в Facebook, и сопровождает их аудиоописаниями. За последние несколько лет обучение систем искусственного интеллекта распознавать и давать общее описание изображений стало общей практикой. Например, сделано фото в помещении или снаружи, пишет Леви. «Однако исследователи из FAIR смогли натренировать нейросети так, что они могут выделить все интересные объекты на снимке, сопоставить их друг с другом и описать изображение в целом. Например, по позам и силуэтам нейросеть может сказать, что люди обнимаются, или кто-то катается верхом». «Мы показали эту технологию парням из AML, — рассказывает руководитель FAIR Янн Лекун. — И они тут же придумали полезный продукт на ее основе». В результате появился прототип функции, которая поможет слепым или людям с нарушениями зрения «увидеть» контент. Для этого им необходимо прикоснуться к фото, а система расскажет им о том, что происходит на снимке. Система понимания контента По словам Канделы, работы в области искусственного интеллекта Facebook ведутся в четырех направлениях: это распознавание изображений, языка, речи и видео. В будущем это приведет к созданию «системы понимания контента». «Это поможет алгоритмам Facebook определять намерения пользователя, читая комментарии, уточнять нюансы, слушая его речь, распознавать лица его друзей на видео, интерпретировать его высказывания и создавать его цифровую личность в виртуальной реальности», — рассказывает Леви. «Сейчас мы работаем над генерализацией искусственного интеллекта. Количество контента, который нам необходимо проанализировать и понять, превосходит наши возможности», — поясняет Кандела. По мнению руководителя AML, решение этой проблемы — создание генерализованных систем, при которых завершение одного проекта позволит увеличить производительность и эффективность инженеров, работающих над связанными проектами: «Если я смогу разработать алгоритмы, которые смогут передавать знания, накопленные во время работы над одним проектом — другим проектам — это будет здорово», — рассуждает Кандела. Это позволит ускорить появление новых функций. Например, в Instagram. В начале 2016 года соцсеть отказалась от отображения фотографий в хронологическом порядке в пользу ранжирования по релевантности. «Хорошая новость заключалась в том, что мы уже внедрили машинное обучение в новостную ленту Facebook, поэтому инженерам Instagram не пришлось начинать все с нуля. Они смогли сделать такой эпохальный сдвиг всего за несколько месяцев», — рассказывает Кандела. Это касается и новых возможностей соцсети. В качестве примера автор Backchannel приводит сервис под названием «Рекомендации». Около года назад несколько инженеров из отдела распространения контента Facebook обсуждали, что пользователи охотнее верят рекомендациям друзей, чем рекламе, и их доверие к тому или иному заведению будет выше, если его посоветуют знакомые люди. «Нам оставалось только придумать, как сделать так, чтобы пользователь обратил внимание на рекомендации друзей», — рассказывает менеджер по продуктам AML Рита Акино, также перешедшая в Facebook из Microsoft. Первоначально инженеры отдела распространения пытались сделать это с помощью системы, которая искала совпадения характерных фраз, которые ассоциируются с просьбами дать совет. «Такой подход был не всегда точен, особенно в масштабе, потому что системе приходилось ежедневно сканировать миллиарды публикаций», — рассказывает Акино. Акино предложила использовать искусственный интеллект и натренировать нейросеть так, чтобы она в режиме реального времени могла распознавать нюансы речи и определять, что именно требуется пользователю и в каком районе. Например — найти обувной магазин в Сан-Франциско. После этого просьба пользователя отображалась бы на видном месте в новостной ленте его друзей из Сан-Франциско. «Следующий шаг — это натренировать нейросеть так, чтобы она могла вычислять наиболее подходящий вариант среди рекомендаций друзей и отмечать на карте в новостной ленте пользователя, где находится этот магазин», — пишет Леви.
Чтобы и другие команды в Facebook тоже могли использовать функции обработки естественного языка, команда AML разработала внутренний инструмент под названием Deep Text, который используется для функции перевода публикаций на иностранных языках. Для распознавания и обработки изображений и видео AML разработала платформу под названием Lumos. Стажеры FAIR Манохар Палури и Никил Джори представили ее первый прототип Марку Цукербергу в 2014 году во время внутреннего хакатона Facebook. «Когда Кандела стал главой AML, он назначил Палури руководителем группы инженеров компьютерного зрения, поручив разработку Lumos. Закончив работы над платформой, AML открыла доступ для инженеров из других продуктов Facebook — Instagram, Messenger, WhatsApp и Oculus», — пишет Леви. По словам Палури, благодаря Lumos «любой разработчик в компании может использовать возможности нейросетей, создавать модели для разных сценариев и наблюдать за их работой». Сейчас для контроля правильности работы нейросети и для ее обучения требуется человек, но в дальнейшем AML собирается создать автономную систему. В качестве примера Палури продемонстрировал работу Lumos и процесс тренировки нейросети. «Он дал системе задачу — найти в Facebook пользовательские фото, где изображены вертолеты. Нейросеть нашла пять тысяч снимков, однако на некоторых были игрушечные вертолеты, или похожие предметы. Именно для этого и требуется контроль человека — отметить неподходящие снимки, чтобы в будущем нейросеть отображала более релевантные изображения в этой категории», — рассказывает Леви.
В долгосрочной перспективе Facebook планирует объединить виуальную платформу и платформу для распознавания естественного языка, чтобы создать генерализованную «систему понимания контента», о которой говорил Кандела. «Я не сомневаюсь, что в конце концов нам это удастся. Тогда у нас получится просто кортекс», — рассуждает Палури. Представители Facebook надеются, что в конечном счете технологии машинного обучения распространятся в другие сферы. «Представьте, какое влияние это окажет на медицину, безопасность и транспорт. Я думаю, что благодаря нашим платформам скорость создания приложений в этих сферах увеличится в сотни раз», — рассказывает Хуссейн Механна. Машинное обучение и новостная лента По словам главы Facebook Марка Цукерберга, миссия соцсети — содействие распространению общественного блага. «В своем манифесте о создании сообществ он как минимум семь раз упомянул искусственный интеллект и оценил его высокую роль для сохранения и информированности сообществ», — пишет Леви.
«На мой взгляд, пока что это неразрешимая проблема. Если мы будем отображать случайные новости из разных источников — пользователи будут терять большую часть времени. Если будем показывать новости только из одного источника — победитель получит все внимание. Можно до бесконечности обсуждать проблему, но ни одна из этих крайностей нам не походит. С помощью машинного обучения мы пытаемся найти оптимальный вариант», — рассказывает Кандела. Когда Facebook оказался в центре скандала, связанного с распространением неправдивых новостей в лентах пользователей, руководство соцсети дало задание своим командам, связанным с разработкой в области искусственного интеллекта, разработать такой инструмент, чтобы очистить Facebook от информационных вбросов. В результате команда FAIR представила модель под названием World2Vec (не стоит путать с продуктом Google Word2Vec), которая наделяет нейросети «памятью». «Это помогает Facebook помечать каждую публикацию, указывая ее источник, а также пользователи, которые ей поделились. В результате нейросеть тренируется находить шаблоны распространения, свойственные информационным вбросам», — пишет Леви.
Благодаря ранее созданным платформам Кандела и его команда смогли быстрее разработать сервисы для очистки Facebook. «Будут ли они эффективными, или нет — это вопрос времени. Пока что Facebook не готова опубликовать данные об эффективности работы алгоритма по борьбе с информационными вбросами», — заключает Леви. Присылайте свои колонки о том, как изменится наш мир, на future@vc.ru. Источник: vc.ru Комментарии: |
|