Что мы знаем о ранжировании в Instagram

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Cооснователь сервиса One Million Likes Александр Полторацкий написал для vc.ru статью о теории ранжирования в Instagram, которую он вывел, основываясь на истории развития алгоритмов Facebook и Instagram, а также на выступлениях и статьях их инженеров.

See the Moments You Care About First

15 марта 2016 года Instagram объявил об изменении принципа формировании ленты публикаций. Показ фото и видео стал базироваться на новом алгоритме, определяющем заинтересованность в содержании публикации на основании отношений пользователя с автором записи или компанией и времени публикации.

К сожалению, Instagram забыл сообщить нам, как работает новое ранжирование, поэтому мы решили обратиться к истории развития алгоритмов Facebook и Instagram и эпизодическим выступлениям и статьям их инженеров, чтобы собрать все доступные факты и теории в одной статье.


Серкан Пиантино, автор алгоритма EdgeRank

EdgeRank

В 2009 году Facebook ввел алгоритм EdgeRank (автор алгоритма — Серкан Пиантино), ставший первой попыткой сортировать контент пользователей по релевантности. Алгоритм разработали в ответ на увеличение количества публикаций с низким качеством — в то время Facebook заполонили картинки с котиками и публикации с кликбейтными заголовками, которые собирали много лайков, но не представляли релевантное и важное содержание.

Изначально алгоритм ранжирования ленты Facebook использовал три параметра.

  • User Affinity — «близость пользователей»: контент более релевантен для тех, с кем вы переписывались и на чьи публикации реагировали. Чем больше вы взаимодействовали с пользователем, тем чаще он будет видеть ваши новые публикации.
  • Content Weight — «значимость контента»: Facebook учитывает как минимум два субпараметра: вес реакции (комментарии, участие в дискуссиях и сообщения на стене важнее, чем простые лайки) и содержимое контента (простой текст ранжируется хуже, чем заметка со ссылкой, изображением или видео).
  • Time-Based Decay Parameter — «хронологическая актуальность контента»: Facebook отслеживает реакцию пользователей на новые публикации и ухудшает ранжирование для тех публикаций, на которые никто не реагирует. Соцсеть предполагает, что если контент не получил отклика в ближайшее время после публикации, следовательно он неинтересен и навряд ли получит отклик позже.

В 2013 году Ларс Бакстром, техлид по ранжированию ленты Facebook, заявил, что алгоритм соцсети использует более 100 тысяч параметров для ранжирования и все они одинаково важны. Тем не менее алгоритм EdgeRank (уже как идея) до сих пор остается базовым.

Кстати, в том же 2013 году Facebook добавил еще два важных параметра, которые базировались на вовлечении и напрямую влияли на релевантность ленты новостей:

  • Story Bumping — Facebook показывает не только новые публикации, но и старые публикации ваших друзей или публикации по релевантным темам, если они могут быть важны для вас.
  • Last Actor — для ранжирования ленты используется «ускользающая» хронология взаимодействий: Facebook оценивает релевантность вашей ленты на основании последних 50 взаимодействий. Более старые взаимодействия тоже учитываются, но их вес с течением времени снижается.

Мы пытались найти информацию о параметрах, влияющих на показ ленты Facebook (и, соответственно, новой ленты Instagram) и наткнулись на большой список факторов EdgeRank, охватывающих период с 2014 года по 2016 год. Вот те, которые теоретически мог бы использовать и Instagram:

Какие параметры увеличивают органический охват:

  • Большое количество лайков.
  • Большое количество комментариев.
  • Комментарии, содержащие упоминания друзей.
  • Общение с администраторами страницы в комментариях.
  • Большое количество взаимодействий сразу после публикации контента.
  • Высокая степень взаимодействия ваших подписчиков с вашим контентом.
  • Хорошо заполненный профиль.
  • Использование Stories.

Какие параметры снижают органический охват:

  • Сверхвысокое количество взаимодействий по сравнению с обычным уровнем («лайкбейт»).
  • Контент, имеющий явно рекламный характер (призывы к покупке или установке приложения, акции и розыгрыши).
  • Текст публикации, который уже публиковался ранее (включая повтор в рекламных публикациях).
  • Сообщения, определенные как мемы с помощью алгоритма визуального анализа.
  • Сообщения, содержащие слова «лайк» и «комментарий», включая формы слов.


Майк Кригер, технический директор и сооснователь Instagram

Анализ трендов в Instagram

6 июля 2015 года в блоге разработчиков Instagram опубликовали заметку о работе команды соцсети над определением трендовых публикаций. Шансы на использование тех же параметров для ранжирования ленты малы, но ключевые алгоритмы соцсети могут дублировать друг друга и использоваться в схожих механизмах определения популярности. Разработчики трендинга выделили три ключевых параметра:

  • Popularity — «популярность»: тренд должен представлять интерес для многих людей.
  • Novelty — «новизна»: люди не должны были говорить об этом тренде раньше либо говорили о нем с меньшей интенсивностью.
  • Timeliness — «своевременность»: событие должно освещаться в Instagram в реальном времени с офлайн-событием.

В алгоритме трендинга нас может заинтересовать механизм определения популярности. Instagram хранит отдельный счетчик для каждого хэштега и геолокации, который хранит информацию о том, сколько пользователей делились этим хэштегом или местом в каждом пятиминутном периоде в течение последних семи дней. Этот механизм напоминает Time-Based Decay Parameter в Facebook. Можно предположить, что Instagram мог взять на заметку подобный алгоритм и для определения релевантности публикации в алгоритмической ленте.


Томас Димсон, главный по ранжированию в Instagram

Machine Learning @Scale

2 февраля 2017 года произошло интересное событие — на площадке Facebook в рамках конференции Machine Learning @Scale с докладом о процессе проектирования и реализации алгоритма формирования ленты Instagram выступил Томас Димсон, техлид команды ранжирования. Он акцентировал внимание на ключевых параметрах, с помощью которых организуется последовательность отображения новостей в ленте.

Ранее в хронологической ленте пользователи Instagram не видели приблизительно 70% интересующего их контента. Для решения этой проблемы было необходимо либо заставить людей подписываться на меньшее число пользователей, чтобы они всегда видели подходящий им контент, либо внедрить алгоритм, выделяющий контент, который был бы максимально интересен для них.

Соцсеть сфокусировалась на втором варианте и начала использовать связи между пользователями в качестве индикатора интереса: близким для вас пользователям (тем, с которыми у вас есть социальные связи и взаимодействия) будет отдан приоритет, и их публикации будут размещены выше в ленте.

Критерии, которые использует Instagram, чтобы определить актуальность и решить, какие публикации будут отображаться выше в вашей ленте:

  • Люди, чей контент вам интересен и который вы лайкали и комментировали.
  • Люди, к кому вы обращаетесь напрямую с помощью Direct и, возможно, комментариев и упоминаний.
  • Люди, которых вы искали (да, на ранжирование влияет даже поиск в Instagram).
  • Люди, с которыми вы знакомы в реальной жизни — используется социальный граф Facebook.

Трудно сказать, как сейчас оценивается каждый из этих параметров, но это те самые критерии, которые Instagram учитывал на этапе разработки, и, скорее всего, те же, которые используются и по сей день.


Как с этим жить

Можно сделать простой вывод: Instagram явно наследует алгоритмы Facebook для ранжирования ленты. И самые важные факторы для ранжирования — привлекательность публикаций (и, как следствие, хорошее вовлечение ваших подписчиков), общение с ними и социальный граф Facebook, определяющий степень вашей связи.

И вот, что вы можете попробовать сделать для увеличения органического охвата:

Свяжите ваш аккаунт с Facebook

Это поможет Facebook использовать ваши социальные связи.

Работайте над улучшением контента

Чем лучше будет ваш контент, тем больше вашей аудитории вы сможете вовлечь в оценку и комментирование. Существует множество способов побудить аудиторию к активным действиям: вопросы, провокации, просьба поделиться своими историями по какой-либо теме. Комментарии и, скорее всего, переписки в Direct имеют больший вес, чем лайки.

В этом случае показателен пример работы городских пабликов, которые одновременно вовлекают аудиторию и повышают уровень взаимодействий в Direct с помощью предложения присылать свой контент для публикации.

Заставьте вашу аудиторию общаться с вами

Важны не те, кому вы пишете, а те, кто пишет вам. Старайтесь вовлечь подписчиков в дискуссии, предлагайте им упоминать их друзей в комментариях и делиться вашими публикациями с друзьями, увеличивайте долю общения в Direct вместо использования мессенджеров WhatsApp или Viber. Обратите внимание, что использование большого количества упоминаний (например, с помощью автоматизации) может очень сильно снизить релевантность вашего контента.

Работайте над текстами

Чем интереснее и оригинальнее будет текст в ваших публикациях, тем интереснее будет выглядеть ваш аккаунт для подписчиков и тем легче будет его найти.

Делайте «нативную» рекламу

Не используйте прямые рекламные призывы к покупке и заказу, не используйте лайкбейт (призывы залайкать или прокомментировать публикацию) — все это может уменьшить охват.

Блокируйте неактивных подписчиков

Чем меньше у вас будет неактивной аудитории, тем выше у вас будет ER (engagement rate). Именно активная аудитория поднимает ваши публикации в ленте (и турки с арабами, если вы девушка).

Попробуйте Stories

Разумеется, большого вовлечения Stories не принесут, но если их использование влияет на алгоритм ранжирования, то лишними они не будут.

Заполните, в конце концов, информацию о себе или вашей компании

Хорошо и правильно оформленный профиль — это не десять эмодзи на десять слов, а правильно сформулированный и аккуратно оформленный грамотный текст, включающий ключевые слова для поиска.

И не тратьте свое время на мелочи.

Присылайте свои колонки и кейсы о рекламе и маркетинге на digital@vc.ru.


Источник: vc.ru

Комментарии: