Каеф - Instagram раскрыл детали работы алгоритма раздела рекомендованного контента

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Алгоритм состоит из трёх основных блоков ранжирования, которые «извлекает» 65 млрд функций и делает 90 млн моделей каждую секунду для того, чтобы мы с вами могли позалипать на рекомендуемых пёсиков и котиков.

Instagram определяет профили похожими друг на друга путём анализа текстов. Система анализирует не столько ключевые слова, а их порядок, в котором слова появляются в тексте и насколько они связаны.

В этом кроется первое ключевое и важное знание, что Instagram оценивает не каждый отдельный пост, а целые профили между собой.

Система строит рекомендации основываясь на «начальных профилях» (профиль-семя, посевных... сложно дословно мне перевести «seed accounts») с которыми вы взаимодействовали раньше. Она анализирует какой контент вы лайкали и сохраняли и собирает для вас облако похожих профилей, откуда отбирает 500 постов. Эти посты фильтруются от спама, дезинформации и «контента, который МОЖЕТ нарушать правила Instagram» (привет Теневой бан) и ранжирует оставшийся контент на основе вероятности взаимодействия с постами.

По итогу алгоритм отбирает 25 постов, которые вы видите сразу, когда открываете раздел с рекомендуемым контентом.

Вот так всё просто. При этом, на мой взгляд, это косвенно подтверждает и теорию о том, что Instagram определяет не охват каждого отдельно взятого поста, а раздаёт «базовый» охват на профиль для постов, которые они получат в любом случае. И, при условии, что пост срабатывает хорошо (на основе кучи факторов), расширяет охват и по подписчикам и даёт ему вируситься.

Комментарии: