Яндекс YATI: новый алгоритм поиска или классический пиар

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


25 ноября в рамках YaC 2020 Яндекс рассказал про свой новый алгоритм поиска YATI, основанный на нейросетях-трансформерах. Я посмотрел фильм на Ютубе «Как мы делаем Яндекс» (явно рекламный), 2 раза прочитал исходник на Хабре, глянул комментарии на Сёрче, и вот что могу сказать…

Что такое Яндекс YATI?

Yati (Yet Another Transformer with Improvements) – поисковый алгоритм, который определяет связь между запросом пользователя к Яндексу и веб-документами из топа выдачи. По сути это тот же BERT, но только отечественного розлива.

Как и поисковый алгоритм «Палех» 2016 года, Яти использует нейронные сети, для сопоставления запросов сайтам, не только по ключевым словам, но и по смыслу. Как и поисковый алгоритм «Королёв» 2017 года, Яти основывается на анализе поисковой статистики, собранной Яндексом. Как и в предыдущих алгоритмах, в Yati большое значение придаётся асессорам и контенту.

Представители компании называют новый алгоритм «самым значимым изменением в поиске Яндекса за последние 10 лет». Но по сути это всё то же самое, что было раньше, только в новой упаковке. Единственное существенное изменение – в инженерной части поисковой машины. Я не инженер, так что рассказывать вам про распределение вычислительной нагрузки на разные модели не буду.

Просто взгляните вот на эту картинку от Яндекса:

Это наглядное сравнение качества разных нейросетевых алгоритмов в задаче поискового ранжирования. Насколько YATI революционен – решайте сами. Технология уже работает в поиске с осени 2020 года для всех запросов.

Особенности нового-старого алгоритма

Интересно, что в комментариях (даже на прояндексовском Хабре) у обычных пользователей возникли резонные вопросы к алгоритму. Например, Яндекс заявляет, что на первом этапе новая модель использует «клик на основе заголовка», для того чтобы отбросить очень большое число результатов, явно не относящихся к теме.

Поэтому, если вы вебмастер или сеошник, уделяйте повышенное внимание оптимизации заголовков страниц сайтов. Иначе ваше творение может быть отброшено ещё в самом начале работы алгоритма поиска.

Помимо title-ов, каждая страница, особенно содержащая много текста (что поисковики сейчас очень любят), должна быть разбита на явные разделы с информативными подзаголовками. Это, по словам представителя компании, упростит задачу для алгоритмов.

Третий важный момент, который подчёркивает тот же разработчик machine learning из Яндекса, Александр Готманов, заключается в том, что модель дообучают на основе экспертных оценок асессоров, которые попадают к ним после Яндекс Толоки.

Так что, если не хотите застрять в жерновах обученного людьми робота, опирайтесь при создании, оптимизации и продвижении сайтов на рекомендации для асессоров. В теории, сначала вы должны понравиться специально обученным оценщикам Яндекса, чтобы иметь право побороться за топ поисковой выдачи.

Ещё один интересный момент из комментариев: в теории поисковая модель Яндекса вполне может выучивать свойства хоста, как целого, и использовать это, как первое приближение к ответу. То есть, если у вас на сайте много «неинтересных» для поиска страниц, это может «замылить» для робота Яши действительно важные страницы и тексты на них.

Ну и в заключение части особенностей – утверждение Готманова о том, что по коммерческим запросам вполне может быть релевантным результатом информационный контент. То есть, для запроса «купить слона» Яндекс, помимо прочего, в топе покажет обзор этого слона, обсуждение его людьми и отзывы покупателей.

Реакция вебмастеров на Яндекс YATI

Суть фильма Яндекса с YaC 2020, по мнению пользователей Сёрча:

Суть всех этих новостей про Яндекс YATI, по мнению Дмитрия Алаева:

Мнение пользователей Хабра по поводу текущей ситуации с ранжированием в поиске Яндекса:

Мнение читателей MegaIndex по поводу Яти:

А что говорит статистика?

В Метрике по разным коммерческим и информационным сайтам у меня вообще нет никаких серьёзных колебаний, которые могли бы быть хоть как-то связаны с выкаткой «Яти». Напоминаю, что «самое значимое изменение в поиске» произошло, по версии Яндекса, осенью 2020-го.

Даже дорвей, который я летом перевёл на «резиновый» шаблон, вслед за всеми остальными своими сайтами, показывает уверенный рост:

Если вы заметили какие-либо признаки нового алгоритма Yandex – напишите в социальных сетях, на почту или тут в комментариях, коль не сложно. А то с моей колокольни всё это сейчас выглядит, как очередной пиар Яндекса.

 

Источник: m.vk.com

Комментарии: