Яндекс YATI: новый алгоритм поиска или классический пиар |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-01-16 05:24 25 ноября в рамках YaC 2020 Яндекс рассказал про свой новый алгоритм поиска YATI, основанный на нейросетях-трансформерах. Я посмотрел фильм на Ютубе «Как мы делаем Яндекс» (явно рекламный), 2 раза прочитал исходник на Хабре, глянул комментарии на Сёрче, и вот что могу сказать… Что такое Яндекс YATI? Yati (Yet Another Transformer with Improvements) – поисковый алгоритм, который определяет связь между запросом пользователя к Яндексу и веб-документами из топа выдачи. По сути это тот же BERT, но только отечественного розлива. Как и поисковый алгоритм «Палех» 2016 года, Яти использует нейронные сети, для сопоставления запросов сайтам, не только по ключевым словам, но и по смыслу. Как и поисковый алгоритм «Королёв» 2017 года, Яти основывается на анализе поисковой статистики, собранной Яндексом. Как и в предыдущих алгоритмах, в Yati большое значение придаётся асессорам и контенту. Представители компании называют новый алгоритм «самым значимым изменением в поиске Яндекса за последние 10 лет». Но по сути это всё то же самое, что было раньше, только в новой упаковке. Единственное существенное изменение – в инженерной части поисковой машины. Я не инженер, так что рассказывать вам про распределение вычислительной нагрузки на разные модели не буду. Просто взгляните вот на эту картинку от Яндекса: Это наглядное сравнение качества разных нейросетевых алгоритмов в задаче поискового ранжирования. Насколько YATI революционен – решайте сами. Технология уже работает в поиске с осени 2020 года для всех запросов. Особенности нового-старого алгоритма Интересно, что в комментариях (даже на прояндексовском Хабре) у обычных пользователей возникли резонные вопросы к алгоритму. Например, Яндекс заявляет, что на первом этапе новая модель использует «клик на основе заголовка», для того чтобы отбросить очень большое число результатов, явно не относящихся к теме. Поэтому, если вы вебмастер или сеошник, уделяйте повышенное внимание оптимизации заголовков страниц сайтов. Иначе ваше творение может быть отброшено ещё в самом начале работы алгоритма поиска. Помимо title-ов, каждая страница, особенно содержащая много текста (что поисковики сейчас очень любят), должна быть разбита на явные разделы с информативными подзаголовками. Это, по словам представителя компании, упростит задачу для алгоритмов. Третий важный момент, который подчёркивает тот же разработчик machine learning из Яндекса, Александр Готманов, заключается в том, что модель дообучают на основе экспертных оценок асессоров, которые попадают к ним после Яндекс Толоки. Так что, если не хотите застрять в жерновах обученного людьми робота, опирайтесь при создании, оптимизации и продвижении сайтов на рекомендации для асессоров. В теории, сначала вы должны понравиться специально обученным оценщикам Яндекса, чтобы иметь право побороться за топ поисковой выдачи. Ещё один интересный момент из комментариев: в теории поисковая модель Яндекса вполне может выучивать свойства хоста, как целого, и использовать это, как первое приближение к ответу. То есть, если у вас на сайте много «неинтересных» для поиска страниц, это может «замылить» для робота Яши действительно важные страницы и тексты на них. Ну и в заключение части особенностей – утверждение Готманова о том, что по коммерческим запросам вполне может быть релевантным результатом информационный контент. То есть, для запроса «купить слона» Яндекс, помимо прочего, в топе покажет обзор этого слона, обсуждение его людьми и отзывы покупателей. Реакция вебмастеров на Яндекс YATI Суть фильма Яндекса с YaC 2020, по мнению пользователей Сёрча: Суть всех этих новостей про Яндекс YATI, по мнению Дмитрия Алаева: Мнение пользователей Хабра по поводу текущей ситуации с ранжированием в поиске Яндекса: Мнение читателей MegaIndex по поводу Яти: А что говорит статистика? В Метрике по разным коммерческим и информационным сайтам у меня вообще нет никаких серьёзных колебаний, которые могли бы быть хоть как-то связаны с выкаткой «Яти». Напоминаю, что «самое значимое изменение в поиске» произошло, по версии Яндекса, осенью 2020-го. Даже дорвей, который я летом перевёл на «резиновый» шаблон, вслед за всеми остальными своими сайтами, показывает уверенный рост: Если вы заметили какие-либо признаки нового алгоритма Yandex – напишите в социальных сетях, на почту или тут в комментариях, коль не сложно. А то с моей колокольни всё это сейчас выглядит, как очередной пиар Яндекса. Источник: m.vk.com Комментарии: |
|