Почему новость про Neuralink и обезьян не попала в новостную ленту AI-News 1го февраля |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-02-04 10:54 Вчера в комментариях в нашей группе ВКонтакте возник вопрос почему в ленту не попала новость про издевательства Илона Маска над несчастными обезьянками. Причем первый вариант новости появился на русском языке еще 1го числа и по идее должен бы попасть в ленту в ночь с 1го на 2е. Однако не попал и со 2го на 3е. Только сегодня ночью нашлось сразу две штуки по этому поводу. Провел небольшое расследование. Сама новость начала распространяться в рунете примерно в 14:30 1го февраля. Причем в достаточном числе копий чтоб робот ее точно заметил. Таких логов нет, поскольку их объем очень большой (миллионы записей в день), а информации там чуть. Да и всегда можно запустить пересчет по любому числу, правда он будет немного искаженным. Только вот новость в ленту не попала. Причина кроется в целом ряде явлений. Во первых новость сама по себе никакая. Вот ее изложение по ria.ru:
Вот она же от Медузы:
Робот точно прочитал обе новости трижды. В ночь с 1го на 2е, с 2го на 3е и с 3го на 4е. Поскольку отброшенные при первичном рассмотрении новости он не запоминает. У новости ria шансов попасть в ленту не было совершенно. Она слишком короткая, а робот такие не любит. Коротких сообщений в сети слишком много, чтоб с ними всеми разбираться. Второй негативной причиной отсева новости было слово чипирование. Оно так заезжено всякими РИА Катюша, Царьградом и прочими что к области нейронаук роботом не относиться. С новостью от Медузы все сложнее. Робот ее принимал на рассмотрение, но она проигрывала сначала более старым новостям, но более распространенным в сети, а потом более наукоемким и длинным. Лишь в ночь с 3го на 4е, когда у новости появилось 300 копий она набрала достаточный вес чтоб пройти в ленту. Более длинную новость от Царьграда с 2мя видео робот взял сразу в день ее появления. В итоге 4го в ленту попали обе новости. Несколько месяцев назад мы перешли от сбора новостей за день к сбору новостей за последние 4ре дня, а на сегодня это уже 6 дней по некоторым направлениям. Это конечно тоже задерживает появление слабых новостей в ленте на несколько дней. Зато это выравнивает ленту, поскольку довольна часто встречаются совершенно пустые на новости дни. В такие дни робот вставляет в ленту малораспространенные, но наукоемкие по содержанию статьи. Или наоборот, как в этом случае, малосодержательные, но широко разошедшиеся. С окном просмотра примерно 4ре дня. Выводы такие. 1го числа новость в нашу ленту не попала поскольку основные ленты дали по ней малосодержательные и очень короткие заметки. Включили туда слова вреде "чипирование"(которое заезженно в теории заговора) и упоминаниями Илона Маска (у него есть вес, но очень маленький). В итоге новость попала в ленту на 3й день из-за большой активности читателе Медузы. Которым эта новость зашла. Тут видно что опираться только на одни ключевые слова при просеивание новостей не получиться. Нужно извлекать смыслы, а это проще в длинных статьях. Причем люди тоже выбирают такой вариант подачи. Новость от Медузы получила распространенность больше в 20 раз чем новость от ria. Новость от Царьграда попала в ленту сразу, проскольку там полно "мяса". Вообще когда заработает двухпроходный отбор новостей, который будет не отбирать отдельные новости, а пытаться составить полную информационную картину дня, новость про Neuralink в изложении Медузы должна будет попасть в ленту сразу. Источник: vk.com Комментарии: |
|