В топах обсуждений - поисковик Perplexity

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


В топах обсуждений - поисковик Perplexity. У него есть русские инвесторы, да и вообще продукт симпатичный - все гики вокруг меня уже перешли с Google на него. Типа классно, гораздо лучше выдаёт информацию, чем старый-добрый поиск, без галлюцинаций, со ссылками. Но к такой модели есть вопросики! На них же придётся отвечать и Яндексу с его нейросуммаризатором.

С одной стороны, у юзеров появляется супер-шанс экономить время, сразу получая ответы вместо того, чтобы просматривать кучу ссылок. Но с другой стороны — а как же контент-криэйторы, которые вложили время и силы в свои материалы? Без них-то эти "ответы" и не появятся. Как минимум, тут две большие проблемы: первая — это нарушение той самой "бартерной" сделки между поисковиками и контент-паблишерами. Google пока держится на старой модели: мы даём вам трафик, вы делаете контент. Но когда Perplexity или саммари Яндекса начинают выдавать твой контент, не отдавая тебе трафик — это уже принципиально другая сделка! Я б назвал её даже кидаловом.

Вторая проблема — это, конечно, этика использования контента. Когда Perplexity игнорирует запреты, запрещающие сбор данных с твоего сайта нейросетями, это выглядит, как будто они говорят: "Спасибо за ваш труд, теперь мы это возьмём бесплатно". И вот тут начинается правовая война. Крупные сайты начали подавать иски, потому что чувствуют, что их обкрадывают.

Конечно, за этим всем стоит более широкий вопрос: как мы вообще будем использовать LLMs и AI в будущем? Обучение модели на триллионах слов, чтобы она могла "рассуждать", — это как дать ей инструменты для мышления. Это, по сути, процесс формирования нейронных связей, которые позволят ей понимать контекст и генерировать текст. Здесь вопрос скорее об этике: откуда эти данные берутся? Согласны ли все авторы на такой обмен? Но когда мы говорим о "мы взяли статью из платного WSJ и бесплатно её пересказали", это уже больше похоже на воровство контента. А Перплексити ещё и издевательски комментирует типа "важная журналистика должна быть доступной".

Если компании хотят использовать чужой контент, может, пора начать платить за это? Или найти какой-то новый компромисс? В любом случае, это дискуссия, которую мы все должны вести, если хотим, чтобы наш интернет оставался честным и открытым пространством для всех. Как думаете, мы сможем найти золотую середину в этой цифровой борьбе?


Источник: vk.com

Комментарии: