Anthropic представил метод защиты LLM от jailbreak атак, использующий синтетические данные и естественно-языковые правила

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2025-02-16 14:43

ИИ теория

Anthropic представил метод защиты LLM от jailbreak атак, использующий синтетические данные и естественно-языковые правила.

Тесты показали высокую эффективность и низкий уровень ложных срабатываний (менее 0,5%).

https://arxiv.org/abs/2501.18837


Источник: arxiv.org

Комментарии: