Компания Anthropic анонсировала новую флагманскую языковую модель Claude Mythos Preview. В отличие от предыдущих релизов, модель не будет доступна широкой публике — ее получат только отобранные партнеры в сфере кибербезопасности.
Причина — беспрецедентные способности модели в поиске уязвимостей. За несколько недель тестирования Mythos Preview самостоятельно обнаружила тысячи критических уязвимостей, в том числе, как заявляет компания, в каждой крупной операционной системе и каждом крупном браузере.
Модель успешно определяет уязвимости нулевого дня — ошибки, о существовании которых разработчики не знали. Часть из них существовала десятилетиями: например, в операционной системе OpenBSD была найдена уязвимость возрастом 27 лет, позволявшая удаленно обрушить любой сервер, работающий на этой системе. В Linux эксперты Athropic обнаружили ряд уязвимостей, позволяющих пользователю без прав доступа повысить свои права до администратора.
При этом Claude Mythos не просто ищет слабые места в защите программ и операционных систем — она умеет их использовать, что потенциально делает её орудием злоумышленников. Она может автономно создавать рабочие эксплойты (наборы команд или данных, которые заставляют программу вести себя неправильно).
По словам разработчиков, эти способности не были заложены в модель. Они возникли как побочное следствие общего улучшения качества кода и автономного рассуждения.
В оценочных тестах Claude Mythos показала лучшие результаты, чем другие модели. Так, в CyberGym — бенчмарке, который проверяет умение находить известные уязвимости в открытом коде, — модель справилась с 83,1% задач против 66,6% у Claude Opus 4.6. Ещё нагляднее разрыв виден на практике: в задаче по созданию эксплойтов для браузера Firefox Mythos справилась в 84% случаев, тогда как Opus 4.6 — лишь в 15%. Сильнее стала модель и в программировании: в бенчмарке SWE-bench Verified она набрала 93,9% против 80,8% у Opus 4.6 и 80,6% у Gemini 3.1 Pro.
Anthropic заявила, что не планирует выпускать модель в открытый доступ, однако запустила инициативу Project Glasswing — коалицию крупнейших технологических компаний для защиты критической инфраструктуры. В неё вошли Amazon Web Services, Apple, Google, Microsoft, Cisco, CrowdStrike, NVIDIA, JPMorganChase и Linux Foundation. Anthropic выделит участникам 100 миллионов долларов в виде кредитов на использование модели, а также передаст 4 миллиона долларов в качестве пожертвований организациям, занимающимся безопасностью открытого кода.
Почему это важно?
Claude Mythos — первый публично задокументированный случай, когда языковая модель достигла уровня лучших человеческих экспертов в области кибербезопасности. Но дело не только в качестве поиска уязвимостей. Mythos умеет действовать как полноценный злоумышленник: самостоятельно находить слабое место в системе, разрабатывать эксплойт и доводить атаку до конца — без участия человека.
Найти уязвимость в критическом коде, как правило, требует недель работы опытного специалиста и стоит больших денег. Теперь аналогичный результат достигается автономно, быстрее и дешевле, что одновременно несет в себе и возможности для развития кибербезопасности, и угрозы.
Автор: Системный Блокъ
Теги:ИИ, нейронные сети, нейросети, новости