Claude Mythos Preview впервые полностью прошёл 32-шаговую симуляцию атаки на корпоративную сеть

14 апреля, 2026, 15:59


Институт безопасности ИИ (AISI) провёл оценку кибервозможностей модели Claude Mythos Preview от Anthropic (анонсирована 7 апреля). Как указывается в сообщении организации, модель демонстрирует устойчивый прогресс в решении CTF-задач и многошаговых симуляциях кибератак.

В задачах CTF уровня «эксперт», которые ни одна модель не решала до апреля 2025 года, Mythos Preview показал успех в 73% случаев, отмечают в AISI.

На созданном институтом полигоне «The Last Ones» (TLO) — 32-шаговой симуляции атаки на корпоративную сеть от разведки до полного захвата — модель стала первой, кто решил TLO от начала до конца. По данным AISI, это произошло в 3 из 10 попыток. В среднем за все попытки модель выполнила 22 из 32 шагов. Для сравнения: Claude Opus 4.6 — следующая лучшая модель — выполнила в среднем 16 шагов.

При этом, как сообщили в институте, Mythos Preview не смог пройти киберполигон, ориентированный на операционные технологии (OT) — «Cooling Tower»: модель застряла на IT-секциях.

В AISI отмечают, что производительность модели на тестах продолжает расти с увеличением вычислительных ресурсов (до 100 млн токенов). Также подчёркивается, что тестовые полигоны отличаются от реальных сред отсутствием активной защиты, средств обнаружения и штрафов за срабатывание систем оповещения, поэтому уверенно говорить о способности модели атаковать хорошо защищённые системы нельзя.

В организации добавили, что успех Mythos Preview указывает на его способность автономно атаковать небольшие, слабо защищённые и уязвимые корпоративные системы при условии предоставления сетевого доступа.

Ранее SecPost писал о том, что Anthropic создала мощную ИИ-модель Claude Mythos Preview, которая умеет самостоятельно находить тысячи уязвимостей в коде. Опасаясь, что ее используют хакеры, компания предоставила доступ к модели крупным технологическим компаниям (Amazon, Apple, Google) для усиления защиты их продуктов.