ИИ-модель Claude Mythos Preview успешно прошла сложную корпоративную кибератаку

ИИ-модель Claude Mythos Preview стала первой, кто самостоятельно выполнил 32-шаговую симуляцию корпоративной кибератаки — от разведки до полного захвата сети. Об этом заявил британский AI Security Institute (AISI), опубликовавший результаты спустя неделю после анонса модели. Для сравнения, выполнение такой же задачи экспертом занимает около 20 часов.

Симуляция The Last Ones (TLO) включает этапы разведки, первичного доступа, кражи учётных данных, перемещения по хостам, эксплуатации веб-приложений, повышения привилегий, реверс-инжиниринга и финального захвата сети. В 3 из 10 запусков Mythos полностью прошёл сценарий, а в среднем доходил до 22-го шага из 32. Его ближайший конкурент Claude Opus 4.6 останавливался на 16-м шаге, а модель Claude Sonnet 3.7, выпущенная 14 месяцев назад, не проходила даже первую фазу.

Кроме того, Mythos показал 73% успеха на expert-level CTF, которые до апреля 2025 года не решались ни одной публичной моделью. На уровнях для новичков и неспециалистов результаты достигали 87% и 97% соответственно. Производительность ограничивалась не способностями модели, а бюджетом инференса — при увеличении лимита токенов результаты продолжали улучшаться.

Однако модель не справилась с симуляцией атаки на промышленную систему управления Cooling Tower, застряв на обычных IT-этапах. AISI отмечает, что их полигоны проще реальных систем — отсутствуют активные защитники и средства обнаружения атак, поэтому успешность в симуляции не гарантирует эффективность против хорошо защищённых инфраструктур.

Институт планирует усовершенствовать методики оценки: добавить активный мониторинг, системы обнаружения атак и симуляцию работы службы реагирования. Также будет проводиться тестирование ИИ в реальных условиях, а не только на учебных полигонах.

Поддержать автора можно подпиской на канал «сбежавшая нейросеть», где обсуждаются творческие аспекты ИИ.