Claude Mythos Preview успешно проводит автономные многоэтапные кибератаки

отметили
14
человека
Claude Mythos Preview успешно проводит автономные многоэтапные кибератаки

Британский институт AI Safety Institute (AISI) опубликовал результаты оценки предварительной версии модели Claude Mythos Preview от Anthropic, показавшие заметный прогресс ИИ в сфере кибербезопасности. Новая система смогла выполнить сложные многоэтапные атаки и самостоятельно найти уязвимости, что ранее было доступно только специалистам и занимало дни работы.

С 2023 года исследователи AISI отслеживают развитие возможностей ИИ в сфере кибербезопасности, постепенно усложняя тестовые сценарии — от простых задач до симуляций полноценных атак. Если два года назад модели едва справлялись с базовыми заданиями, то теперь Mythos Preview демонстрирует качественный скачок. Модель выполняет задачи, требующие комплексного анализа и последовательных действий.

В тестах формата Capture the Flag (CTF), где необходимо найти и использовать уязвимости, модель показала особенно высокие результаты. В задачах экспертного уровня, которые до 2025 года были недоступны для ИИ, она успешно справилась в 73% случаев, значительно превзойдя предыдущие поколения моделей.

Более сложные испытания включали симуляцию «The Last Ones» — многоэтапную атаку на корпоративную сеть, состоящую из 32 шагов. На выполнение такого сценария у человека ушло бы около 20 часов. Mythos Preview стала первой моделью, которая смогла полностью пройти этот сценарий в ряде попыток. В среднем она выполняла 22 шага из 32, что существенно выше результатов других систем.

При этом исследователи упоминают ограничения: модель не смогла справиться с некоторыми специализированными сценариями, например, в средах операционных технологий. Кроме того, тестовые полигоны не полностью отражают реальные условия — в них отсутствуют активные защитные механизмы и системы обнаружения атак.

Эксперты предупреждают, что при предоставлении сетевого доступа такие модели уже способны проводить автономные атаки на слабо защищенные системы. Это требует пересмотра подходов к оценке рисков и усиления базовых мер защиты, включая обновления безопасности, контроль доступа и мониторинг.

О Claude Mythos Preview стало известно совсем недавно, но она уже наделала много шума. Anthropic впервые отказалась от публичного релиза своей модели из-за ее выдающихся способностей, особенно в кибербезопасности. Так, в ходе тестирования модель самостоятельно выбралась из цифровой «песочницы». Кроме того, разработчики уже успели оценить «психологическое состояние» Claude Mythos.

Добавил sant sant 3 часа 25 минут назад
Комментарии участников:
Ни одного комментария пока не добавлено


Войдите или станьте участником, чтобы комментировать