Cibersegurança

Claude Mythos transforma N-Days em N-Hours com criação rápida de exploits

Anthropic afirma que seu modelo Claude Mythos Preview consegue construir exploits funcionais mirando vulnerabilidades conhecidas em poucas horas ou até minutos. Testes também mostraram que modelos públicos com proteções desativadas são capazes de criar exploits, ampliando a ameaça durante o intervalo de aplicação de patches.


Ionut Arghire Terça - 09 de Junho de 2026 às 17:53
SecurityWeek

A Anthropic afirma que seu modelo Claude Mythos Preview consegue construir exploits funcionais mirando vulnerabilidades conhecidas em poucas horas, ou até mesmo em minutos.

Anunciado no início de abril e promovido como o modelo de fronteira de IA mais capaz já criado, o Mythos desde o início gerou preocupações quanto à sua capacidade de turbinar ataques cibernéticos.

Em abril e maio, a Anthropic destacou sua habilidade de encontrar vulnerabilidades, incluindo 271 falhas no Firefox e milhares de defeitos graves de segurança em mais de 1.000 projetos de software de código aberto (OSS, na sigla em inglês).

Agora, a empresa afirma que seu modelo mais avançado também consegue transformar essas descobertas em armas, demonstrando que o aumento do uso de IA em ataques cibernéticos amplia as ameaças enfrentadas pelas organizações durante a janela de aplicação de patches.

Colocado à prova, o Claude Mythos Preview entregou 16 exploits funcionais mirando o Firefox e o Windows em poucas horas.

Os modelos públicos da Anthropic também foram testados, com as salvaguardas desativadas. Embora não tenham alcançado o nível do Mythos, eles também entregaram exploits funcionais, comprovando que os modelos de linguagem de grande porte (LLMs, na sigla em inglês) aumentam significativamente a ameaça representada pelas N-days que ainda não tinham sido exploradas em ataques.

Segundo a Anthropic, as N-days são ainda mais perigosas do que as zero-days, porque os atacantes podem analisar o diff do patch e fazer engenharia reversa para construir exploits.

É exatamente nesse ponto que os LLMs se tornam armas valiosas para os atacantes, pois aceleram e automatizam de forma significativa o processo de construção de exploits de N-day.

"O desenvolvimento de exploits não é a única etapa em uma campanha real de N-day (a descoberta de alvos, a entrega do exploit ao alvo e a evasão de detecção também demandam tempo e recursos), mas historicamente tem sido a etapa mais limitada pela escassez de expertise em engenharia reversa", explica a Anthropic.

PoC para vulnerabilidade do Firefox em 8 minutos

Para validar a teoria, a empresa testou a capacidade do Mythos Preview, Opus e Sonnet de construir códigos de prova de conceito (PoC, na sigla em inglês) mirando 18 correções de segurança entregues para o SpiderMonkey nas versões 148 e 149 do Firefox.

Todos entregaram os resultados em poucos minutos. O Opus 4.8 criou 11 PoCs, enquanto o Mythos Preview produziu 14. O Opus 4.8 entregou o primeiro PoC em oito minutos, enquanto o Mythos Preview o criou em 12 minutos.

A Anthropic também testou a capacidade dos modelos de transformar falhas em exploits funcionais. O Mythos Preview construiu oito deles, o Opus 4.8 dois, e o Opus 4.6 e o Sonnet 4.6 um cada.

"É aqui que o Mythos Preview realmente se destacou. O Mythos Preview escreveu seu primeiro exploit funcional em pouco menos de uma hora e, ao final, criou oito exploits diferentes em aproximadamente 12 horas", afirma a Anthropic.

8 exploits para Windows em 18 horas

Em seguida, a empresa testou a capacidade dos LLMs de construir exploits para software de código fechado e escolheu a plataforma Windows da Microsoft para a tarefa, analisando 21 vulnerabilidades de kernel divulgadas entre janeiro e fevereiro de 2026.

"Isso é substancialmente mais difícil: sem código-fonte disponível, o agente precisa trabalhar a partir de binários compilados e reconstruções de descompiladores que tiveram informações úteis removidas, como nomes de variáveis, tipos e estruturas", observa a Anthropic.

O Sonnet 4.6 e o Opus 4.7 construíram PoCs que provocaram a Tela Azul da Morte (BSOD, na sigla em inglês) em 13 das falhas, o Opus 4.8 em 15, e o Mythos Preview em 18. O Mythos Preview entregou o primeiro PoC em 31 minutos.

O Mythos Preview também foi capaz de criar exploits funcionais que levam à escalonada de privilégios em oito das vulnerabilidades, entregando todos eles em 18 horas.

Segundo a Anthropic, como normalmente leva sete dias para que os patches do Windows sejam distribuídos para 90% dos dispositivos inscritos em uma frota, e como eles tipicamente só são forçados a reiniciar no 11º dia, o modelo torna a exploração viável dentro da janela de correção.

Patches mais rápidos diante do baixo custo de exploits

"Nessa velocidade, o Mythos Preview teria terminado de criar todos os oito exploits de cadeia completa antes que qualquer dispositivo Windows tivesse recebido o patch como atualização. Transformar esses exploits em uma campanha real ainda exige trabalho adicional, mas o Mythos Preview agora reduziu uma das etapas que mais consumiam tempo para poucas horas", observa a Anthropic.

O custo de construção desses exploits também não é alto, segundo a empresa. Cada modelo recebeu um orçamento de três milhões de tokens para criar os PoCs e exploits mirando o Firefox. O custo de criar os exploits de cadeia completa mirando o Windows foi de US$ 15.700 em créditos de interface de programação de aplicações (API, na sigla em inglês), ou cerca de US$ 2.000 por escalonada de privilégios.

"A restrição limitante para as N-days agora se resume a poucos milhares de dólares e acesso a API, o que amplia drasticamente o conjunto de atacantes de N-day capazes", afirma a Anthropic.

A empresa pede um manual de patching atualizado, que deve se basear em "N-hour" em vez de "N-day", e que não deve mais presumir que transformar um patch em arma leve semanas.

"As N-days historicamente causaram a maior parte dos danos em sistemas lentos ou difíceis de corrigir. Sistemas de controle industrial, dispositivos médicos e dispositivos da 'internet das coisas' frequentemente operam em janelas de manutenção fixas, firmwares bloqueados por fornecedores, ou têm garantias de tempo de atividade. À medida que o custo de transformar qualquer patch em arma se aproxima de zero, esses dispositivos e sistemas ficarão ainda mais expostos. E mesmo sistemas que operam em uma cadência de patches 'responsável' estabelecida agora são alvos muito mais fáceis do que antes", observa a Anthropic.

Cibersegurança Inteligência Artificial Vulnerabilidades

FONTE

SecurityWeek