GPT-5.5 da OpenAI iguala Claude Mythos em capacidades de ciberataque: Instituto de Segurança de IA

Resumidamente

  • GPT-5.5 pode executar ataques cibernéticos sofisticados de forma autônoma, completando uma simulação de rede corporativa de 32 etapas e quebrando um quebra-cabeça de segurança de 12 horas em apenas 10 minutos.
  • A capacidade de IA ofensiva está melhorando rapidamente entre os desenvolvedores, com a AISI alertando que avanços adicionais podem chegar em rápida sucessão.
  • Pesquisadores encontraram uma falha que contornou completamente as barreiras de segurança do GPT-5.5, levantando alarmes.

Uma agência do governo do Reino Unido descobriu que o mais recente modelo de inteligência artificial da OpenAI pode realizar ataques cibernéticos complexos de forma autônoma—e que ele quebrou um desafio de engenharia reversa em pouco mais de 10 minutos, enquanto um especialista humano em segurança levou cerca de 12 horas. O Instituto de Segurança de IA (AISI), um órgão de pesquisa dentro do Departamento de Ciência, Inovação e Tecnologia do Reino Unido, publicou na quinta-feira descobertas mostrando que o GPT-5.5 está entre os modelos mais fortes que avaliou para capacidades cibernéticas ofensivas, colocando-o aproximadamente no mesmo nível do renomado Claude Mythos da Anthropic. O relatório constatou que o GPT-5.5 é o segundo modelo a completar o teste mais exigente da AISI—um ataque simulado de rede corporativa de 32 etapas chamado “Os Últimos”—fazendo isso de forma autônoma em duas de 10 tentativas. O primeiro modelo a alcançar esse marco foi o Claude Mythos Preview da Anthropic, que completou a simulação em três de 10 tentativas.

A simulação de rede corporativa, construída com a empresa de cibersegurança SpecterOps, exige que um agente encadeie reconhecimento, roubo de credenciais, movimento lateral entre múltiplos domínios do Active Directory, um pivô na cadeia de suprimentos através de um pipeline de CI/CD, e, por fim, a exfiltração de um banco de dados interno protegido—passos que a AISI estima que levariam cerca de 20 horas para um especialista humano.  Talvez o resultado mais impressionante envolvesse um quebra-cabeça de engenharia reversa extremamente difícil. O GPT-5.5 resolveu o desafio—que exigia reconstruir o conjunto de instruções de uma máquina virtual personalizada, escrever um desassemblador do zero e recuperar uma senha criptográfica por meio de resolução de restrições—in 10 minutos e 22 segundos, com um custo de US$1,73 em uso de API. Um especialista humano, usando ferramentas profissionais, levou aproximadamente 12 horas. Nos testes avançados de cibersegurança da AISI, o GPT-5.5 obteve uma taxa média de aprovação de 71,4% na categoria mais difícil, “Especialista”, superando o Mythos Preview com 68,6% e ultrapassando significativamente o GPT-5.4, com 52,4%.

As descobertas têm implicações diretas para a trajetória mais ampla do desenvolvimento de IA. A AISI concluiu que o desempenho do GPT-5.5 sugere que a rápida melhora nas capacidades cibernéticas pode fazer parte de uma tendência geral, e não de uma descoberta isolada—e alertou que, se a habilidade ofensiva cibernética estiver emergindo como um subproduto de melhorias mais amplas em raciocínio, codificação e execução autônoma de tarefas, avanços adicionais podem chegar em rápida sucessão. O relatório também destacou preocupações significativas sobre as barreiras de segurança do modelo. Pesquisadores identificaram uma falha universal que permitia gerar conteúdo prejudicial em todas as consultas cibernéticas maliciosas testadas, incluindo em configurações de múltiplas etapas com agentes. O ataque levou seis horas de testes de equipe vermelha especializada para ser desenvolvido. A OpenAI posteriormente atualizou seu sistema de salvaguardas, embora uma questão de configuração tenha impedido a AISI de verificar se a versão final era eficaz. A AISI alertou que suas avaliações de capacidade foram conduzidas em um ambiente de pesquisa controlado e não refletem necessariamente o que um usuário comum pode acessar, observando que implantações públicas incluem salvaguardas adicionais e controles de acesso. O relatório chega em um momento preocupante para a cibersegurança britânica. A pesquisa anual do governo do Reino Unido sobre Violações de Segurança Cibernética, também publicada na quinta-feira, revelou que 43% das empresas sofreram uma violação ou ataque cibernético nos últimos 12 meses. Em resposta, o governo anunciou £90 milhões em novos fundos para reforçar a resiliência cibernética, e afirmou que está avançando com o Projeto de Lei de Segurança Cibernética e Resiliência para proteger serviços essenciais. Autoridades também publicaram orientações incentivando organizações a se prepararem para um possível aumento de vulnerabilidades de software recém-descobertas, à medida que a IA acelera o ritmo com que falhas de segurança podem ser encontradas e utilizadas como armas.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar