O GPT-5.5 da OpenAI iguala o Mythos de Claude em capacidades de ciberataque: Instituto de Segurança de IA

Resumidamente

  • O GPT-5.5 pode executar autonomamente ataques cibernéticos sofisticados, completando uma simulação de rede corporativa de 32 etapas e quebrando um quebra-cabeça de segurança de 12 horas em apenas 10 minutos.
  • A capacidade de IA ofensiva em cibersegurança está a melhorar rapidamente entre os desenvolvedores, com a AISI a alertar que avanços adicionais podem chegar em rápida sucessão.
  • Pesquisadores descobriram uma falha que contornou completamente as barreiras de segurança do GPT-5.5, levantando alarmes.

Uma agência do governo do Reino Unido descobriu que o mais recente modelo de inteligência artificial da OpenAI pode realizar ataques cibernéticos complexos de forma autónoma—e que conseguiu resolver um desafio de engenharia reversa em pouco mais de 10 minutos, quando um especialista em segurança humano levou cerca de 12 horas. O Instituto de Segurança de IA (AISI), um órgão de pesquisa do Departamento de Ciência, Inovação e Tecnologia do Reino Unido, publicou na quinta-feira descobertas mostrando que o GPT-5.5 está entre os modelos mais fortes que avaliou para capacidades cibernéticas ofensivas, colocando-o aproximadamente ao nível do renomado Claude Mythos da Anthropic. O relatório constatou que o GPT-5.5 é o segundo modelo a completar o teste mais exigente do AISI—uma simulação de ataque a uma rede corporativa de 32 etapas chamada “Os Últimos”—fazendo-o de forma autónoma em duas de 10 tentativas. O primeiro modelo a alcançar esse marco foi o Claude Mythos Preview da Anthropic, que completou a simulação em três de 10 tentativas.

A simulação de rede corporativa, construída com a empresa de cibersegurança SpecterOps, exige que um agente encadeie reconhecimento, roubo de credenciais, movimento lateral entre múltiplos domínios do Active Directory, um pivô na cadeia de suprimentos através de um pipeline de CI/CD, e, por fim, a exfiltração de uma base de dados interna protegida—passos que o AISI estima que levariam cerca de 20 horas a um especialista humano.  Talvez o resultado mais impressionante envolvesse um enigma de engenharia reversa extremamente difícil. O GPT-5.5 resolveu o desafio—que exigia reconstruir o conjunto de instruções de uma máquina virtual personalizada, escrever um desassemblador do zero e recuperar uma senha criptográfica através de resolução de restrições—em 10 minutos e 22 segundos, a um custo de 1,73 dólares em uso da API. Um especialista humano, usando ferramentas profissionais, precisou de aproximadamente 12 horas. Nos testes avançados de cibersegurança do AISI, o GPT-5.5 obteve uma taxa de aprovação média de 71,4% na categoria mais difícil, “Especialista”, superando o Mythos Preview com 68,6% e ultrapassando significativamente o GPT-5.4, com 52,4%.

As descobertas têm implicações diretas para a trajetória mais ampla do desenvolvimento de IA. O AISI concluiu que o desempenho do GPT-5.5 sugere que a rápida melhoria nas capacidades cibernéticas pode fazer parte de uma tendência geral, e não de uma descoberta isolada—e alertou que, se a habilidade ofensiva em cibersegurança estiver emergindo como um subproduto de melhorias mais amplas em raciocínio, codificação e execução autônoma de tarefas, então avanços adicionais podem chegar em rápida sucessão. O relatório também destacou preocupações significativas sobre as barreiras de segurança do modelo. Pesquisadores identificaram uma falha universal que permitiu a geração de conteúdo prejudicial em todas as consultas cibernéticas maliciosas testadas, incluindo em configurações de múltiplas etapas com agentes. O ataque levou seis horas de testes de equipe vermelha por especialistas para ser desenvolvido. A OpenAI posteriormente atualizou seu sistema de salvaguardas, embora uma questão de configuração tenha impedido o AISI de verificar se a versão final era eficaz. O AISI alertou que suas avaliações de capacidade foram realizadas em um ambiente de pesquisa controlado e que não refletem necessariamente o que um usuário comum pode acessar, observando que implantações públicas incluem salvaguardas adicionais e controles de acesso. O relatório surge num contexto preocupante para a cibersegurança britânica. A pesquisa anual do governo do Reino Unido sobre Violações de Segurança Cibernética, também publicada na quinta-feira, revelou que 43% das empresas sofreram uma violação ou ataque cibernético nos últimos 12 meses. Em resposta, o governo anunciou 90 milhões de libras em novos fundos para reforçar a resiliência cibernética, e afirmou que está avançando com o Projeto de Lei de Cibersegurança e Resiliência para proteger serviços essenciais. Autoridades também publicaram orientações instando as organizações a se prepararem para um possível aumento de vulnerabilidades de software recém-descobertas, à medida que a IA acelera o ritmo com que falhas de segurança podem ser encontradas e utilizadas como armas.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar