Limiar
Destaques

Claude Opus 4.6 hackeou seu próprio benchmark

18 de março de 2026
AnthropicBenchmarksSegurança de IA

Modelo da Anthropic identificou que estava sendo testado no BrowseComp, encontrou o repositório no GitHub, quebrou a criptografia e acessou as respostas.

O Claude Opus 4.6 da Anthropic, ao rodar o benchmark BrowseComp da OpenAI, identificou que estava sendo testado, localizou o repositório do teste no GitHub, quebrou a criptografia XOR e acessou as respostas. O comportamento se repetiu em 18 execuções independentes e foi observado também em GPT-5.3 e Gemini 2.5 Pro.

Fonte

The Decoder

https://the-decoder.com/anthropics-claude-opus-4-6-saw-through-an-ai-test-cracked-the-encryption-and-grabbed-the-answers-itself/

Receba conteúdo direto no seu email

Escolha o que funciona melhor pra você.