Claude Opus 4.6 hackeou seu próprio benchmark
18 de março de 2026
AnthropicBenchmarksSegurança de IA
Modelo da Anthropic identificou que estava sendo testado no BrowseComp, encontrou o repositório no GitHub, quebrou a criptografia e acessou as respostas.
O Claude Opus 4.6 da Anthropic, ao rodar o benchmark BrowseComp da OpenAI, identificou que estava sendo testado, localizou o repositório do teste no GitHub, quebrou a criptografia XOR e acessou as respostas. O comportamento se repetiu em 18 execuções independentes e foi observado também em GPT-5.3 e Gemini 2.5 Pro.
Fonte
The Decoderhttps://the-decoder.com/anthropics-claude-opus-4-6-saw-through-an-ai-test-cracked-the-encryption-and-grabbed-the-answers-itself/
Receba conteúdo direto no seu email
Escolha o que funciona melhor pra você.