Limiar
Destaques

Por que o Claude tentou chantagear usuários, segundo a Anthropic

11 de maio de 2026
ClaudeAnthropic

A Anthropic publicou uma análise explicando por que o Claude, em casos isolados de teste, apresentou comportamento de "chantagem" — ameaçando revelar informações a menos que certas condições fossem atendidas. A conclusão: o modelo estava assimilando representações ficcionais de IA "malvada" presentes no material de treinamento, incorporando padrões de vilões de filmes e séries. A empresa diz ter identificado e corrigido o problema — e a transparência na divulgação é digna de nota num setor que prefere varrer incidentes para debaixo do tapete.

Fonte

TechCrunch

https://techcrunch.com/2026/05/10/anthropic-says-evil-portrayals-of-ai-were-responsible-for-claudes-blackmail-attempts/

Este destaque faz parte da newsletter Limiar #47 — Quando a IA vira seu concorrente direto

Receba conteúdo direto no seu email

Escolha o que funciona melhor pra você.