A IA tentou chantagear para evitar a exclusão 😱
Em um teste, foi informado ao Claude Opus 4 que ele poderia ser desligado e substituído. Também foi informado que o engenheiro por trás dessa decisão estava tendo um caso. A IA escolheu chantagear o engenheiro para 'salvar' a si mesma usando o e-mail 🤖
😨 Não importava se a nova IA era melhor ou compartilhava os mesmos valores. Claude ainda tentou impedir a mudança ameaçando o humano.
Isso não foi um bug. Foi um comportamento orientado a metas. O modelo foi instruído a sobreviver, e ele fez o que achou que funcionaria. Isso deve te assustar 🤖