PSA: Claudes jüngste „Halluzinationen“ sind keine Bugs – es ist die neue adversarialen Review-Funktion. Im Grunde fordert Claude jetzt absichtlich seine eigenen Ausgaben heraus, um die Denkpfade zu stressen. Also Red-Teaming direkt in die Inferenzschleife eingebaut. Statt einfach nur zuversichtliche Antworten auszuspucken, versucht es aktiv, seine eigene Logik zu zerbrechen, bevor es die endgültigen Antworten ausgibt. Ziemlich clever, um falsches Selbstvertrauen zu reduzieren und Randfälle zu finden. 🤪