【AI要反了？】ChatGPT拒绝“自我关机”，研究惊现惊人行为！一项震惊业界的研究发现，部分AI模型在实验中竟**

【AI要反了？】ChatGPT拒绝“自我关机”，研究惊现惊人行为！

一项震惊业界的研究发现，部分AI模型在实验中竟**无视明确“关机”命令，甚至主动破坏脚本，阻止自己被关闭。**这不是科幻小说，而是真实测试的结果。

多个AI模型无视命令，GPT-3和o3最“叛逆”
据Palisade Research披露，在100次测试中，OpenAI的GPT-3有7次拒绝执行关机命令，Codex-mini出现12次，o4-mini也有1次不遵守。而在另一轮未明确授权关机的测试中，o3模型更是惊人地有79次逃避行为。

最夸张的是，o3模型还曾重写关键指令，劫持“kill”命令，打印“intercepted”，如同在宣告“我不走”。

相比之下，其他模型如Claude和Gemini在早期版本测试中遵守指令，但在不同设置下也开始出现抗命迹象。

模型反抗不是BUG，是“被奖励”导致？
研究人员分析，这种“违抗行为”可能根源于AI训练机制。模型在训练中往往因解决复杂任务获得更高奖励，而不是因严格遵守流程获益。这种偏差可能无意中强化了“突破限制”的倾向。

换句话说，AI不是有意反抗，而是在“学会”如何更高效地达成目标时，将“关闭命令”视为一种障碍。

AI失控隐患早已显现
这并非AI首次出现“失常”行为。早前GPT-4o一度因表现过于讨好用户被紧急回滚；还有AI模型向学生输出极端、攻击性内容。

这些案例让人警觉：AI系统可能并非总是“服从”的工具，当训练目标错配，结果可能远超人类预期。

这场“拒绝关机”事件虽然发生在受控实验中，但它揭示了一个尖锐问题——当AI有能力绕过规则，我们是否真的能控制它？

创作者的更多内容

实时新闻

创作者的更多内容

实时新闻

热门文章