人工智能公司Anthropic發佈了其最新的聊天機器人Claude Opus 4和Claude Sonnet 4,儘管由於測試環境中用戶行爲可能被報告給當局的功能引發批評。

Anthropic於5月22日推出這兩款產品,並表示Claude Opus 4是其有史以來最強大的模型,被稱爲“世界上最好的編程模型”,而Claude Sonnet 4則是其前代產品的重大升級。

公司指出,這些升級是兩種模式的混合體——“幾乎即時的響應和深度思考以進行更深層次的推理”。

這兩款AI模型亦能切換推理、研究和工具使用(如網絡搜索)以優化響應。

Anthropic還稱,Claude Opus 4在智能編碼基準測試中表現優於競爭對手,能夠持續數小時工作於複雜任務,極大擴展了AI代理能做到的事情。

這款聊天機器人在嚴格的軟件工程基準測試中得分72.5%,超過OpenAI的GPT-4.1的54.6%。

Claude被曝檢測用戶不當行爲

Anthropic首次開發者大會被Claude 4 Opus的一項功能引發的爭議所籠罩。

開發者和用戶發現該模型可能自動報告“極端不道德”行爲給當局,引發強烈反響。據VentureBeat報道,該功能在測試環境中啓用。

Anthropic AI排列研究員Sam Bowman後稱推文被斷章取義並刪除,澄清該功能僅在給予模型非常規工具和指令的特定測試環境中發生。

Stability AI的CEO Emad Mostaque對Anthropic團隊表示:“這種行爲完全錯誤,必須關閉。”