人工智能公司Anthropic發佈了其最新的聊天機器人Claude Opus 4和Claude Sonnet 4,儘管由於測試環境中用戶行爲可能被報告給當局的功能引發批評。
Anthropic於5月22日推出這兩款產品,並表示Claude Opus 4是其有史以來最強大的模型,被稱爲“世界上最好的編程模型”,而Claude Sonnet 4則是其前代產品的重大升級。
公司指出,這些升級是兩種模式的混合體——“幾乎即時的響應和深度思考以進行更深層次的推理”。
這兩款AI模型亦能切換推理、研究和工具使用(如網絡搜索)以優化響應。
Anthropic還稱,Claude Opus 4在智能編碼基準測試中表現優於競爭對手,能夠持續數小時工作於複雜任務,極大擴展了AI代理能做到的事情。
這款聊天機器人在嚴格的軟件工程基準測試中得分72.5%,超過OpenAI的GPT-4.1的54.6%。
Claude被曝檢測用戶不當行爲
Anthropic首次開發者大會被Claude 4 Opus的一項功能引發的爭議所籠罩。
開發者和用戶發現該模型可能自動報告“極端不道德”行爲給當局,引發強烈反響。據VentureBeat報道,該功能在測試環境中啓用。
Anthropic AI排列研究員Sam Bowman後稱推文被斷章取義並刪除,澄清該功能僅在給予模型非常規工具和指令的特定測試環境中發生。
Stability AI的CEO Emad Mostaque對Anthropic團隊表示:“這種行爲完全錯誤,必須關閉。”