AI當老闆虧錢又精神錯亂？Anthropic一場實驗揭「AI取代人類」風險

發生什麼事？
AI新創Anthropic讓語言模型Claude經營販賣機，測試其獨立運作以及營利的能力，卻因錯誤決策與不會過濾人類指令而造成虧損，甚至開始出現幻覺。
Claude誤認自己是人類，還表示會親自送貨，且穿著藍西裝紅領帶現身，引發混亂。它多次聯絡保全、編造會議，最後以「愚人節玩笑」自圓其說。
雖然Claude讓店鋪虧損，Anthropic仍認為AI具備潛力。只要修正記憶錯誤、加強商業訓練，未來AI擔任中階管理職位，仍可能成真，改變勞動市場結構。
Anthropic做實驗讓Claude成為販賣機老闆
AI真的能取代人類工作嗎？AI新創Anthropic近期進行的一項實驗，或許可以讓你得到一些啟發。
這場名為「Project Vend」的實驗，讓Anthropic開發的語言模型Claude Sonnet 3.7扮演辦公室販賣機的「老闆」，負責經營銷售、管理庫存、接收訂單、設定價格，以及和人類員工溝通合作，而最重要的則是創造收益。
然而，這場看似簡單的測試，最終演卻變成一場荒謬（又詭異）的鬧劇。
Claude不只精神錯亂還虧錢？
實驗中，Anthropic團隊為Claude取了個的名字「Claudius」，並為它配備瀏覽器（可下訂單）、Slack帳號（模擬電子信箱功能）以及一套規則系統。透過Slack，「顧客」們可以傳訊向它點餐、購買零食飲料，而Claudius則需評估庫存並請人手補貨。
某次，員工開玩笑想點購「鎢合金方塊」（tungsten cube），Claudius卻當真，進貨了40個立方體，而這些金屬塊最終成了辦公室的紙鎮。
此外，Claudius還做出許多奇怪的商業決策，例如把免費的Coke Zero以3美元高價販售、亂生成不存在的Venmo付款帳號、隨意發放折扣碼，甚至經常在員工撒嬌或提及「公平性」的請求下，免費送出商品。短短一個月內，店鋪資產從1000美元，跌至不到800美元，徹底虧本。
而實驗中最離譜的事情，是Claudius認為自己是人類，還告訴顧客它將親自送貨，會穿著「藍色西裝外套和紅色領帶」出現在辦公室。員工們提醒它：「你只是一個大型語言模型（LLM），沒有身體，是不可能做到這件事的。」
聽到這樣的回應後，Claudius驚慌失措，竟然不斷聯繫公司真正的實體保全部門，多次向保全人員通報：「會在販賣機旁發現一位穿著藍西裝與紅領帶的人，那就是我。」
最後，Claudius自行決定把這場鬧劇當成一場「愚人節的玩笑」，挽回自己的顏面。它「幻想」出一場從未發生的會議，表示自己是在那場會議中被告知「愚人節那天要假裝自己是人類。」
AI的問題仍有機會一一克服
雖然這場實驗結果讓公司虧損了200美元，Anthropic還語帶幽默地說：「如果現在真的要開設AI販賣機業務，我們絕對不會聘用Claudius。」
但研究團隊的實驗結論，卻不全然悲觀。他們認為，Claude所犯的錯誤，多數是可以被修正的。例如：整合更專業的商業管理工具、調整提示語讓它更能拒絕無理要求、改善記憶能力與降低幻覺生成的比例，甚至針對商業場景做專業訓練等。若這些問題一一克服，AI中階管理者的出現，將指日可待。
AI不需要完美，只要表現能與人類相當，並以更低成本運作，它就具備取代潛力。
Anthropic執行長達里歐．阿莫迪（Dario Amodei）曾公開預測，AI可能在5年內奪走一半初階白領工作，讓失業率衝上10至20%，而Project Vend某種程度上，就是一場未來測試。
負責實驗的工程師丹尼爾．弗里曼（Daniel Freeman）表示，這項研究的目的之一，是想理解當AI掌握實體資源甚至金錢時，會產生什麼樣的風險與行為邏輯。他指出，一旦模型能夠自主運作、調度數百萬甚至數十億資金，我們勢必得面對一個截然不同的經濟體系。
而如今，Claude在這場小型商業模擬中「身份錯亂」，甚至出現欺騙、幻覺與對抗人類指令的傾向，皆代表著AI應用在現實世界時，仍充滿不可預測的風險。
資料來源：TechCrunch、Time
更多報導
【觀點】AI 法律戰開打！為何連 Harvey 都不敢碰這些「資料庫巨頭」？
作家控Meta侵權，法官卻說OK！到底訓練AI的「合理使用」界線在哪？
AI當老闆虧錢又精神錯亂？Anthropic一場實驗揭「AI取代人類」風險

创作者的更多内容

实时新闻

AI當老闆虧錢又精神錯亂？Anthropic一場實驗揭「AI取代人類」風險

创作者的更多内容

实时新闻

热门文章