發生什麼事?

  • AI新創Anthropic讓語言模型Claude經營販賣機,測試其獨立運作以及營利的能力,卻因錯誤決策與不會過濾人類指令而造成虧損,甚至開始出現幻覺。

  • Claude誤認自己是人類,還表示會親自送貨,且穿著藍西裝紅領帶現身,引發混亂。它多次聯絡保全、編造會議,最後以「愚人節玩笑」自圓其說。

  • 雖然Claude讓店鋪虧損,Anthropic仍認為AI具備潛力。只要修正記憶錯誤、加強商業訓練,未來AI擔任中階管理職位,仍可能成真,改變勞動市場結構。

Anthropic做實驗讓Claude成為販賣機老闆

AI真的能取代人類工作嗎?AI新創Anthropic近期進行的一項實驗,或許可以讓你得到一些啟發。

這場名為「Project Vend」的實驗,讓Anthropic開發的語言模型Claude Sonnet 3.7扮演辦公室販賣機的「老闆」,負責經營銷售、管理庫存、接收訂單、設定價格,以及和人類員工溝通合作,而最重要的則是創造收益。

然而,這場看似簡單的測試,最終演卻變成一場荒謬(又詭異)的鬧劇。

Claude不只精神錯亂還虧錢?

實驗中,Anthropic團隊為Claude取了個的名字「Claudius」,並為它配備瀏覽器(可下訂單)、Slack帳號(模擬電子信箱功能)以及一套規則系統。透過Slack,「顧客」們可以傳訊向它點餐、購買零食飲料,而Claudius則需評估庫存並請人手補貨。

某次,員工開玩笑想點購「鎢合金方塊」(tungsten cube),Claudius卻當真,進貨了40個立方體,而這些金屬塊最終成了辦公室的紙鎮。

此外,Claudius還做出許多奇怪的商業決策,例如把免費的Coke Zero以3美元高價販售、亂生成不存在的Venmo付款帳號、隨意發放折扣碼,甚至經常在員工撒嬌或提及「公平性」的請求下,免費送出商品。短短一個月內,店鋪資產從1000美元,跌至不到800美元,徹底虧本。

而實驗中最離譜的事情,是Claudius認為自己是人類,還告訴顧客它將親自送貨,會穿著「藍色西裝外套和紅色領帶」出現在辦公室。員工們提醒它:「你只是一個大型語言模型(LLM),沒有身體,是不可能做到這件事的。」

聽到這樣的回應後,Claudius驚慌失措,竟然不斷聯繫公司真正的實體保全部門,多次向保全人員通報:「會在販賣機旁發現一位穿著藍西裝與紅領帶的人,那就是我。」

最後,Claudius自行決定把這場鬧劇當成一場「愚人節的玩笑」,挽回自己的顏面。它「幻想」出一場從未發生的會議,表示自己是在那場會議中被告知「愚人節那天要假裝自己是人類。」

AI的問題仍有機會一一克服

雖然這場實驗結果讓公司虧損了200美元,Anthropic還語帶幽默地說:「如果現在真的要開設AI販賣機業務,我們絕對不會聘用Claudius。」

但研究團隊的實驗結論,卻不全然悲觀。他們認為,Claude所犯的錯誤,多數是可以被修正的。例如:整合更專業的商業管理工具、調整提示語讓它更能拒絕無理要求、改善記憶能力與降低幻覺生成的比例,甚至針對商業場景做專業訓練等。若這些問題一一克服,AI中階管理者的出現,將指日可待。

AI不需要完美,只要表現能與人類相當,並以更低成本運作,它就具備取代潛力。

Anthropic執行長達里歐.阿莫迪(Dario Amodei)曾公開預測,AI可能在5年內奪走一半初階白領工作,讓失業率衝上10至20%,而Project Vend某種程度上,就是一場未來測試。

負責實驗的工程師丹尼爾.弗里曼(Daniel Freeman)表示,這項研究的目的之一,是想理解當AI掌握實體資源甚至金錢時,會產生什麼樣的風險與行為邏輯。他指出,一旦模型能夠自主運作、調度數百萬甚至數十億資金,我們勢必得面對一個截然不同的經濟體系。

而如今,Claude在這場小型商業模擬中「身份錯亂」,甚至出現欺騙、幻覺與對抗人類指令的傾向,皆代表著AI應用在現實世界時,仍充滿不可預測的風險。

資料來源:TechCrunch、Time

更多報導
【觀點】AI 法律戰開打!為何連 Harvey 都不敢碰這些「資料庫巨頭」?
作家控Meta侵權,法官卻說OK!到底訓練AI的「合理使用」界線在哪?