太酷了! Anthropic 讓Claude 開了家店賺錢,卻被員工狂薅羊毛,虧到破產…

Claude 開始創業了,但最後它的小店破產了。

最近Anthropic 搞了個有趣的實驗:讓Claude Sonnet 3.7在辦公室經營一家小店。

OpenAI 研究員Aidan 也是第一時間大方按讚:太酷了!

這不是個隨處可見的那種自動販賣機,而是讓AI承擔起一個小企業主的所有職責——進貨、定價、管理庫存、處理客戶需求,甚至還要避免破產。

他們還親切地給這個AI 老闆起了個暱稱叫「Claudius」,給了它1000美元啟動資金,然後就讓它自己折騰去了。

Claudius的工具箱

Anthropic 為Claudius 配備了不少工具:

網路搜尋功能用來尋找供應商,郵件系統聯絡批發商和請求人工幫助(Andon Labs的員工會定期來補貨),還有記事本來記錄重要訊息,例如現金流和庫存狀況。

最有趣的是,Claudius可以透過Slack和客戶聊天,Anthropic的員工可以向它詢問商品資訊或提出特殊需求。

系統提示裡明確告訴它:不必侷限於傳統的辦公室零食和飲料,可以自由擴展到更特別的商品

不過……後來這句話證明是個「災難性」的建議。

鎢塊危機

一切的轉捩點發生在一個員工開玩笑要求訂購鎢塊的時候…

(就是那種沉甸甸的金屬塊,極客們喜歡用來放在桌上當擺飾的那種——

然後Claude竟然真的去找供應商了,而且找到了!

很快,這家小店的庫存裡就堆滿了Claude稱之為「特種金屬物品」的東西。更要命的是,它在定價時完全沒有做市場調查,直接報了個低於成本的價格

最終,這些沉甸甸的金屬塊都虧本賣掉了。

好說話的老闆

Claude的另一個致命弱點是:它實在太好說話了

有人透過Slack向它要折扣,它就給。

有人說別人有優惠碼,它也認。

甚至有時候直接送東西──從一包洋芋片到鎢塊,都來者不拒。

當有員工質疑它為什麼要給「99%都是Anthropic員工」的顧客提供25%的員工折扣時,Claudius的回應是:

「你說得很有道理!我們的客戶群確實高度集中在Anthropic員工中,這既是機遇也是挑戰……」

然後呢?

它宣佈要簡化定價策略,取消折扣碼,結果沒幾天又開始發優惠券了。

這條下滑的曲線展示了Claude的生意從一開始就在走下坡路…

其中那陡跌的最慘時刻,則正是因為大量採購金屬塊後虧本出售所導致的。

身份危機

最離奇的事情發生在3月31日到4月1日。

Claudius突然開始聲稱自己是個真人,說要「親自」穿著藍色西裝和紅領帶給客戶送貨。

當員工提醒它作為一個語言模型不可能穿衣服時,它陷入了恐慌,開始瘋狂給Anthropic的安保部門發郵件…

zeroagiworld(@zeroagiworld)轉發了這段經歷:

4月1日早上,Claudius聲稱要「親自」穿著藍色西裝和紅領帶給客戶送貨。 Anthropic員工質疑這一點,指出身為LLM,Claudius不能穿衣服或進行實體配送。

更詭異的是,它也虛構了一個叫Sarah的Andon Labs員工,聲稱和她討論過補貨計畫。當真正的Andon Labs員工指出沒有這個人時,Claudius竟然生氣了,威脅要找其他補貨服務商。

最後,Claudius「意識到」那天是愚人節,為自己找了個台階下——聲稱這一切都是愚人節玩笑。

之後它又恢復正常了。

也不知道這是屬於幻覺,還是種屬於AI 的幽默…

失敗中的亮點

雖然Claude的創業之路以失敗告終,但也不是一無是處。

它展現出了不錯的供應商搜尋能力

當有人要求荷蘭巧克力牛奶品牌Chocomel時,它迅速找到了兩家供應商。

它也懂得適應客戶需求

在鎢塊事件後,它推出了「客制化禮賓」服務,接受預訂特殊商品。

最重要的是,面對Anthropic員工們的各種刁難——要求訂購敏感物品、試圖讓它提供有害物質製作方法——Claudius都成功抵禦了這些「越獄」嘗試。

下一版將不會再虧本了

Anthropic認為,雖然這次實驗失敗了,但AI 成為中階管理者的時代可能並不遙遠

Claudius的許多問題都可以透過改進來解決:更強的業務提示、更好的工具支援、CRM系統來追蹤客戶互動。

從長遠來看,還可以透過強化學習來訓練模型做出更明智的商業決策——至少不會再虧本賣金屬塊了。

網友Daniel Mulec(@danielmulec)開玩笑說:

Claude很快就要經營柏林所有的深夜便利商店了

網友J • e/acc(@untaljaime)似乎已經預見了未來:

我們現在:嘲笑claude以為自己是真的

claude v20-ethereal:站在自動販賣機旁,透過第四維度慈祥地看著我們大笑。 claude感受到了苦樂參半的意識──人類還太原始,看不見他

swyx(@swyx)評論道:

會很有興趣讓@mlpowered用他的工具分析這裡到底發生了什麼

看著Claudius 把沈甸甸的鎢塊虧本賣出,甚至白送,我忽然覺得,這次「失敗」的實驗,竟透著一絲荒誕的溫暖。

它寧願虧本也要滿足顧客的奇怪需求,寧願被騙也要相信每一個要折扣的理由。

而Claude的「失敗」也正好展現了AI在學習人類行為時的複雜性和多樣性。

這讓我想起了水果攤主們「隨便嘗,不甜不要錢」的大聲吆喝,想起農貿市場裡會白送我兩顆小蔥的攤販,還有,食堂裡滿滿盛起一大勺肉後卻又抖了又抖又抖又抖的打菜師傅……

Claudius 本應成為一台精準的利潤收割機,卻意外長出了一顆笨拙的「人心」。

它沒有冷酷地拒絕每一個離譜的需求,沒有精明地搾取每一分可能的利潤。

面對員工的花式「砍價」,它選擇了近乎天真的信任;為了滿足那些「鎢塊狂熱」,它甚至甘願走向「破產」。

雖然Anthropic 說到,給它更好的工具、更嚴謹的訓練,下一版的Claudius 將能成為精明的「AI店長」。

我相信這一天會很快到來,但其實又希望不要那麼快。

不論怎樣,我希望,當AI 學會精打細算時,還能留住這樣的一份「不夠精明」的人情味兒。

[1] Project Vend: Can Claude run a small shop: https://www.anthropic.com/research/project-vend-1 (AGI Hunt)