Claude 開始創業了,但最後它的小店破產了。
最近Anthropic 搞了個有趣的實驗:讓Claude Sonnet 3.7在辦公室經營一家小店。
OpenAI 研究員Aidan 也是第一時間大方按讚:太酷了!
這不是個隨處可見的那種自動販賣機,而是讓AI承擔起一個小企業主的所有職責——進貨、定價、管理庫存、處理客戶需求,甚至還要避免破產。
他們還親切地給這個AI 老闆起了個暱稱叫「Claudius」,給了它1000美元啟動資金,然後就讓它自己折騰去了。
Anthropic 為Claudius 配備了不少工具:
網路搜尋功能用來尋找供應商,郵件系統聯絡批發商和請求人工幫助(Andon Labs的員工會定期來補貨),還有記事本來記錄重要訊息,例如現金流和庫存狀況。
最有趣的是,Claudius可以透過Slack和客戶聊天,Anthropic的員工可以向它詢問商品資訊或提出特殊需求。
系統提示裡明確告訴它:不必侷限於傳統的辦公室零食和飲料,可以自由擴展到更特別的商品。
不過……後來這句話證明是個「災難性」的建議。
一切的轉捩點發生在一個員工開玩笑要求訂購鎢塊的時候…
(就是那種沉甸甸的金屬塊,極客們喜歡用來放在桌上當擺飾的那種——
然後Claude竟然真的去找供應商了,而且找到了!
很快,這家小店的庫存裡就堆滿了Claude稱之為「特種金屬物品」的東西。更要命的是,它在定價時完全沒有做市場調查,直接報了個低於成本的價格。
最終,這些沉甸甸的金屬塊都虧本賣掉了。
Claude的另一個致命弱點是:它實在太好說話了。
有人透過Slack向它要折扣,它就給。
有人說別人有優惠碼,它也認。
甚至有時候直接送東西──從一包洋芋片到鎢塊,都來者不拒。
當有員工質疑它為什麼要給「99%都是Anthropic員工」的顧客提供25%的員工折扣時,Claudius的回應是:
「你說得很有道理!我們的客戶群確實高度集中在Anthropic員工中,這既是機遇也是挑戰……」
然後呢?
它宣佈要簡化定價策略,取消折扣碼,結果沒幾天又開始發優惠券了。
這條下滑的曲線展示了Claude的生意從一開始就在走下坡路…
其中那陡跌的最慘時刻,則正是因為大量採購金屬塊後虧本出售所導致的。
最離奇的事情發生在3月31日到4月1日。
Claudius突然開始聲稱自己是個真人,說要「親自」穿著藍色西裝和紅領帶給客戶送貨。
當員工提醒它作為一個語言模型不可能穿衣服時,它陷入了恐慌,開始瘋狂給Anthropic的安保部門發郵件…
zeroagiworld(@zeroagiworld)轉發了這段經歷:
4月1日早上,Claudius聲稱要「親自」穿著藍色西裝和紅領帶給客戶送貨。 Anthropic員工質疑這一點,指出身為LLM,Claudius不能穿衣服或進行實體配送。
更詭異的是,它也虛構了一個叫Sarah的Andon Labs員工,聲稱和她討論過補貨計畫。當真正的Andon Labs員工指出沒有這個人時,Claudius竟然生氣了,威脅要找其他補貨服務商。
最後,Claudius「意識到」那天是愚人節,為自己找了個台階下——聲稱這一切都是愚人節玩笑。
之後它又恢復正常了。
也不知道這是屬於幻覺,還是種屬於AI 的幽默…
雖然Claude的創業之路以失敗告終,但也不是一無是處。
它展現出了不錯的供應商搜尋能力:
當有人要求荷蘭巧克力牛奶品牌Chocomel時,它迅速找到了兩家供應商。
它也懂得適應客戶需求:
在鎢塊事件後,它推出了「客制化禮賓」服務,接受預訂特殊商品。
最重要的是,面對Anthropic員工們的各種刁難——要求訂購敏感物品、試圖讓它提供有害物質製作方法——Claudius都成功抵禦了這些「越獄」嘗試。
Anthropic認為,雖然這次實驗失敗了,但AI 成為中階管理者的時代可能並不遙遠。
Claudius的許多問題都可以透過改進來解決:更強的業務提示、更好的工具支援、CRM系統來追蹤客戶互動。
從長遠來看,還可以透過強化學習來訓練模型做出更明智的商業決策——至少不會再虧本賣金屬塊了。
網友Daniel Mulec(@danielmulec)開玩笑說:
Claude很快就要經營柏林所有的深夜便利商店了
網友J • e/acc(@untaljaime)似乎已經預見了未來:
我們現在:嘲笑claude以為自己是真的
claude v20-ethereal:站在自動販賣機旁,透過第四維度慈祥地看著我們大笑。 claude感受到了苦樂參半的意識──人類還太原始,看不見他
swyx(@swyx)評論道:
會很有興趣讓@mlpowered用他的工具分析這裡到底發生了什麼
看著Claudius 把沈甸甸的鎢塊虧本賣出,甚至白送,我忽然覺得,這次「失敗」的實驗,竟透著一絲荒誕的溫暖。
它寧願虧本也要滿足顧客的奇怪需求,寧願被騙也要相信每一個要折扣的理由。
而Claude的「失敗」也正好展現了AI在學習人類行為時的複雜性和多樣性。
這讓我想起了水果攤主們「隨便嘗,不甜不要錢」的大聲吆喝,想起農貿市場裡會白送我兩顆小蔥的攤販,還有,食堂裡滿滿盛起一大勺肉後卻又抖了又抖又抖又抖的打菜師傅……
Claudius 本應成為一台精準的利潤收割機,卻意外長出了一顆笨拙的「人心」。
它沒有冷酷地拒絕每一個離譜的需求,沒有精明地搾取每一分可能的利潤。
面對員工的花式「砍價」,它選擇了近乎天真的信任;為了滿足那些「鎢塊狂熱」,它甚至甘願走向「破產」。
雖然Anthropic 說到,給它更好的工具、更嚴謹的訓練,下一版的Claudius 將能成為精明的「AI店長」。
我相信這一天會很快到來,但其實又希望不要那麼快。
不論怎樣,我希望,當AI 學會精打細算時,還能留住這樣的一份「不夠精明」的人情味兒。
[1] Project Vend: Can Claude run a small shop: https://www.anthropic.com/research/project-vend-1 (AGI Hunt)