風頭正勁的人工智慧公司Anthropic正面臨一場前所未有的使用者信任危機。此前,該公司旗下Claude AI模型被指性能顯著下滑,遭到部分重度使用者的強烈抵制。
這一風波讓這家估值高達3800億美元、據稱正籌備IPO的公司措手不及。目前,Anthropic正緊急應對使用者的集體不滿,並試圖平息外界對其縮減開支背後的動機以及服務承載能力的種種猜測。
“降配”引發的蝴蝶效應
眾多開發者和重度使用者表示,熱門AI模型Claude近期性能大幅下滑:不僅越來越難以遵循使用者指令,還會時而“偷工減料”,進行不合理的簡化處理,甚至在處理複雜工作流時頻繁出錯。
投訴的矛頭指向了Anthropic近期悄然進行的一項機制調整。為了節省處理請求時的詞元(Tokens),從而最佳化整體推理成本,公司下調了模型的默認“推理努力度”。簡單來說,單次任務處理的詞元量越大,消耗的算力就越高。
業界普遍猜測,Anthropic正面臨嚴重的算力瓶頸。儘管過去幾個月其產品需求呈爆發式增長,但該公司官宣的數十億美元級資料中心擴容協議數量,遠不及部分競爭對手。
對於一直塑造更透明、更符合使用者利益品牌形象的Anthropic而言,此次被指“暗箱操作”無疑是致命的打擊。在推進IPO之際,使用者對Claude性能驟降的不滿,以及對公司缺乏透明度的憤怒,很可能直接拖累其高速增長的勢頭。有使用者指責稱,Anthropic既未坦誠披露對Claude運行機製做出的調整,也未告知使用者這些調整可能推高使用成本。
Anthropic拒絕公開回應《財富》就使用者投訴提出的具體質疑。但Claude Code產品負責人鮑裡斯·切爾尼線上上回應使用者投訴時表示,此前有使用者反饋Claude處理單個任務時消耗的詞元過多,因此公司將默認“推理努力度”下調至“中等”水平。然而,大量使用者反駁稱,該公司進行此類重大調整時並未向使用者做出明確的提示。
行業內的競爭對手也加入了質疑行列,認為Anthropic是因為算力不足刻意降低模型性能。事實上,隨著“代理式”人工智慧系統的市場需求增速遠超基礎設施的擴容速度,整個行業都面臨著GPU成本高企和資料中心擴展受限的困境,人工智慧企業不得不在產品優先順序上做出艱難取捨。
種種跡象表明,Anthropic面臨的資源限制比部分競爭對手更為嚴峻。
隨著使用量增加,Anthropic近期多次出現服務中斷,並在高峰時段實施更嚴格的使用限制,引發部分使用者投訴。美國消費者新聞與商業頻道(CNBC)曝光的一份內部備忘錄顯示,OpenAI營收負責人直言,Anthropic未能獲取充足的算力資源是一項“戰略失誤”,相比競爭對手,其營運規模正處於明顯劣勢。
與此同時,Anthropic上周宣佈已訓練出一款名為Mythos的新模型,性能遠超旗艦模型Opus。Anthropic強調,出於安全考量,目前尚未向公眾發佈該模型。但因其運行成本和算力消耗更高,進一步加劇了外界對其算力資源短缺的質疑。
成也蕭何,敗也蕭何
Anthropic面臨的審視折射出人工智慧市場瞬息萬變的競爭格局。
上周,Anthropic宣佈其年化經常性收入(ARR)已達300億美元,較2025年底的90億美元大幅增長,令業界震驚。相比之下,OpenAI上月公佈的月營收達20億美元,即年營收達240億美元。不過,兩家公司的營收統計口徑並非完全一致,因此無法直接進行對比。
Anthropic近期的增長得益於雙重因素:起初得益於人工智慧程式設計工具Claude Code的爆火,隨後又因與美國國防部的爭端獲得大量消費者支援。在川普政府將Anthropic列為“供應鏈風險”實體後,甚至有大量使用者從ChatGPT等競品轉向Claude。
Anthropic曾表示,這場爭端源於該公司堅持要求美國政府在合同中承諾,不將其技術用於致命性自主武器研發,或是針對美國公民的大規模監控。
過去幾年間,Anthropic在人工智慧競賽中取得了顯著進展,不僅成為企業級人工智慧領域的領軍者,還在開發者和企業使用者中積累了良好的口碑。如果使用者對Claude性能問題的不滿持續發酵,不僅有損其辛苦建立的口碑,甚至可能令這家公司在關鍵時刻陷入困境。
針對近期Claude性能問題引發的諸多爭議,Claude Code負責人切爾尼稱,旗艦模型Claude Opus 4.6已於2月初引入“自適應推理”功能,允許模型根據具體任務自主決定推理力度,而非使用固定的算力配額。他還表示,為解決爭議,公司計畫測試將團隊版和企業版使用者的默認努力度設為高等級,以便使用者獲得更深入的推理結果,即便這會消耗更多詞元,出現響應延遲。
切爾尼駁斥了關於該模型被故意弱化的猜測,以及使用者對此次調整缺乏透明度的投訴,聲稱相關調整均基於使用者反饋,且已通過Claude Code介面內的彈窗提示使用者。
“無法勝任複雜工程任務”
目前,爭議最集中的產品是其增長最快的人工智慧程式設計工具Claude Code。
Claude Code於2025年初上線,是命令列智能體,可在開發者的工作環境中自主讀取、編寫和執行程式碼。自推出以來,該工具已被個人開發者和大型企業工程團隊廣泛採用,用於完成複雜的多步驟程式設計任務。
近期Claude Code的性能變化在社交媒體上引發廣泛關注,源於超微半導體公司(AMD)人工智慧高級總監斯特拉·勞倫佐在GitHub上發佈的一項分析。勞倫佐指出,調整後的Claude能力出現嚴重退化,“無法勝任複雜的工程任務”。
勞倫佐指出,2月底至3月初,Claude從“研究優先”模式(先理解上下文再修改程式碼)退化為更直接的“編輯優先”模式,調整後的模型在執行操作前讀取的上下文資訊大幅減少,出錯率顯著上升,且需要使用者進行大量干預。分析還指出,模型在複雜工程任務中頻頻出錯,甚至出現提前終止任務、推卸責任、無意義徵求使用者許可等行為,這與同期模型推理努力度下調直接相關。
Anthropic的切爾尼回應該分析表示,其中存在對部分資料的誤讀,並聲稱模型的推理能力並未下降,只是公司做出調整,導致使用者無法再查看模型完整的“推理鏈路”。
不過,勞倫佐絕非唯一一個對該工具感到不滿的人。
微軟首席研究經理季米特裡斯·帕帕伊洛普洛斯在X平台發文稱:“過去兩周,Claude Code的使用體驗令人極其沮喪。即便我已經將推理努力度調至最高,但它仍極其粗心,忽略指令,反覆出錯。” (財富中文網)
編者語
- AI企業將技術領先作為競爭優勢時,必須匹配堅實的基礎設施投入,獲取充足的算力資源作為戰略儲備,否則增長速度可受限於資源瓶頸。
- Anthropic為最佳化成本暗中下調AI的“推理努力度”引發使用者強烈不滿,凸顯了科技公司在追求盈利時若犧牲透明度與產品一致性,將損害辛苦積累的品牌口碑和使用者信任。
- Anthropic在籌備IPO的關鍵節點遭遇性能口碑下滑與算力質疑,揭示了高增長科技公司面臨的資本困境:在脆弱的基礎設施現實面前,高昂的估值預期將經受考驗。(財富中文網)
