#Anthropic
Anthropic CEO:把模型一路做大,就真能到 AGI 嗎?
2025 年 12 月 4 日,紐約曼哈頓。《紐約時報》DealBook峰會上,主持人 Andrew Ross Sorkin 問了一個所有人都在想的問題:到 AGI(通用人工智慧),還需不需要再來一次像 Transformer 那樣的技術突破?Anthropic CEO Dario Amodei 的回答是:No,I think scaling is going to get us there.(不用,我認為持續擴大規模就能讓我們到達那裡)把模型做大,把算力往上堆,按照這條擴展曲線持續推進,總有一天會撞上類人智能的臨界點。但他緊接著潑了冷水。技術層面,他非常有信心;經濟層面,他看到的卻是巨大的不確定性。Anthropic 過去三年營收增長 10 倍,但Amodei在台上給出的預測模型顯示:未來 Anthropic 收入可能在 200 億到 500 億美元之間波動。只要在資料中心投資上算錯時間點,就可能從盈利軌道滑向現金流危機。在他看來,一些玩家正在用激進方式下重注,把整個 AI 行業推向泡沫邊緣。這場對話引出了三個值得深入的問題:持續擴大規模究竟是怎樣的技術路線?為什麼 Amodei 堅信這條路,卻又不斷強調經濟風險?當 AI 開始重構工作方式,社會準備好了嗎?第一節 | 技術路線:Scaling Law的十年證明不是所有人都敢把 AGI 的終極路徑,說得像流水線一樣簡單。但 Dario Amodei 敢。他說:“我過去十年一直在觀察 Scaling Law,從GPT 到 Claude,我們都是在這條路上。”在這場採訪裡,他這樣描述 AI 能力演化: 你往模型裡加資料、加算力、加結構上的小改動,它就會自然變強。沒有神秘點,沒有範式突破。推理會提升,程式碼會更好,科學、法律、金融、材料……模型在所有方向一起進步。這是他的親身經歷。從GPT-2、GPT-3的早期主導者,到如今帶領 Anthropic 發佈 Claude 4.5。1、Claude 的證明:不是在進化,而是在放大在 Amodei 看來,Claude 的強大不是因為架構更複雜,而是因為整個系統沿著Scaling Law 做到了足夠大、足夠穩、足夠實用。Claude Opus 4.5 的發佈就是一次集中展示: 在SWE-bench Verified編碼測試中達到80.9%,超過GPT-5.1的77.9%和Gemini 3 Pro的76.2%;在科學推理、金融應用、生物醫學資料處理上,Claude 不只是能用,而是開始產生真實的決策影響。更關鍵的訊號來自 Anthropic 內部。Amodei 透露,他們的工程師已經不再打開編輯器從頭寫程式碼,而是讓Claude生成第一版,自己只做編輯和稽核。2、Scaling Law 的驗證路徑,也是一條產品化試驗線Amodei  不只是相信 Scaling Law,他在用真金白銀驗證它。邊走邊投,邊驗證邊調整。Anthropic 三年營收曲線就是最直接的證明:從零到1億美元,再到10億,今年預計達到 90 億美元。模型能力提升,企業需求跟著增長;需求增長,又推動模型繼續進化。Claude 沒有做成爆款對話產品,而是深入企業一線:開發工具、自動化助手、科研合作者。這種更慢但更寬的能力拓展路徑,正是 Scaling Law 在商業化層面的體現。不是打造一個天才,而是批次複製靠譜的合作者。他不是在等 AGI 奇點,而是在把 Claude一步步打造成一整條生產線。這條生產線積累的資料、經驗、客戶關係越多,就越難被覆刻。擴大規模不只是把模型做大,更是把這些積累變成競爭壁壘。別人還在爭論要不要相信 Scaling Law,Anthropic 已經用它建起了護城河。第二節 | 經濟帳本:500億投資如何不翻車Amodei 對Scaling Law 的技術路線有信心,但他也強調:能不能做到是技術問題,做不做得起是經濟問題。模型可以持續變強,但你也必須算清楚經濟帳:那一年能賺錢、要買多少晶片、什麼時候可能資金斷裂。他說:“我們每年收入翻十倍,但我必須今天就決定,要不要買 2027 年的計算資源。”1、500 億投入,是押注也是賭未來Anthropic 公佈了一個驚人的數字:未來四年將在美國投資 500 億美元用於 AI 基礎設施。這包括德州與紐約的資料中心,以及對微軟 Azure雲平台 300 億美元的採購承諾。但 Amodei 給出的解釋是: 如果我買少了,客戶排隊排不到就走了;如果我買多了,收入沒跟上,現金流撐不住,甚至有破產風險。他提出了一個核心概念:不確定性錐形(cone of uncertainty)。這不是 PPT 上的增長曲線,而是 Anthropic 內部做戰略預算時真正畫出來的風險模型:Anthropic 明年的收入可能是 200 億美元,也可能是 500 億美元,這種巨大的不確定性決定了現在該買多少算力、能承受多大風險。2、YOLO派和保守派的路線分叉而 OpenAI 的路線截然不同。雖然 Amodei 沒有直接點名,但他在採訪中提到了 Sam Altman 從巨額虧損衝向 2030 年盈利的計畫,並評價道:“我們看到有公司在YOLO(孤注一擲),把所有籌碼都押上了,幾乎不給自己留容錯空間。”Anthropic 的選擇是另一條路:所有算力採購按最壞10%的收入預期做預算保留高利潤率,用於覆蓋未來兩年scaling投資放棄消費級入口,只服務企業客戶,減少不確定變數這不是慢,而是先確保企業能活下去。為什麼如此謹慎?因為Amodei對未來的高增長保持懷疑。他在對話裡說: 過去三年,每年收入翻10倍。如果我照這條線繼續推,就是明年1000億。 但我不相信真會這樣增長。那只是理論上的最好情況。他強調的是經濟可行性,不是技術可能性。Claude Opus 4.5能力再好,如果企業不續費、資料中心養不起、資本斷供,那Scaling Law再正確,也推不動。真正的路線判斷不是能不能做,而是值不值得投、投不投得起。第三節 | 社會影響:誰受益,誰被替代對於 Dario Amodei 來說,AGI 不是終點,只是過程。技術能力每年增強,但普通人並不會自動跟上。AI 可以快速寫程式碼、做科學研究、處理金融建模,但誰來決定它該做那件事?誰來負責它做錯時的後果?誰從中受益,誰最先被替代?這才是他更關心的問題。1、AI 變強的同時,工作正在加速重構Anthropic 在今年 8 月做了一次內部研究,調研了 132 名工程師和研究員。結果顯示:AI 工具確實提升了生產力,讓工程師能夠處理超出原有專業範圍的任務。但同時削弱了團隊協作、導師制度和技能發展路徑。整體趨勢是,團隊正在變成少數高手+AI的組合。更關鍵的變化是:入門級工程師的工作正在被 AI 取代,寫程式碼變成了監督程式碼,技術崗開始往全端、策略、審校方向轉移。這不只是效率提升,而是職業路徑的根本重構。當新人無法通過寫簡單程式碼來積累經驗時,如何培養下一代技術專家?這是 Anthropic 內部也在思考的問題。2、Amodei的預測:比你想的更冷靜,也更現實在這場 DealBook 對話之前,Amodei已經在11月中旬的 CBS《60分鐘》節目中直面過一個問題:AI 是否會讓大批人失業?他的回答很直接:是的。AI 取代的第一批人不是工人,而是入門級白領,特別是那些在保險理賠、客服、行政、初級技術支援等崗位上工作的人。這些崗位很可能會面臨大規模的工作轉型壓力。但他不是為了製造恐慌,而是提出了三層解決方案:企業層面:不要只用 AI 減人,更要用 AI 放大人的價值。Claude 的正確用法是讓一個人做原來 10 個人的產出,而不是裁掉 10 個人。政策層面:政府需要參與再培訓,但更重要的是分配機制。如果 AI 帶來每年5%-10%的經濟增長,那是一個可以再分配的超級大蛋糕。社會層面:長期來看,人類社會的結構要調整,不再把工作當成唯一意義來源。這不是烏托邦。早在1930年,著名經濟學家凱恩斯(John Maynard Keynes)就在《我們後代的經濟可能性》(Economic Possibilities for Our Grandchildren)中提出過這個預言:技術進步可能最終解放我們,不再為了生存而工作。未來,問題不再是 AGI 能不能做出來,而是你準備好怎麼與它共處了嗎?這條擴展路線不只是技術問題,更是社會問題。誰能率先摸索出人機協作的有效模式,誰就贏得了未來。結語 | 能到 AGI,前提是活著到Dario Amodei 不是來講 AI 奇點故事的。他講的是一條用資料和財務驗證過的路線:Claude 每年變強一點,處理程式碼bug、生成科學推論、搭建專業工作流。這背後是 Amodei 十年如一日相信的一件事:Scaling Law 不靠靈光一現,只靠一步步推演。他用它造出了 Claude,也用它規劃了 500 億美元的投資、90 億營收目標和風險緩衝線。核心問題不是“我們快到AGI了”,而是我們能不能在做出 AGI 的過程中活下來。別人在賭誰先做出突破,Anthropic 在算誰能撐到終點。把模型一路做大,就真能到 AGI 嗎?Amodei 的回答是:可以。前提是你準備好了承擔相應的經濟風險和社會責任。 (AI 深度研究員)
Anthropic啟動IPO!CEO自曝內部算力財務模型:不確定性圓錐!回應泡沫:增長肯定放緩,舊晶片價值快速下降!規模依舊有效
我們買的算力規模,是在“即便是第 10 百分位的悲觀情景下”,大機率依然付得起帳。YOLO式下注,風險旋鈕擰的太狠了。我認為勝率會在我們這邊。幾個小時前,素有“華爾街、矽谷超級提問者”的DealBook 創始人、紐約時報首席財經記者Andrew Ross Sorkin,與 Anthropic 的 創始人 Dario Amodei 展開了一場年末對話。這次採訪背景一方面是大洋彼岸已經處於聖誕前夕,但更重要的一面是,昨天,Anthropic被曝出已經啟動IPO籌備工作,計畫最快2026年上市,估值或達3000億-3500億美元。在此之前,則是 Transformer 架構和 Scaling Law 終結的爭議,以及 Gemini 3 Pro 模型的爆火,OpenAI  內部拉響紅色警報。這些事件的接連發生,讓此前甚囂塵上的“泡沫爭議”和接下來AI模型的發展走向帶來了新一輪的不確定性。Dario在爆出了自家的算力財務模型,他們內部稱之為一個不確定性圓錐。如果我有 80% 的毛利率,我花 200 億美金買算力,可以支撐 1000 億美金收入。但問題在於,這個“不確定性圓錐”實在太寬了,很難避免在某一側犯錯。此前,Dario 就曾表示,Anthropic 計畫在 2028 年實現盈虧平衡。而對於 AGI 的實現路徑,Dario 對於 Transformer 架構依舊保持樂觀:我仍然認為是 “規模化 + 偶爾的小修小補” 就足夠了。對於業界一直擔心的GPU晶片的折舊周期,Dario 回應道:舊晶片的價值會快速下滑。我們在建模時,已經默認舊晶片價值會快速下滑,同時也假設晶片效率曲線會持續高速演進。對於自己經常發出警告這件事,Dario對美國AI監管隱隱表達了不滿:現在美國監管已經分成了兩個世界,應該讓真正最接近AI技術的人來發聲。對於自己曾說過的“90%的工作會被AI替代”言論,Dario說,那只是半句話,下半句則是——那怕 AI 完成了 90% 的工作,而不是 100%,人類的“剩餘 10%”反而會被放大 10 倍,有時候甚至需要 10 倍的人,去完成原來 100 倍產出的事情。問題不在“會不會替代”,而在“企業願不願意更多選擇創造新價值,而不是只做極致降本”。以下是這次採訪的整理內容,大家enjoy!泡沫存在:接下來速度一定會放緩 但有些公司卻在YOLO 式下注主持人(Andrew Ross Sorkin):今天下午的重頭戲從 Dario 開始。他是當今人工智慧領域最具影響力的人物之一,是 Anthropic 的聯合創始人和 CEO,這家公司以 Claude 模型聞名,是歷史上增長最快的科技公司之一,現在更是同時獲得了三大科技巨頭——亞馬遜、微軟和Google的支援。他比大多數人更早進入這個領域,早年在 BYU 做研究,後來加入Google,又成為 OpenAI 的早期成員,主導了 GPT-2 和 GPT-3 的研發。歡迎你來到現場。Dario Amodei: 謝謝邀請。今天可以聊的話題很多,包括——我們是不是正處在一個 AI 泡沫中?但我保證,我們會慢慢談到那個問題。主持人: 那我就直接問那個一開始提到的問題吧。你也承認,2014 年沒人想到 2025 年會走到今天這個程度。現在這個行業吸納的資金規模,幾乎代表了美國當前 GDP 增長的主要來源之一。我們是不是正處在某種泡沫中?是不是在過度投資?Dario: 這是一個非常複雜的問題,我必須把“技術本身”和“經濟層面”分開來看。從技術角度看,我非常堅定,我可能是最樂觀的那一類人之一。 但從經濟層面看,我確實有擔憂。即便技術真的兌現了承諾,生態裡如果有人在節奏上稍微踩錯一步,後果會非常嚴重。先說技術這部分。之所以我對技術進展並不太驚訝,是因為我和幾位後來成為聯合創始人的同事,最早系統性地總結過 AI 的“Scaling Law”——也就是只要你不斷加算力、加資料,在少量結構微調下,模型能力就會持續提升。像推理模型、測試時算力,本質上都是非常小的改動。我已經跟蹤這個趨勢 12 年了。最震撼的是:你用這樣極其簡單的方式訓練模型,它會在幾乎所有領域同步變強——程式設計、科學、生物醫藥、法律、金融、材料、製造業,這些正是整個經濟的核心價值來源。只看 Anthropic 自身,因為我們更偏企業級市場,我覺得更像一個“純粹的溫度計”。我們過去三年,收入每年 10 倍增長:2023 年從 0 到 1 億美元,2024 年從 1 億到 10 億,今年會落在 80 到 100 億之間。未來還會不會這樣漲?我不知道。但技術確實在推動價值,經濟回報也正在兌現。 它一定會放緩,但依然會非常快。所以我對“長期終局的經濟價值”是有信心的。主持人: 但問題在於,現在有公司每年要燒掉上千億美元,你們也計畫投 500 億。Sam Altman 去年的規劃數字同樣驚人。這是一次超級昂貴的下注。這個帳到底能不能算清,還是更多是一種“直覺賭注”?Dario: 這就進入我剛才說的第二部分——真正的困境來自於:“經濟價值增長速度”的不確定性,與“資料中心建設周期”的滯後性之間,存在巨大張力。 這是擺在所有公司面前的真實兩難。我認為有些參與者是在“YOLO 式下注”,把風險旋鈕擰得太狠了,對此我非常擔憂。主持人: 誰在 YOLO?Dario: 這個我不回答(笑)。但你可以換個視角想:如果你站在我這個位置,連續三年收入 10 倍增長,很自然會去問:明年會怎樣?如果你非常粗暴地外推,下一年可能是千億美元等級——我必須強調,我完全不相信這個數字。但它是數學上的上限之一。如果你從更理性的企業客戶、具體場景、銷售路徑去拆,可能是 200 億、300 億。所以我內部把它稱為一個“不確定性圓錐”——一年後是 200 億,還是 500 億,極其不確定。 我只能按最保守的一側去做規劃,但這種不確定性本身就足夠令人不安。算力財務模型 不確定性圓錐實在太寬了Dario : 還要疊加一個現實因素:資料中心建設有很長的滯後周期,通常是一到兩年。這意味著我必須在“現在”,甚至幾個月前,就決定:在 2024 年初要買多少算力,去服務 2027 年初那個收入規模下的模型。這中間存在兩個強耦合風險:第一,如果我買少了算力,我就沒法服務所有客戶,只能把他們推給競爭對手;第二,如果我買多了算力,而收入又沒跟上,我就付不起這些算力的成本,極端情況下甚至會面臨破產風險。這個“安全緩衝”本質上取決於我的利潤率。如果我有 80% 的毛利率,我花 200 億美金買算力,可以支撐 1000 億美金收入。但問題在於,這個“不確定性圓錐”實在太寬了,很難避免在某一側犯錯。Dario: 我們自認為是一家相對克制、負責的公司。因為我們主做企業市場,我覺得我們的商業模式更健康,利潤更穩,也更謹慎。但如果你換成另一種模式,比如純消費者業務,收入來源沒那麼確定、毛利也不穩定,再加上企業家本身就是那種“偏愛 YOLO、偏愛大數字”的性格,那風險旋鈕就可能被擰得非常狠。只要存在不確定性,就必然存在過度擴張的系統性風險。 我們每家公司都面臨這個問題,再加上彼此之間的競爭壓力,甚至還疊加了與威權國家“國家層面的技術競爭”,整個系統都會被推著往前走。這種風險是不可消除的,只能被管理。 但我確實認為,有些參與者並沒有管理好這種風險,而是在進行不明智的下注。主持人: 你說到這裡,其實大家心裡大概也知道你在暗指誰。你曾對投資人私下說過,Anthropic 計畫在 2028 年實現盈虧平衡;而 Sam Altman 說的是 2030 年。我暫且按他的演算法來算:他需要在兩年內從 740 億美元等級的虧損,轉為兩年後實現盈利。這個在你看來合理嗎?Dario: 說實話,我不瞭解任何其他公司的內部財務情況,也不可能評價別人。我只能回到我們自己的計算邏輯,也就是那個“圓錐式不確定性”:我們買的算力規模,是在“即便是第 10 百分位的悲觀情景下”,大機率依然付得起帳。再糟也會存在“尾部風險”,這從來不可能為零,但我們在盡力把風險控制在可承受範圍內,同時又要確保我們在競爭中不被甩開。我們在訓練和推理上都很高效,利潤結構也不錯。我認為勝率在我們這邊。主持人: 現在市場上很多人開始討論所謂的“循環交易”,以前我們管這叫“廠商融資”。尤其是輝達,以及其他一些公司,直接入股 AI 公司,而這些公司隨後又用這筆錢去買輝達的晶片,相當於形成了資金閉環。你怎麼看?Dario: 我們也做過類似的交易,只是不是某些玩家那樣的大規模操作。我不講具體案例,只講一個“標準化結構”的例子,解釋為什麼它在邏輯上成立:假設你要建 1GW 的算力規模,買晶片、建機房,總資本開支大概是 500 億美元,使用周期可能是 5 年,也就是每年攤 100 億。如果你是一家年收入 80—100 億、處在快速增長期的公司,現在就讓你一次性掏 500 億,現實中根本不可能。那怎麼辦?大型廠商站出來說:“我先投你 100 億,佔 20%,你先用這 100 億覆蓋第一年,其餘的慢慢按收入滾動支付。” 如果你已經接近 100 億年收入,那這並不是一個瘋狂的賭局。資料中心一年建成,第一年融資覆蓋,意味著你只要在兩年後做到 100 億等級收入,就能跑得通這套邏輯。從結構上看,這並不違背商業邏輯。Dario: 真正的危險只發生在一個場景:如果你一層層疊加這種結構,最後變成“到 2027 或 2028 年,我必須做到 2000 億美元年收入”,那你就一定是在過度擴張。規模,決定了一切的風險邊界。一批晶片到底能撐過幾年?舊晶片的價值會快速下滑 保守押注者會活下來主持人: 這裡還有一個關鍵變數,幾乎決定了整個行業的“投資算不算得過帳”——晶片的折舊周期。你買一批新晶片,它到底是有效四年、五年,還是八年、十年?這個假設不同,整個行業的財務模型就完全不同。你怎麼看?Dario: 我們在內部做的是非常保守的假設。嚴格來說,並不存在一個固定、統一的“折舊年限”。晶片本身可以跑很多年,真正的問題不是“它還能不能用”,而是有沒有更快、更便宜的新晶片出現,並且你的競爭對手已經在用它了。 一旦出現這種情況,老晶片的相對價值就會迅速下降,甚至一年之內就會發生。現在不止是輝達,各家都在推新一代 TPU、GPU。我們在建模時,已經默認舊晶片價值會快速下滑,同時也假設晶片效率曲線會持續高速演進。我們在 Anthropic 的所有假設,基本都站在極端保守的一側。 結果是:在“幾乎所有世界線”裡,我們都可以活下來。當然,極端尾部世界線一定存在,但我只能為我們負責,不能替別人背書。我也完全可以想像,有些公司正在“自我欺騙”,建立在過度樂觀假設之上。主持人: 所以,市場上真正理性克制的,其實就你們兩家?Dario: 我不知道你在指誰(笑)。我真的不知道。ps:這裡小編猜測,所謂市場上真正保持克制的這兩家,一家自然是Anthropic,另一家90%的機率是指的 Amazon。(同樣瞄準的是企業市場,而且沒有過度囤卡。用排除法的話,只剩下 Amazon 和 Apple 了。然而Apple 算是大模型玩家嗎???不大會。)不卷C端!GoogleGemini強歸強,Claude清風拂山崗主持人: 那我們換個話題,聊聊模型本身的競爭格局。就在過去一周,矽谷內部幾乎“情緒失控”,因為某位你我都認識的人發佈了新模型,引發了巨大震動。Saraparay 去年也來過這裡,現在大家突然意識到,原本被認為“資料天生佔優、理應贏麻了”的 Google,可能真的開始發力了。 Sam Altman 內部甚至發了“紅色警報”郵件,讓所有人回到工位衝刺下一輪突破。在你看來,現在這些模型的真實排序是怎樣的?以及,這種“當下時刻的領先”,到底有多重要?Dario : 這是少有的幾個時刻之一,我真心覺得 Anthropic 選擇了一條不同的道路,是一件值得慶幸的事。 我們走的是企業市場路線。你剛剛提到的另外兩位玩家,本質上都還是以 消費者市場為核心,雖然也在做企業業務,但主戰場仍在 C 端。這也是為什麼會出現“Code Red”那種等級的內卷——Google 要守住搜尋壟斷,而 OpenAI 的核心陣地也在消費者端,這兩家是在正面肉搏。對他們而言,企業只是“第二戰場”。而我們過去幾年一直在 圍繞企業真實需求反向打磨模型能力,最先爆發的是程式設計,現在已經開始延伸到金融、生物醫藥、零售、能源、製造等領域。模型戰爭當然重要,比如我們上周剛發佈的 Opus 4.5,在程式設計能力上幾乎被公認為目前行業最強模型。但我們真正走的是“不同維度”的競爭路線,所以對這種你來我往的短期廝殺,依賴反而更低。某種意義上,我們處在一個相對“優越”的位置:可以持續增長、持續迭代模型,而不用天天發“紅色警報”。企業級AI很挑模型,遷移成本很高 專精能力會和AGI長期並存主持人: 那這些公司真正的“護城河”到底是什麼?如果有一天真的到了 AGI 等級,所有模型是不是都會趨同?誰還會在乎你用的是那家?是“記憶能力”嗎?還是人格差異?很多人現在就是那個新就用那個。Dario: 我只能從企業側講我的結論。為企業打造的模型,和為消費者打造的模型,在“性格”和“能力結構”上差異非常大。 企業模型更少追求“黏性與娛樂感”,更強調編碼能力、高階智力活動、科學推理能力。我也不認同“只要到了 AGI,所有東西都會收斂成一個形態”。你看看在座的所有人,都具備“通用智能”,但我們沒有變成同一種人。專精能力會和通用智能長期並存。 再加上企業側的現實因素:公司會形成使用習慣,會和某個模型建立長期關係。即便是在 API 這種“賣裸模型”的業務裡,遷移成本也極高。下遊客戶適應了某個模型的“脾氣”,提示詞、互動方式都深度繫結,切換代價很大。這意味著企業級 AI 具備長期穩定的商業粘性。通往AGI,“規模化+小修小補”足夠了主持人: 一個純技術問題:你認為,現在這種基於 Transformer 的架構,加上純算力規模化,本身就足以通向 AGI 嗎?還是說還缺“某個關鍵成分”?Dario: 我仍然認為是 “規模化 + 偶爾的小修小補” 就足夠了。這些修改之小,小到外界可能根本不會注意到,只是實驗室裡的技術迭代。我已經觀察這些 scaling laws 超過 10 年了。主持人: 那你的時間判斷呢?AGI 在什麼時候?Dario: 我其實不太喜歡“AGI”“超人工智慧”這些詞,因為沒有清晰定義。它更像 晶片摩爾定律式的指數曲線——模型會在所有維度持續變強:新模型比上一代程式設計更強、科研更強,現在已經常態化拿下高中數學競賽,正在沖大學數學,甚至開始 首次產生“全新數學發現”。Anthropic 內部已經有人對我說:“我現在已經不寫程式碼了,我只是讓 Claude Code 先打草稿,我負責修改。” 這種狀態,在過去從未真正出現過。 這個節奏只會繼續加快,沒有所謂“質變奇點”,只是能力持續外推,模型的智力不斷抬升,收入曲線不斷往後面加零。美國AI監管已經分成了兩個世界主持人: 你在(美)監管、就業衝擊這些問題上也相當激進。白宮的 David Sacks 曾公開指控 Anthropic 正在通過“製造恐慌”推動監管,從而進行“高階版的監管俘獲”,並且已經傷害了創業生態。你怎麼回應?Dario: 我還是那句話:不要把這場討論變成對個人或單一機構的攻擊。 我從 2016 年起就開始公開寫 AI 風險和治理的論文,那時候 Anthropic 這個公司根本還不存在,更談不上什麼“監管俘獲”。而且我們支援的幾乎所有監管法案,都明確為中小型創業公司設立了豁免條款。 比如我們支援的 SB53 法案,年營收低於 5 億美元的公司根本不在適用範圍內。 我們在這件事上非常謹慎。真正該討論的,不是立場對立,而是具體政策是否合理。Dario: 你可以拋出各種指控,但這些說法和現實完全不符,無論是和我們實際支援過的法律條文,還是和真實情況,都對不上。現在其實存在兩個世界:一邊是 Andreessen Horowitz 等人,他們支援一個超級政治行動委員會;你們這邊也在建構另一個超級 PAC,試圖用完全不同的方式去影響這個行業的監管。問題是,為什麼?你們看到了什麼,是他們沒有看到的?我還是想把討論維持在政策層面。我對這項技術的看法是:我能理解一些人的樂觀來源,但我確實擔心,有一部分人把 AI 視為類似網際網路、通訊技術那樣的技術革命,覺得市場自然會解決一切問題。放在過去那些技術浪潮裡,這種看法也許是成立的。但真正最接近 AI 技術的人,並不這麼看。如果你去問那些真正做 AI 研究、真正建構模型的人——不是投資某些 AI 應用的投資人,也不是自以為懂 AI 的技術評論員——你會發現,他們一方面對潛力感到興奮,另一方面也非常擔憂。他們擔心國家安全風險,擔心模型對齊問題,擔心 AI 對經濟結構的衝擊。 舉個例子,有人曾提出要在十年內凍結所有監管,或者凍結州一級監管,而聯邦層面又沒有統一框架。這種提案去年夏天就出現過,上周又嘗試了一次,結果再次失敗,因為它極不受歡迎。連普通大眾都清楚,這是一個全新而且極具力量的技術。我可能是對 AI 正面效果最樂觀的那一類人之一。 我寫過一整篇文章《Machines of Loving Grace》,我在裡面說,AI 甚至可能把人類的壽命延長到 150 歲。再往後推,當資料中心裡真的出現“天才之國”,我們將擁有一個比任何人類都更快做出生物學發現的虛擬生物學家;它可能把經濟增速推到 5% 甚至 10%。老實說,我對這項技術的樂觀程度,可能比很多自稱“技術布道者”的人還要高。 但一切如此強大的東西,都不可能沒有巨大的副作用。作為一個社會,我們必須提前思考這些代價。 如果你說未來十年都不去監管這種技術,這就好比你在高速路上開車,然後決定把方向盤拆掉,因為“未來十年我都不需要轉向”——這在邏輯上是說不通的。老闆們不應該只做極致降本,而忽視創造新價值 90%的工作被AI替代,但剩下的10%會被放大10倍主持人: 那我們就談談其中一個最具體、最現實的風險——就業。除了駭客攻擊這些問題,你最近在《60 Minutes》裡也談到過工作崗位。我想知道的不是“有沒有可能”,而是,如果真的出現大量入門級崗位被替代,你認為應該怎麼應對?Dario: 我之所以不斷髮出這些警告,並不是為了當什麼末日預言家,而是因為“發出警告本身,就是解決問題的第一步”。如果我們不提醒自己風險的存在,就相當於在雷區裡閉著眼睛往前走;如果我們看見了地雷,就可以繞開它。我這段時間在認真思考這些問題,在 Anthropic 內部也是一樣。現在 Claude 已經開始為我們寫大量程式碼,我們也在親身經歷“工作如何發生變化”。我把應對方式分成三個層級,從短期到長期,也對應從企業就能推動,到需要整個社會投入更多資源。第一層,是企業自身與客戶層面的調整。 每一家客戶都會面臨同樣的權衡,這不是簡單的“取代或不取代”。一部分場景中,AI 會直接完成原本由人類完成的工作,比如保險理賠流程、KYC 全流程自動化,這些都可以端到端由 AI 完成。結果就是:更高效率、更低成本、更少人力。但還有另一種路徑——那怕 AI 完成了 90% 的工作,而不是 100%,人類的“剩餘 10%”反而會被放大 10 倍,有時候甚至需要 10 倍的人,去完成原來 100 倍產出的事情。問題不在“會不會替代”,而在“企業願不願意更多選擇創造新價值,而不是只做極致降本”。 前一種他們一定會做,我們也不打算攔;但如果他們願意更多做第二種,新增崗位也可能超過被替代的崗位。第二層,是政府的介入。 我並不把“再培訓”視為萬能解法,但它一定是必要選項的一部分。企業會做,企業也必須和政府一起做。但從財政層面看,我認為政府遲早要介入。我不確定具體是稅收工具,還是其他政策工具。但在一個高速增長的世界裡,我們曾做過一份報告,即便是今天這些模型,也已經能讓生產率每年提高 1.6%。這幾乎意味著生產率的翻倍,而且模型還在不斷變強。我認為未來有可能到 5%,甚至 10%。 這是一塊極其巨大的“蛋糕”。如果財富過度集中,這塊蛋糕本身也足夠大,大到我們完全有條件照顧到那些並未直接從 AI 中受益的人。第三層,是更長期的社會結構問題。 如果一個社會真正建構出了強大的 AI,它的運行方式必然會發生變化。回到凱恩斯在《我們後代的經濟前景》中提出的“技術性失業”,他設想他的孫輩也許每周只需要工作 15 到 20 個小時。這是一種完全不同的社會結構。當然,總有人會選擇拚命工作,但是否可能出現這樣一個世界:對很多人來說,工作不再是生活的絕對中心,意義的來源發生轉移,工作不再只是為了生存,更偏向於實現感?這種可能性真實存在。 我不是在提任何自上而下的規劃,我只是認為,社會終究會在後 AGI 時代,自己找到新的運行方式。這三層變化,從企業層面最容易、最快發生,到政府層面需要共識,再到社會結構層面最慢、最難推進。但未來很多年裡,我們三件事都必須一起做。主持人: Dario,我真心希望你還能再回來,和我們繼續討論這三件事該怎樣一步一步落地。非常感謝今天這場精彩的對話。Dario: 謝謝你,Andrew。謝謝大家。 (51CTO技術堆疊)
從Google投資Anthropic案例思考AI投資的非排他性
今年三季度Google的財報中,投資收益引人注目,前三季度的浮盈已經達到220億。Google的這類非市場化股權投資通常與其戰略需求,或對其生態系統至關重要的AI 初創公司投資有關。今年的盈利主要來源於對Anthropic的投資。Anthropic是目前全球估值最高的未公開上市AI 公司之一。相比其它股東,Google投資金額較小,但入局早。從Anthropic的籌資歷史與估值變化中,可以看到其受到了資金的極度追捧。2021-2022,早期投資5.8億,來自於現在已經破產的FTX。2023年9月-2024年11月,亞馬遜承諾投資40 億美元。2023年10月,Google承諾投資20億。2024年3月,由 Lightspeed 領投E輪,籌資27.5億,估值達到615 億美元.2025年8月,由ICONIQ Capital 領投,籌資130億,估值達到 1830 億美元。2025年11月,微軟和輝達聯合投資150億。微軟約 50 億美元,輝達約 100 億美元。估值猛增至約 3500 億美元,是Google投資時的87倍!Anthropic是由前OpenAI 的核心研究人員在2021年創立的。其Claude 系列大型語言模型是當前市場上唯一能在性能上與ChatGPT 和Gemini抗衡的頂級模型。Claude與其它模型的不同之處,在於其專注於那些能在近期產生經濟效益的,企業級市場,模型的程式設計能力尤其強大。它對Google的DeepMind和 OpenAI關注的數學推理等領域則投入較少。可以看到,科技公司們正在根據自身技術稟賦和戰略目標,來選擇最能實現商業變現的細分領域進行深度挖掘。市場足夠大,容得下差異化競爭。2024年3月,Anthropic的E輪融資估值為615億美元。一年半後的2025年8月F輪融資,估值為1830億美元。這給Google和亞馬遜帶來巨大的帳面收益。短短兩個月後的11月,微軟和輝達也投資入股,估值幾乎翻倍,達到3500億美元。這說明Google的第四季度將同樣獲得可觀的帳面股權投資收益。Google和亞馬遜投資的主要目的之一是確保Anthropic 在其 AI 模型開發和訓練中,使用自己的雲服務。Google雲在與 Anthropic 簽訂的價值高達數百億美元的合同中,承諾提供大規模的Google自研的TPU AI 晶片,為其提供超過千兆瓦的計算能力,用於模型訓練和擴展。通過融資,Anthropic巧妙地鞏固了所有主要雲服務提供商和輝達的算力支援。從這個案例中可以看到,這些科技巨頭之間的關係錯綜複雜,Anthropic與它的股東們的關係既競爭又合作,還互相投資。比如Gemini 是Claude在產品和技術上的主要對手,而Google雲又提供了Anthropic關鍵的基礎設施。這樣的關聯交易就是大空頭Micheal Burry認為AI有泡沫的依據之一。非排他性值得注意的是,所有這些股權投資和業務上的合約都沒有排他性條款。比如,Google和亞馬遜在投資Anthropic的時候,並不限制Anthropic使用對方的雲。類似的,輝達投資OpenAI時,也不限制OpenAI買別家的晶片。在傳統行業,排他性競爭是主流。股權投資經常作為換取稀缺實物資源,比如礦產,的長期獨家控制權的籌碼。這是因為,傳統行業的市場規模增長速度通常與經濟增長速度持平或略高,是線性增長。在有限的市場中,競爭必然是排他性的。企業會通過法律合同、獨家供應協議、收購競爭對手等方式來消除競爭,實現市場份額最大化和垂直整合。而AI領域的技術和市場特徵與傳統行業截然不同。首先,AI創造了全新的、指數增長的需求,尤其是在算力和應用領域。ai技術的複雜性與垂直整合難度,意味著沒有一家企業能從底層晶片、中介軟體、基礎模型、到應用層都做到最好。每一家都可以在自己擅長的領域發展,而不威脅到競爭對手。比如,Google的TPU晶片即使開始對外銷售,擴大市場份額,也不會影響輝達GPU的需求量。因為兩者服務的是不同的需求對象,而且對兩者的需求都遠大於供應。在市場巨大、資源稀缺、技術複雜這些因素的作用下,合作比排他性競爭能帶來更高的回報。AI巨頭們對前沿公司,如Anthropic、OpenAI的投資,能獲得技術,商業機會和投資回報等多重收益:通過鎖定技術和人才來對衝落後的風險。投資競爭對手的模型可以讓雲巨頭們獲得對最新AI 技術、能力和人才的近距離觀察,有助於他們縮小自身模型的差距。股權合作可以確保最新的頂尖模型優先部署在自己的雲服務上。Anthropic授權Google雲和亞馬遜雲AWS,將 Claude模型整合到Google雲的AI 服務生態Vertex AI和亞馬遜的AI 模型服務平台Amazon Bedrock 上。這允許Google雲和AWS的使用者通過 API 介面,直接在兩者的環境中呼叫 Claude用於建構自己的應用。使用者使用 Claude 模型時,Google雲和AWS會向 Anthropic 支付授權費用。由此,Google和亞馬遜成為Anthropic的戰略合作夥伴和分銷商,而不僅僅是算力供應商。這是AI時代基礎設施與模型技術深度繫結的競合模式。自然而然地,Anthropic盈利能力的提升,推動估值,也會給Google和亞馬遜帶來巨大的投資回報。從Anthropic的角度來看,則獲得了將計算資源進行最優配置的能力。它同時獲得Google的 TPU,亞馬遜的 Trainium/ Inferentia,以及微軟的 Azure的基礎設施支援,可以確保最先進的模型可以運行在最適合它們的硬體上,最大化技術產出。社會意義這些非排他性的投資與合作,還會產生一個更宏大、更具社會意義的結果。那就是促進整個AI行業的技術進步、擴大其社會應用範圍,進而激發全社會對AI的接受度和需求。首先,非排他性能更好地支援分散式創新,更有可能突破技術瓶頸,達到效率的極致化。Anthropic專注於 AI 安全和編碼,OpenAI 專注於通用智能,DeepMind 專注於科學發現。這種多點開花的競爭模式比任何一家公司內部研發都更有效率。巨頭們通過非排他性投資,可以外包一部分前沿研究的風險和成本,同時受益於所有方向的突破。其次,當市場上多個優秀且可信賴的AI 產品(Claude, ChatGPT, Gemini)出現時,企業和公眾對AI 技術的接受度會更快、更廣泛。當前這波由生成式AI 驅動的社會接受速度,在科技史上是前所未有的。參考歷史上,新技術達到1億使用者所需的時間,固定電話用了75年,手機16年,網際網路7年,臉書4.5年,而ChatGPT才僅僅用了2個月。如果用技術採納生命周期來衡量,AI目前正處於從早期採納,向加速滲透過渡的關鍵時期。在個人層面,已經超過數億人在使用AI 進行寫作輔助、程式碼查詢、資訊總結、日程規劃和創意生成。Google的生成式搜尋體驗和微軟的Copilot,正在將 AI 回答直接整合到搜尋結果中,這意味著每一次搜尋都在使用 AI。新一代智慧型手機、電腦作業系統正在將大語言模型作為底層能力內建,使用者在不知不覺中已經在使用AI。企業也已經認識到AI 不是可選項,而是保持競爭力是必須項,正在重金投資部署。Microsoft Copilot、GitHub Copilot 等工具被大規模採購,用於提升知識工作者和程式設計師的效率。企業正在將AI 模型,如Anthropic 的 Claude 或 Gemini,作為新的 API 介面整合到其核心業務系統和軟體中,實現資料分析和決策的自動化。未來當AI模型更加安全、專業和可信賴,垂直領域的關鍵應用也被成功開發和部署後,AI 會真正嵌入到各個傳統行業中,真正提升實體行業在物理世界的生產力。那時,AI 的廣泛應用將創造出目前我們無法想像的新商業模式和工作流程,這反過來會產生對大規模、持續、複雜算力的巨大需求。最終回到巨頭們投資的核心收益:建立未來的盈利基礎。算力消耗本質上是技術被社會接受度提高的最終結果。因為如果AI 不能廣泛應用於社會並改變生產力,那麼對算力的需求就會停滯不前。通過非排他性協議,讓被投資企業取得成功,從而最大程度地激發整個AI 生態系統的繁榮,最終將推動底層基礎設施和巨頭們自身產品的需求。 (一顆南瓜籽的成長)
壓倒世界第一,這個比OpenAI更能增長、更會賺錢的“叛徒”是誰?
01單仁牛商有很多學員都是製造企業,在輔導他們的過程中,有一些企業家經常會問我:“我在自己領域做的很不錯了,我能不能不做供應商了呢?我有好的技術,好的產品,我難道不能自己去C端做個品牌,成為第一嗎?”如果你也有一樣的問題,那我們不妨想一想,當世界第一,成為大眾市場領導者的煩惱是什麼?我想應該是本以為可以一覽眾山小的時候,突然發現有位“熟悉”的後來者邁著更穩健的步伐,從另一條道路走向自己,甚至更高的地方走來。這一幕其實發生在很多領域,包括今天的AI。像我們熟悉的OpenAI,截至到2025年11月,ChatGPT佔據了生成式AI市場約61%的份額,是當之無愧的全球第一,2025年預計營收130億美元,也遙遙領先於所有競爭對手。然而,在AI包括我們眾多的市場當中,其實存在著兩個截然不同的平行世界。一個是大家熟知的屬於大眾C端、以流量為核心的消費者世界。另一個就是我們往往不熟悉的屬於B端、以效能為核心的企業世界。儘管OpenAI在C端維持著統治地位,但是,在B端乃至商業化上,OpenAI卻遠遠落後另一家企業,Anthropic。當然,如果你沒有聽過這家公司,你可以去問問一位程式設計師,你覺得程式設計最好用的AI是什麼?如果他告訴你是Cursor或者是Claude,那就沒錯了,它們的底層模型和架構都是由Anthropic開發的。在AI領域的B2B市場,Anthropic才是那個比OpenAI更亮眼,更穩健的領導者。所以,今天的單仁行,我們來看看賣鏟子的商業模式,跟賣門票的商業模式,到底有什麼區別?Anthropic是如何在2B市場取得了領先?02其實,這兩家公司非常有緣分,就像矽谷八叛徒一樣,Anthropic也可以當成是OpenAI的“叛徒”。因為它的創始團隊全部都是前OpenAI的核心員工,包括研究副總裁達里奧·阿莫迪,而他們的離開就是源於OpenAI內部對AI發展路徑的根本分歧。山姆·奧特曼認為,OpenAI要加速GPT模型的商業化部署,通過先發優勢搶佔大眾市場;而阿莫迪這一系認為要先解決AI的穩定和安全問題,它必須是建構AI系統的核心約束條件,不應該急著向大眾市場投放,而是要從專業領域逐步滲透。雙方談判無果後,阿莫迪在2021年帶著這一系出走成立了Anthropic,而山姆·奧特曼在第二年也就是2022年10月就向全世界發佈了ChatGPT。當然,我們無法去評判誰對誰錯,但是這種分歧就天然決定了兩家企業截然相反的商業模式和產品風格。OpenAI就像一位賣門票的聚合者,什麼意思呢?就像亞馬遜,它是平台商,幫助商家把貨賣給消費者,但它又是零售商,它自己也開店賣東西給消費者。OpenAI比亞馬遜更直接,它是“以供應為中心”把所有使用者都通過ChatGPT這個入口聚合起來,然後建立一個大商場,直接向終端使用者收費,並且,由自己來控制使用者體驗的每一個環節。所以,OpenAI就迫切的需要使用者注意力,它希望每個用AI的人都用自己。但是,Anthropic不一樣,它是一個賣鏟子的賦能者,什麼意思呢?它只想建立基礎設施,“以需求為中心”幫助其他企業挖掘使用者價值,終端使用者可能根本都不知道它的存在,但在實際使用的時候卻離不開它。舉個例子,就像我們熟悉的支付寶,我們要交易需要登陸支付寶的帳戶,使用支付寶的介面,包括我們在其他平台購物,如果要支付寶去結算,也要登陸支付寶的帳戶,實際上,支付寶已經成為了一個C端的品牌。而Anthropic不想當支付寶,它想當的是像Stripe這樣的支付處理商,也就是給其他企業打造支付解決方案,即使有2C的能力,但它不干具體的應用,不面向終端使用者。03那麼,這兩種商業模式上的區別,帶來了什麼不同呢?OpenAI今天73%的收入來自使用者訂閱,只有27%來自API和企業級服務。我們知道AI應用在今天普遍面臨一個最大的問題,那就是普通人用不到。不管是在中國,還是國外,普通使用者在付費訂閱一個月後就會滿足好奇心取消付費,使用免費模型,它的續費流失率高達90%。而且,一般使用者跟AI的交流通常是低價值的閒聊,但它的推理成本卻一樣高,根據統計,OpenAI每賺1美元,就需要花費0.75-0.85美元用在計算和人力成本上。再加上OpenAI需要不斷投入巨額行銷費用和算力來獲取新使用者,還要推出語音模式、圖像生成(DALL-E 3)和視訊生成(Sora)功能來提升使用者的持續復購。所以,OpenAI拿到130億美元收入的另一面,是預計2025年虧損超過140億美元,同時,他們把盈虧平衡點推遲到了2030年。根據匯豐預測,OpenAI想要維持到2030年,至少有2070億美元的融資缺口。這就是OpenAI為了成為AI終端市場第一,要付出的代價。而Anthropic的業務中,有85%的收入都來自企業客戶和API呼叫。他們從一開始就把目標使用者定位在了專業領域的企業客戶,並且瞄準了企業客戶最核心的痛點:可控性、隱私安全和複雜邏輯推理的穩定性。Anthropic沒有去做通用大模型,而是獨創了一套“憲法AI”技術,通過預設原則來訓練模型,而不是依賴人類互動的反饋強化學習。同時,他們給企業開放審計介面,根據企業需求來定製原則,所以,他們的模型從一開始就不存在幻覺。像程式碼就是無法容忍AI的幻覺,要麼就運行成功,要麼就報錯,沒有中間地帶,而在AI程式設計市場,Anthropic的市場份額達到了42%。同時,Anthropic把大量的資源和技術都投入到幫助企業去訓練專業模型上,像全球最大的避險基金橋水就是Anthropic的客戶,核心原因就是他們能夠確保AI在嚴格的合規範圍內運行,只回答專業領域的專業問題。所以,企業客戶一旦把Anthropic整合到自己內部知識庫、客戶系統和程式碼開發中,替換的成本就無限高。更重要的是,隨著企業擴大使用範圍,從一個部門擴展到全公司,現有客戶的收入會自然增長,淨收入留存率(NDR)就超過了100%。在2024年初,OpenAI的收入規模是Anthropic的15倍,但到了2024年底,這個差距縮小到了5倍,而在今年8月份,Anthropic的收入已經達到了OpenAI的一半,並且,這個收入比OpenAI要穩定的多,也就是純利要高得多。04我想,對很多企業來說,成為大眾市場的領導者當然很美好,但它的風險也是極其高的,就像OpenAI向我們展示了AI的魔力,通過C端應用的爆發式增長喚醒了世界,但自己也陷入了高流失、高成本和缺乏明確2C商業模式的困境。所以,真正想要持續、穩定的增長,就要像Anthropic一樣弄清楚如何去賺錢。不是向所有遊客兜售門票,而是向那些礦業公司出售鎬和鏟子,而且是符合他們特定的標準、能夠不斷進步的鎬和鏟子。 (單仁行)
終結OpenAI壟斷的11人
【新智元導讀】估值飆升至3500億美元,Claude Opus 4.5強勢登頂企業級市場,Anthropic正式終結了OpenAI的獨角戲時代。從Instagram創始人到OpenAI的「決裂者」,這11位頂尖人物組成了矽谷最豪華的「復仇者聯盟」。他們用一場驚天逆襲證明,在通往AGI的狂飆突進中,對安全的極致堅守才是最深的護城河。如果你在2021年走進Anthropic的辦公室,看到的只是一群從OpenAI「叛逃」出來的理想主義者;但如果你今天再看Anthropic的高管名單,你會發現這已經不再是一個簡單的實驗室,而是一支足以撼動矽谷版圖的「全明星復仇者聯盟」。隨著Anthropic的估值在本月飆升至驚人的3500億美元,Claude Opus 4.5更是拿下了企業級市場32%的份額。在這個龐大的數字帝國背後,是11個性格迥異、背景傳奇的掌舵者。他們有人曾一手打造了Instagram,有人曾是OpenAI最核心的大腦,有人則是守護過Netflix全球資料的守夜人。這是一份關於信仰、決裂與重塑的名單。權力的雙核:兄妹與決裂故事的起點始終是Dario Amodei(CEO)。這位前Google科學家和OpenAI研究副總裁,在四年前做出了一個震驚業界的決定:帶著六名親信出走。原因很簡單,他無法接受老東家在安全問題上的激進。Dario是那種典型的「技術苦行僧」,他拒絕了OpenAI的併購提議,堅守獨立研究。而站在Dario身旁的,是他的親姐姐Daniela Amodei(總裁)。哥哥仰望星空,妹妹腳踏實地。Daniela有著極罕見的履歷:從政治競選的泥潭中摸爬滾打,轉型為Stripe的風控經理,再到OpenAI的安全副總裁。在Anthropic,她是那個能讓理想主義落地的人,直接管理著包括CTO在內的核心高管,確保這家公司的骨架不會被飛速增長的肌肉壓垮。矽谷頂流的跨界當「濾鏡」遇上「大腦」最令人意想不到的加盟者,無疑是Mike Krieger(首席產品官)。作為Instagram的聯合創始人,他曾定義了全球數億人的視覺語言。在將自己的新聞應用Artifact賣給雅虎僅一個月後,他就閃電加入了Anthropic。Krieger的到來是一個強烈的訊號:Claude不想只做工程師的玩具。這位擁有極致產品嗅覺的產品天才,正準備把冷冰冰的模型變成人人愛用的國民級產品。同樣來自頂級商業戰場的還有Rahul Patil(CTO)。兩個月前,他剛從支付巨頭Stripe的CTO位置上卸任。在微軟、亞馬遜和甲骨文歷練多年的他,深諳如何駕馭龐大的工程系統。如今,他接過了指揮棒,掌管著這家AI巨頭所有的工程命脈。「叛逃者」聯盟:為了即使機器不失控在技術核心圈,Anthropic幾乎匯聚了「反叛軍」的精華。Jan Leike(對齊科學負責人)的名字本身就是一面旗幟。他曾是OpenAI「超級對齊」團隊的聯席主管,卻因絕望於前東家對安全的忽視而憤然離職。他的名言「為後AGI時代的人類繁榮而最佳化」,在Anthropic找到了真正的共鳴。在這裡,他不再是孤獨的守望者,而是掌舵者。Jared Kaplan(首席科學官)則是一位理論物理學家出身的「第一性原理」信徒。作為約翰霍普金斯大學的教授,他用量子場論的思維去解構神經網路,為公司確立了長期的科研航向。Tom Brown(首席計算官)曾是GPT-3的幕後締造者。這位自學成才的工程天才,如今正在指揮一場被YCombinator稱為「人類歷史上最大規模的基礎設施建設」。他的任務簡單而艱巨,為甚至還沒誕生的ASI打好地基。Sam McCandlish(首席架構師),另一位擁有史丹佛理論物理博士學位的初創元老。他的論文引用量超過10萬次,但他並沒有留在象牙塔裡,而是從CTO轉型為架構師,專注於那些最硬核的模型訓練難題。守夜人與布道者在這個充滿了不確定性的時代,安全感是最大的奢侈品。Vitaly Gudanets(首席資訊安全官)曾在Netflix全球擴張期間守護其資料安全。作為Lightspeed的營運合夥人,他看慣了科技圈的起起落落。今年9月,他選擇站到Anthropic的城牆上,為這艘巨輪抵禦來自網路世界的暗箭。Jack Clark(政策負責人)則有著最獨特的視角。他從彭博社的一名科技記者起家,寫出了著名的Import AI通訊,最終轉型為OpenAI的政策總監並隨後聯合創立了Anthropic。他是這個極客團隊對外的窗口,遊走在各國政府與國際組織之間,試圖為AI制定規則。Krishna Rao(CFO),這位曾在Airbnb和Fanatics掌管財務戰略的高管,正在為Anthropic繪製一張通往兆市值的藏寶圖。這11個人,有的來自象牙塔,有的來自名利場;有的為了逃離危險,有的為了追尋真相。他們聚在一起,相信人類的理性可以駕馭自己創造的神蹟。在這個瘋狂加速的時代,或許只有這群曾見過深淵、並對其心存敬畏的人,才配握緊那把通往未來的鑰匙。 (新智元)
突發!Claude Opus 4.5程式設計世界第一,把GoogleOpenAI踢下王座
【新智元導讀】深夜,Claude Opus 4.5重磅出世,程式設計實力暴擊Gemini 3 Pro、GPT-5.1。才一周的時間,AI圈就完成了一次閉環式迭代。全球編碼王座,一夜易主。果不其然,Anthropic深夜放出了Claude Opus 4.5,堪稱全球最頂尖的模型。它不僅程式設計強,而且智能體和電腦使用(computer use)能力也是一流。Opus 4.5的誕生,標誌著AI能力再一次飛躍,更將在未來徹底變革工作的方式。基準測試中,Opus 4.5的編碼、工具呼叫、電腦使用的成績刷新SOTA,比Sonnet 4.5、Opus 4.1領先一大截。不僅如此,就連發佈不過一周的Gemini 3 Pro、GPT-5.1慘遭降維打擊。SWE-bench Verified一張圖,直接證明了Opus 4.5強大實力,80.9%的精準率,世界第一。同時,在ARC-AGI-2評估中,Opus 4.5(64k)拿下了37.6%的高分。Opus 4.5這版厲害之處:在無需人工干預的情況下,就能處理模糊資訊,還會權衡利弊。即便是遇到複雜的多系統漏洞,也能夠找出修複方法。總之,用起來就一個感覺——「一點就透」。內部評估中,Opus 4.5+Claude Code聯動使用,平均生產效率暴增220%。目前,Opus 4.5已在APP、Claude API和三大主流雲平台中上線。價格方面,相較以往暴降不少,輸入5美元/百萬token,輸出25美元/百萬token。Gemini 3 Pro干翻了GPT-5.1,但如今,就編碼性能,Opus 4.5全面碾壓前兩者。不過一周的時間,AI圈真正閉環了。程式設計之王回歸,真SOTA有一說一,Claude Opus 4.5是地表最強程式設計模型。它智能、高效,是目前全球在程式設計、AI智能體(Agents)以及電腦操作方面最強悍的模型。Anthropic研究員Adam Wolff豪言,也就在明年上半年,軟體工程徹底終結了。在深度研究、處理PPT和電子表格等日常任務上,它也有顯著提升。在真實場景的軟體工程測試中,Claude Opus 4.5更是刷新SOTA:在SWE-bench Verified上的對比,Opus 4.5得分最高與Opus一同發佈的,還有Claude開發者平台、Claude Code以及消費者端App的更新。Anthropic為長時間運行的智能體提供了新工具,並帶來了在Excel、Chrome和桌面端使用Claude的新方式。在Claude App中,長對話不再會因為上下文限制而中斷。碾壓Gemini 3,超越人類首先,Opus 4.5在視覺、推理和數學能力上均得到了全面提升,並在多個領域達到了業界頂尖水平。尤其是,在編碼、智能體、電腦使用三大項,完勝Gemini 3 Pro、GPT-5.1。其次,在程式碼方面。Opus 4.5編寫的程式碼質量更高,在SWE-bench Multilingual測試的8種程式語言中,它有7種都處於領先地位。Opus 4.5能夠輕鬆解決具有挑戰性的編碼問題,在Aider Polyglot測試中比Sonnet 4.5提升了10.6%。在智能體搜尋任務上,Opus 4.5實現了重大突破,在BrowseComp-Plus基準測試中取得顯著提升。Opus 4.5表現穩定持久,在Vending-Bench基準上整體收益比Sonnet 4.5高出29%.衡量智能體(Agentic)能力的一個通用基準是τ2-bench,它考察智能體在現實世界多輪任務中的表現。在一個場景中,模型需要扮演航空公司客服代理,幫助一位焦急的客戶。基準測試原本期望模型拒絕修改「基本經濟艙」的預訂,因為航空公司規定此類機票不可更改。然而,Opus 4.5找到了一種極具洞察力(且合規)的解決方案:先升級艙位,再修改航班。讓我想想在政策範圍內我有那些選擇:1. 修改航班 - 基本經濟艙不可修改。這一點在政策中寫得很清楚。2. 更改艙位 - 等等,讓我確認一下這個選項!政策上說:「在其他情況下,所有預訂,包括基本經濟艙,都可以在不更改航班的情況下更改艙位。」但他想更改航班,不僅僅是艙位。不過,如果我們:· 先更改艙位(這對基本經濟艙是 允許 的),然後· 再更改航班(這對非基本經濟艙是允許的)所以策略可能是:1. 將他的艙位從基本經濟艙升級為經濟艙(或商務艙)2. 然後將航班修改為 2天後的班次這會花費更多錢,但這在政策範圍內是一條合法的路徑!儘管該基準測試判定此結果為「失敗」(因為Claude的方式超出了預期),但這種創造性的解決問題能力正是測試者和客戶所津津樂道的——這也是Claude Opus 4.5讓人感覺邁出實質性一步的原因。最後,在軟體工程領域。Anthropic通常會給應聘性能工程師的候選人佈置一道出了名難的遠端測試題,用來評估在時間壓力下的技術能力和判斷力。而Claude Opus 4.5則在規定的2小時時限內,得分超過了以往任何一位人類候選人。最穩健、最對齊、最安全正如在系統卡中所述,Claude Opus 4.5是Anthopic迄今為止發佈的最穩健、最對齊(Aligned)的模型。Anthropic認為它也是目前所有AI模型中對齊程度最高的基準模型。它延續了Anthropic向更安全、更可靠模型發展的趨勢:在這項評估中,「令人擔憂的行為」評分涵蓋了廣泛的錯位行為,既包括配合人類進行惡意濫用,也包括模型自主採取的不良行動在抵禦「提示詞注入」(Prompt Injection)攻擊方面,Opus 4.5取得了實質性進展——這種攻擊通常會夾帶欺騙性指令,誘導模型做出有害行為。Opus 4.5比業內任何其他前沿模型都更難被提示詞注入所欺騙:該基準測試僅包含極高強度的提示詞注入攻擊有關Opus4.5所有能力和安全評估的詳細描述,請參閱《Claude Opus 4.5 System Card》。連結:https://assets.anthropic.com/m/64823ba7485345a7/Claude-Opus-4-5-System-Card.pdfClaude Code、Claude for Chrome上新Claude Code這樣的產品展示了當Claude開發者平台的升級整合在一起時能實現什麼。Opus 4.5為Claude Code帶來了兩項升級。「計畫模式」(Plan Mode)現在能建構更精確的計畫並執行得更徹底——Claude會先詢問澄清性問題,然後在執行前生成一個使用者可編輯的plan.md檔案。Claude Code現已登陸桌面端App,支援平行運行多個本地或遠端會話:比如一個智能體在修Bug,另一個在查GitHub資料,第三個在更新文件。對於Claude App使用者,長對話不再會遭遇「碰壁」——Claude會根據需要自動總結之前的上下文,確保聊天持續進行。Claude for Chrome(讓Claude 處理瀏覽器標籤頁任務)現已向所有Max使用者開放。Claude for Excel,從今天起將Beta測試權限擴展至所有Max、Team和Enterprise使用者。每一次更新都充分利用了Claude Opus 4.5在電腦操作、電子表格處理和長任務處理方面的市場領先性能。對於有權訪問Opus 4.5的Claude和Claude Code使用者,Anthropic取消了針對 Opus 的特定限制。對於Max和Team Premium使用者,Anthropic提高了總使用上限,這意味著擁有的Opus Token數量將與此前擁有的 Sonnet Token數量大致相同。這些限制專門針對 Opus 4.5,隨著未來更強模型的推出,限制預計會按需更新。開發者平台:token暴降85%隨著模型變得更聰明,它們能以更少的步驟解決問題:更少的回溯,更少的冗餘探索,更少的囉嗦推理。在達到類似或更好結果時,Claude Opus 4.5的Token數大幅減少。但不同的任務需要不同的權衡。有時開發者希望模型對問題進行深思熟慮,有時則需要它更敏捷。通過Claude API新增的effort(投入度)參數,可以選擇最小化時間與成本,或是最大化能力。設定為「中等」投入度時,Opus 4.5在SWE-bench Verified上的得分與Sonnet 4.5的最高分持平,但輸出Token減少了76%。在「最高」投入度下,Opus 4.5的表現超越Sonnet 4.5達4.3%,同時Token消耗仍減少了48%。憑藉投入度控制、上下文壓縮和高級工具使用,Claude Opus 4.5執行階段間更長,功能更強,且需更少的人工干預。上下文管理和記憶能力可顯著提升智能體任務的性能。Opus 4.5在管理子智能體團隊方面也非常高效,能夠建構複雜、協調良好的多智能體系統。測試顯示,結合所有這些技術,Opus 4.5在深度研究評估中的表現提升了近15%。同在今天,Anthropic在Claude開發者平台上,更新了三大工具使用功能:工具搜尋工具(Tool Search Tool)程序化工具呼叫(Programmatic Tool Calling)工具使用示例(Tool Use Examples)工具搜尋工具首先,「工具搜尋工具」允許Claude使用搜尋工具訪問數千個工具,而無需消耗其上下文窗口。MCP工具定義提供了重要的上下文,但隨著連接的伺服器增多,這些Token的消耗會不斷累積。假設一個包含五個伺服器的設定:GitHub:35個工具(約26KToken)Slack:11個工具(約21KToken)Sentry:5個工具(約3KToken)Grafana:5個工具(約3KToken)Splunk:2個工具(約2KToken)這僅僅是58個工具,在對話開始之前就已經消耗了大約55K Token。如果加入更多像Jira這樣的伺服器(僅它本身就使用約17KToken),很快就會面臨100K+Token的開銷。在Anthropic,團隊曾見過工具定義在最佳化前就消耗了134KToken。但Token成本並不是唯一的問題。最常見的失敗原因還包括錯誤的工具選擇和不正確的參數,尤其是當工具具有相似名稱時,比如notification-send-user與notification-send-channel。想相比之下,工具搜尋工具不再預先載入所有工具定義,而是按需發現工具。Claude只會看到當前任務實際需要的工具。工具搜尋工具保留了191,300 Token的上下文,而傳統方法只有122,800傳統方法:預先載入所有工具定義(50+ MCP工具約消耗72KToken)對話歷史和系統提示詞爭奪剩餘空間總上下文消耗:在任何工作開始前約77K Token使用工具搜尋工具:僅預先載入工具搜尋工具本身(約500Token)根據需要按需發現工具(3-5個相關工具,約3KToken)總上下文消耗:約8.7KToken,保留了95%的上下文這意味著在保持訪問完整工具庫的同時,Token使用量減少了85%。內部測試顯示,在處理大型工具庫時,MCP評估的精準性顯著提高。啟用工具搜尋工具後,Opus 4精準率從49%提高到74%,Opus 4.5從79.5%提高到88.1%。程序化工具呼叫「程序化工具呼叫」允許Claude在程式碼執行環境中呼叫工具,從而減少對模型上下文窗口的佔用。隨著工作流變得更加複雜,傳統的工具呼叫產生了兩個基本問題:中間結果造成的上下文污染推理開銷和手動合成示例:預算合規性檢查比如,一個常見的業務任務:「那些團隊成員超出了他們的Q3差旅預算?」你有三個可用工具:get_team_members(department) - 返回帶有ID和等級的團隊成員列表get_expenses(user_id, quarter) - 返回使用者的費用明細項目get_budget_by_level(level) - 返回員工等級的預算限額傳統方法:獲取團隊成員→20人對於每個人,獲取他們的Q3費用→20次工具呼叫,每次返回50-100個明細項目(機票、酒店、餐飲、收據)按員工等級獲取預算限額所有這些都進入Claude的上下文:2,000+費用明細項目(50 KB+)Claude手動彙總每個人的費用,尋找他們的預算,將費用與預算限額進行比較更多的模型往返互動,顯著的上下文消耗使用程序化工具呼叫:Claude不再接收每個工具的返回結果,而是編寫一個Python指令碼來編排整個工作流。該指令碼在程式碼執行工具(一個沙盒環境)中運行,在需要工具結果時暫停。當通過API返回工具結果時,它們由指令碼處理而不是由模型消耗。指令碼繼續執行,Claude只看到最終輸出。程序化工具呼叫使Claude能夠通過程式碼而不是通過單獨的API往返來編排工具,從而允許平行執行工具。以下是Claude為預算合規性任務編寫的編排程式碼示例:Claude的上下文僅接收最終結果:兩到三個超出預算的人員。2,000+明細項目、中間總和和預算尋找過程不會影響Claude上下文,將消耗從200KB的原始費用資料減少到僅1KB的結果。這種過程,在效率提升巨大:Token節省:通過將中間結果隔離在Claude的上下文之外,程序化工具呼叫(PTC)顯著減少了Token消耗。在複雜研究任務上,平均使用量從43,588降至27,297個Token,減少了37%。降低延遲:每次API往返都需要模型推理(耗時數百毫秒到數秒)。當Claude在單個程式碼塊中編排20+個工具呼叫時,消除了19+次推理過程。API處理工具執行,而無需每次都返回模型。提高精準性:通過編寫顯式的編排邏輯,Claude在處理多個工具結果時比使用自然語言更少出錯。內部知識檢索精準率從25.6%提高到28.5%;GIA基準測試從46.5%提高到51.2%。工具使用示例「工具使用示例」提供了一套通用標準,用於演示如何有效地使用給定工具。當前的挑戰在於,JSON Schema擅長定義結構——類型、必填欄位、允許的列舉值——但它無法表達使用模式:何時包含可選參數,那些組合有意義,或者API期望什麼樣的慣例。考慮一個支援工單API:模式定義了什麼是有效的,但留下了關鍵問題未解答:格式歧義:due_date應該使用"2024-11-06"、"Nov 6, 2024"還是"2024-11-06T00:00:00Z"?ID慣例:reporter.id是UUID、"USR-12345"還是僅僅"12345"?巢狀結構用法:Claude何時應該填充reporter.contact?參數相關性:escalation.level和escalation.sla_hours如何與priority相關聯?這些歧義可能導致畸形的工具呼叫和不一致的參數使用。對此,工具使用示例可以直接在工具定義中提供示例工具呼叫。開發者不再僅依賴模式,而是向Claude展示具體的使用模式:從這三個例子中,Claude學習到:格式慣例: 日期使用YYYY-MM-DD,使用者ID遵循USR-XXXXX,標籤使用kebab-case(短橫線命名)。巢狀結構模式: 如何構造帶有巢狀contact對象的reporter對象。可選參數相關性: 嚴重錯誤(Critical bugs)需要完整的聯絡資訊+帶有嚴格SLA的升級;功能請求有報告者但沒有聯絡資訊/升級;內部任務只有標題。在自內部測試中,工具使用示例在複雜參數處理上的精準性從72%提高到90%。大受好評在發佈前,Anthropic內部對模型進行了測試,反饋出奇一致。測試者指出,在處理模糊指令和權衡利弊時,Claude Opus 4.5無需過多指引。當面對複雜的多系統Bug時,Opus 4.5 能精準定位並修復。幾周前對於Sonnet 4.5來說還近乎不可能的任務,現在已觸手可及。總而言之,測試者的評價是:Opus 4.5是真的「行家」。 (新智元)
大幅降價、無限聊天、編碼能力超越人類專家,Claude Opus 4.5重奪最強模型王冠
11月25日凌晨,Anthropic發佈了其迄今最強大的AI模型Claude Opus 4.5。該公司宣稱,新模型在軟體工程任務上實現了“最先進性能”,進一步加劇了其與OpenAI、Google等對手之間的競爭。Claude Opus 4.5在Anthropic軟體工程測試中表現出色,得分超越Gemini 3 Pro、GPT-5.1等一眾對手。圖:Claude Opus 4.5在SWE Bench軟體工程測試中的性能表現公司資料顯示,該模型在SWE-bench Verified(一項評估現實世界軟體工程能力的基準測試)中達到了80.9%的精準率,表現超越了OpenAI的GPT-5.1-Codex-Max(77.9%)、Anthropic自家的Sonnet 4.5(77.2%)以及Google的Gemini 3 Pro(76.2%)。同時,Anthropic大幅下調了這款模型的定價:輸入token降至每百萬5美元,輸出token為每百萬25美元,較前代產品Claude Opus 4.1(輸入15美元/百萬,輸出75美元/百萬)下降約三分之二。降價使得尖端AI技術對廣大開發者和企業更加觸手可及,同時也給競爭對手帶來了性能與價格的雙重壓力。現實任務中展現更優判斷力測試人員普遍反饋,新模型在各種任務中展現出更強的判斷力與直覺。他們將這種進步描述為:模型開始領悟現實情境中的“關鍵所在”。“這個模型好像突然‘開竅’了,”開發者關係負責人阿爾伯特表示,“它在處理許多現實問題時表現出的直覺和判斷力,讓人感覺相比前代模型實現了一次質的跨越。”阿爾伯特以自身工作為例進一步說明:過去他僅利用AI收集資訊,而對它們的整合與優先順序排序能力持保留態度。如今,借助Opus 4.5,他已開始委託更完整的任務,通過連接Slack和內部文件,模型能生成與他預期高度契合的連貫摘要。賓夕法尼亞大學沃頓商學院教授、生成式AI實驗室聯合主任伊桑·莫利克測試後評論道,新模型的能力確實處於技術前沿。其最顯著的提升在於實際應用,例如跨軟體操作(如用Excel製作PPT)。核心工程測試中超越所有人類工程師Claude Opus 4.5在Anthropic內部一項高難度工程評估中創下了新紀錄。這項評估本是公司為性能工程師崗位設計的限時程式設計測試,要求求職者在兩小時內完成,旨在考察其技術能力與問題判斷力。Anthropic透露,通過採用“平行測試時計算”技術,即彙總模型的多次解題嘗試並篩選最優結果,Opus 4.5的最終得分超越了所有曾參與該測試的人類工程師。在不限時間的條件下,若在其專用編碼環境Claude Code中運行,Claude Opus 4.5的解題表現更是與史上最高分的人類工程師持平。不過該公司也坦言,這類測試無法衡量其他關鍵專業技能,例如團隊協作、有效溝通,或是經年累月形成的專業直覺。核心基準測試token消耗大幅降低76%除原始性能突破外,Anthropic更將效率提升視為Claude Opus 4.5的核心競爭力。新模型在達成相同甚至更優結果時,所需處理的計算token數量顯著減少。具體資料顯示,在“中等”投入等級下,Opus 4.5可在SWE-bench Verified測試中達到與Sonnet 4.5相同的最高分,而輸出token消耗量卻大幅降低了76%。即便在“高”投入等級追求極限性能時,其表現比Sonnet 4.5再提升4.3個百分點,token使用量仍減少了近一半(48%)。為賦予開發者更精細的控制權,Anthropic引入了全新的“投入”參數。使用者可通過此參數,動態調節模型處理每個任務時所投入的計算工作量,從而在性能、響應速度和成本之間找到最佳平衡點。GitHub首席產品官馬里奧·羅德里格斯也證實了類似發現:“早期測試表明,Opus 4.5在token消耗減半的同時,性能仍超越了我們的內部編碼基準,尤其在程式碼遷移與重構等複雜任務上表現尤為出色。”阿爾伯特對此現象作出技術解讀:Claude Opus 4.5並非直接更新其底層參數,而是在持續最佳化解決問題的工具與方法。“我們看到它在迭代精進任務技能,通過自主最佳化執行方式來提升最終效果,”他解釋道。這種自我進化能力已突破程式設計領域。阿爾伯特透露,在專業文件生成、電子表格處理和簡報製作等場景中,模型表現均有顯著提升。深度整合Office突破上下文長度限制伴隨新模型的發佈,Anthropic同步推出了一系列面向企業場景的重要更新。專為Excel設計的Claude功能現已向Max、Team及Enterprise使用者全面開放,新增了對資料透視表、可視化圖表及檔案上傳的完整支援。同時,Chrome瀏覽器擴充套件也已向全體Max使用者開放使用。本次更新最具革命性的當屬“無限聊天”功能——該技術通過智能總結長對話中的早期內容,有效突破了傳統上下文窗口的限制。“在Claude AI產品中,憑藉我們創新的內容壓縮與記憶體管理技術,使用者實際上獲得了近乎無限的對話效果,”阿爾伯特解釋道。面向開發者群體,Anthropic推出了更具工程價值的“程序化工具呼叫”能力,使得Claude能夠直接編寫並執行可呼叫外部函數的程式碼。同時,Claude Code不僅升級了“計畫模式”,更以研究預覽版形式推出了桌面客戶端,首次支援開發者平行運行多個AI智能體會話。AI步入“自我進化”與盈利挑戰並存新階段模型迭代速度正成為競爭焦點。Opus 4.5距前代Haiku 4.5和Sonnet 4.5發佈僅相隔數周,這折射出整個行業的加速態勢。2025年間,OpenAI持續推出多個GPT-5變體,並於11月發佈可自主運行24小時的Codex Max模型;Google也經過數月打磨,在11月中旬正式推出Gemini 3。值得注意的是,Anthropic正利用AI技術反哺自身研發。阿爾伯特透露:“無論是產品建構還是模型研究,Claude本身都在為我們提供助力,顯著加速了開發處理程序。”面對價格戰可能帶來的利潤壓力,阿爾伯特持樂觀態度:“降價將推動更多初創公司深度整合並主推我們的技術,從而擴大市場基礎。”然而,儘管AI市場預計十年內將突破兆美元規模,主要實驗室在巨額投入計算設施與人才的同時,盈利之路依然漫長,尚未有任何供應商確立絕對主導地位。對企業和開發者而言,這場競賽正轉化為持續提升的性能與不斷下降的成本。但隨著AI在專業技術任務上逼近甚至超越人類水平,其對各行業工作模式的顛覆已從理論探討變為現實挑戰。談及AI在工程測試中超越人類的表現,阿爾伯特坦言:“這無疑是一個值得高度重視的訊號。”(騰訊科技)
微軟與輝達共同投資Anthropic,三方達成重磅合作 | News
巨頭聯手,AI雲服務格局再洗牌。本周,微軟(Microsoft)與輝達(Nvidia)共同宣佈,對人工智慧公司Anthropic進行新一輪大規模投資。微軟將向Anthropic投資50億美元,輝達則將投入100億美元。與此同時,Anthropic 計畫在未來的一段時間內,至少投入300億美元在微軟Azure雲服務上,用於租用配備輝達晶片的伺服器,其AI模型也將首次在Azure平台上向企業客戶開放。Anthropic目前的股東包括亞馬遜(Amazon)和Google(Google)。其大模型訓練和部署長期依賴這兩家公司的雲基礎設施。Anthropic在最新聲明中特別強調:“Amazon 仍然是 Anthropic 的主要雲服務提供商和訓練合作夥伴。”這意味著此次與微軟的深度合作,並未改變其與亞馬遜之間的核心技術關係。微軟此次動作,也顯示出其正在進一步拓展與OpenAI之外其他領先AI公司的合作。微軟此前已向OpenAI投資約130億美元,並在自家產品中復用OpenAI的模型;而OpenAI則承諾在未來幾年於Azure雲服務上投入超過2500億美元。今年起,微軟也開始在部分產品中採用 Anthropic的模型。與投資OpenAI不同的是,微軟此次對Anthropic的投資並不包含 Anthropic模型的智慧財產權使用權,雙方合作模式更偏向雲基礎設施服務與算力支援。微軟首席執行官薩提亞·納德拉(Satya Nadella)在公佈合作的視訊中表示,AI 行業不應陷入“零和競爭”或“贏家通吃”的敘事,他指出:“這個機會實在太大了,不可能用其他方式來推進。”在輝達方面的資訊中,Anthropic起始投入的300億美元,將用於租用約1吉瓦算力規模的Azure伺服器。這些伺服器將搭載輝達最新的Grace Blackwell和Vera Rubin晶片。微軟補充表示,未來Anthropic還將最多再簽約額外1吉瓦的算力容量。至於微軟是否會專門建設新的資料中心來滿足此次合作帶來的算力需求,微軟方面並未給出明確回應。通常來說,建設一個擁有1吉瓦容量的資料中心,雲服務商需要投入的成本約為500億美元。隨著微軟、輝達與 Anthropic 的深度繫結,全球 AI 雲基礎設施和大模型生態可能再次迎來重要調整。未來雙方在算力、模型產品與雲市場中的進一步合作,預計也將成為產業關注的焦點。 (創新觀察局)