【DeepSeek】為什麼Anthropic CEO 對DeepSeek和中國AI 的惡意這麼重?


一位科學家,幾個月前寫了一篇文章,宣示了他和他的公司透過強大的人工智慧解決全人類身心健康、心理疾病、貧窮、和平、工作與生活的意義等諸多方面的美好善意。幾個月後,還是這名科學家,又突然發佈了一篇文章,強烈呼籲不應該讓任何一塊美國的晶片出口到中國,以限制中國人工智慧的發展,維繫人工智慧的「單極世界」(我很震驚他會赤裸裸地使用這個詞彙)。這件事,怎麼看都讓人覺得割裂,以及那麼一絲虛偽。

這個人就是人工智慧公司Anthropic 的創始人和CEO Dario Amodei,義大利裔美國人、神經物理學博士、資深AI 科學家、昔日的OpenAI 研究團隊靈魂人物之一、中國公司百度的深度學習實驗室早期員工、號稱將打造最強大和安全的AI 的理想主義者、OpenAI 最重要的競爭對手的創始人,以及現在,美國對中國AI 全方位無死角禁運最激烈的呼籲者,沒有之一。

儘管An​​thropic 和它旗下的Claude 系列模型在中國公眾當中的知名度相當有限,但畢竟,它是目前世界上最受AI 應用開發者歡迎的大語言模型的提供者,在中國的AI 研究人員和開發者群體中也有著相當多的支援。但一夜之間,許多中國的AI 從業者公開表示:Anthropic 和Amodei 本人失去了他們最基本的尊重。

這就是一篇「檄文」的效應。

在這篇題為《關於DeepSeek 和出口控制》的文章中,Dario Amodei 一方面雲淡風輕指稱DeepSeek 取得的成就撼動美國AI 的優勢被誇大描述了,在表達對DeepSeek- V3 模型創新肯定的同時,堅決不承認引發更大轟動效應的DeepSeek 推理模型- R1 的取得的突破(這廝在這一問題上的心思,是本文後面論述的重點)。他更不願意承認的是DeepSeek 模型在算力成本和演算法效率上取得的成果—— 用一個自己也承認」未經過證實」的DeepSeek 有五萬張走私而來的輝達A100、H100 和H800 顯示卡的流言,力證DeepSeek- V3 模型不可能用600萬美元的低成本訓練而成。顯然,Amodei 不能接受DeepSeek 以演算法效率創新替代算力堆砌這個被日益普遍承認的路徑,因此不惜用一個連他自己也知道未經驗證的DeepSeek 走私了大量高端顯示卡的前提實現了這個論述。但他又表述美國對中國的算力出口管制沒有失效──他可能剛好忘了他前面的論述是建立在DeepSeek 走私的假設上。

來源:https://darioamodei.com/on-deepseek-and-export-controls

讓我們還原一下他的論述邏輯線條:DeepSeek 的影響力被誇大了—— V3 確實是個創新,但不可能花那麼少的錢——聽說他們走私了晶片——所以他們確實花了更多的訓練成本—— DeepSeek 沒有原創,它站在我們的研究基礎上當然成本更低—— R1 推理模型絕對沒有創新,只是復現o1 的結果(裝作沒看見OpenAI 已經承認了DeepSeek 在推理上的成果是獨立的發現)—— 出口管制沒有失效,是對的(忘了自己前面的論述前提是DeepSeek 獲得了走私顯示卡)—— 我們要打造一個AI 的單極世界,中國絕對不能做出與我們水平相當的模型(忘了開頭說過DeepSeek 不足為奇)-- 因此別說H100 和H800,最低端的H20 都不能出口給中國,這樣中國就贏不了了。

你看,一個處處講邏輯和推理的科學家,試圖用一篇萬字長文論證一個無法自圓其說,但又要在形式上處處講邏輯的推理的結論,他就會顯得如此的笨拙,以及虛偽。

這並不是Dario Amodei 第一次呼籲加強對中國的算力管制,你也沒法要求一個美國的人工智慧科學家對中國有與生俱來的善意,但他在DeepSeek 引發了矽谷的廣泛關注、肯定和一定程度的恐慌的背景下,專門鼓噪對中國的算力出口進一步管制,以及極力否定DeepSeek 在算力效率最佳化和模型推理方法上的創新,是非常值得關注和解析的現象。沒人期待他對中國的善意,但他對中國和中國誕生的AI 公司DeepSeek 的惡意和怨恨如此之重,是很值得玩味的。

Dario Amodei 為什麼「看不見」DeepSeek-R1 ?

儘管極力推測DeepSeek-V3 的訓練成本不止於600萬美元,但好在Dario Amodei 確實承認了V3 是真正的創新,但他又非要強調這並非突破性的,而是「持續成本降低曲線上一個預期的點」。他認為「不同之處在於,第一個展示預期成本降低的公司是中國公司,這在以前從未發生過,並且具有地緣政治意義」。這種誇人又不想真心實意誇的樣子,真的是讓人看著都累。我倒寧願看Amodei 直接說:“美國公司都在做模型成本下降的創新,只是DeepSeek 碰巧第一個做出來了而已”,可偏偏直爽不是他具備的品質。

到了DeepSeek-R1 的時候,Amodei 倒是直爽了起來,他絕對不肯承認R1 是突破性的成果,在這個問題上不留任何餘地,不顧就連訓練出強化學習模型o1 和o3 的OpenAI 都承認了R1 在強化學習的方法上做出了原創性的突破,也裝作對那些指出DeepSeek 的強化學習擺脫了人類回饋的介入,是大語言模型「AlphaGo 時刻」的研究結果視而不見。他堅持說:R1 隻是在V3 的基礎上進行了強化學習,它的所有動作都是在復現o1,每一家美國AI 公司都在進行這方面的推理嘗試,這是技術趨勢,跟開源也沒有關係,只是DeepSeek 剛好先做出來了而已。

我們倒不必因為Amodei 的嘴硬而忿忿不平,畢竟作為公認的AI 領域卓有成就的研究者,Amodei 對一些關鍵問題的看法能在很大程度上影響AI 業界、風險投資界、華爾街乃至華盛頓特區對DeepSeek 現象的看法。這也是他為什麼必須跳出來的原因。他不是在為OpenAI 鳴不平(他跟OpenAI 之間的恩怨可深了去了),而是在這個時候,他必須出來給他一手創辦的Anthropic 的下一步動作,找一個有台階的鋪墊。

一個非常顯著的事實是:Anthropic 迄今沒有一款正式對外發佈的推理模型。儘管Dario Amodei 在接受採訪時曾公開表示他對單獨存在的推理模型不屑一顧——當時,他主要瞄準的當然是OpenAI。

Amodei 的看法是:推理沒那麼難,基座模型更重要。跟他暗戳戳地誇DeepSeek-V3 有創新但在程式設計等方面的評測仍弱於他的Claude 3.5 Sonnet 模型差不多,他公開承認過o1 取得的突破,但又表示在一些具體的場景和實踐方面,作為一款預訓練模型的Claude 3.5 Sonnet 展現了並不弱於o1 的推理能力。因此,他不認為推理模型和普通模型應該分開,基於預先訓練的基座模型仍然是更重要的,可將推理能力包容進去。

因此,非常可能發生的是:Anthropic 計劃用一種與OpenAI 和DeepSeek 不同或接近的方式,實現模型推理能力的躍遷,它將很可能在Claude 的下一代旗艦基座模型中得到體現,且強化學習能力可圈可點。別忘了,三個月前,DeepMind 的強化學習靈魂人物、 Alpha 系列研究成果的核心貢獻者Julian Schrittwieser 加入了Anthropic。

完全脫胎於OpenAI、將OpenAI 視為最直接(幾乎是唯一)競爭對手的Anthropic,某種意義上,是OpenAI 在前GPT-4 時代一系列大語言模型理念的最原教旨主義信奉者。 Amodei 多次站出來否認隨著訓練資料枯竭,預訓練出現了「撞牆」和規模效應遞減的現象,並一再強調經典意義上「Scaling Law」(即模型規模持續擴大才能導致性能增強)的重要性。 AI 研究者和開發者在真切地期待Anthropic 打破Scaling Law 和預訓練模型的瓶頸,推出新一代的推理能力更強的旗艦預訓練模型。

但迄今為止,Anthropic 還沒推出這個東西。以它的出色模型訓練和從來不搞期貨發布的歷史記錄,有理由相信Anthropic 正在緊張地準備這個推理能力更強的預訓練模型,以證明OpenAI 的o1 不是實現推理能力提升的最佳路徑。事實上,Amodei 已經在接受《華爾街日報》的採訪中預告了。

但隨著DeepSeek-V3 的推出,他們需要證明的東西突然突然變多了。

首先,DeepSeek-R1 繼o1 之後進一步證明了強化學習的獨立推理模型的路徑是可靠的,甚至可能是最佳的;其次,DeepSeek-R1 驗證了強化學習是能不需要人類反饋就能讓AI自主進行深度思考的(Dario Amodei 可是基於人類回饋的強化學習的主要發明者之一);再次,DeepSeek-R1 證明了實現這一切的訓練成本是可以明顯降低的。

這也意味著,一旦Anthropic 推出新的推理能力更強的基座模型,它要回答比過去更複雜的問題:強化學習能力比R1 如何?基於人類回饋的強化學習究竟比R1 所代表的自主強化學習優勢在那裡?以及,訓練成本是多少?有沒有更便宜、更有效率的方式? API 價格能不能降下來? (Claude API 是世界上最貴的,而DeepSeek幾乎是最便宜的)

而這些棘手的問題和麻煩,都是DeepSeek 帶來的。

因此,在推出自己的推理能力更強的新模型之前,Anthropic 的“靈魂人物” Dario Amodei 只能主動跳出來,極力降低和打消人們對DeepSeek-R1 先入為主的好印象:承認它是創新和突破是萬萬不能的,承認它成本真的降低了也是難以接受的。

達裡奧·阿莫迪(Dario Amodei)(資料來源:維基百科)

這是兩條路線的問題,有點「你死我活」的味道。而這兩條路線,某種程度上也是在大語言模型的“後預訓練時代”,經典的矽谷式模型訓練和中國式模型訓練的兩條路徑的不同表徵:前者憑藉算力資源的優勢,透過算力堆砌的粗放式暴力美學提升模型效能;後者以演算法效率為重點,透過架構和工程的創新降低訓練成本,同時提升模型效能。

Anthropic 甚至是比OpenAI 更崇尚算力規模、模型規模和暴力美學的代表,這也導致了Dario Amodei 這篇新發表的文章,不僅暗戳戳地釋放了對DeepSeek 的惡意,更不加掩飾地將這種惡意投射給了整個中國的AI 領域。

Dario Amodei 為什麼那麼迷戀算力出口管制?

這不是Dario Amodei 第一次公開呼籲加強對中國的算力出口管制,他之前就在受訪中表達過對華算力出口管制必要且需加強的觀點。美國的朋友不該對此表示遺憾,中國的朋友也不必要為此憤怒,他一貫如此。

但藉著“ DeepSeek 效應”,Amodei 不失時機地撰文幾千字,以DeepSeek 背後是中國人工智慧可能與美國並駕齊驅的趨勢,呼籲進一步加強對中國的算力管制,就顯得非常有意思了。相信我,當一個美國的科學家或企業家公開地表達對中國過於親密或敵視的態度時,他們的個人訴求是第一位的。

讓我們先重新檢視一下Anthropic 是什麼。

毫無疑問,它是美國也是世界當下最優秀的人工智慧公司——有時甚至沒有之一,Dario Amodei 是它在技術上的靈魂人物。比起貶低DeepSeek 和談及算力出口管制時的自相矛盾和忸怩作態,他在談論起人工智慧的願景、侷限和解釋具體人工智慧術語和理論的時候,呈現的確實是一種令人信服的理智、克制、清晰和精準,比他的前同事、確實不太懂技術的OpenAI 首席執行官Sam Altman 令人信服得多。

當然,作為OpenAI 的主要競爭者,Anthropic 令外界印象最深的標籤是“安全”,這也是OpenAI 最被批評的地方​​。當然,它也確實為安全做了很多,例如將基於人類反饋的強化學習(RLHF)無處不在植入模型訓練全過程的“Constitutional AI” (憲法式人工智慧)原則。 「安全」是Anthropic 的賣點,有的時候也變成了它的負累。

2024年,Anthropic 在企業級市場搶走了OpenAI 15%的市場份額,當然是因為Sonnet 3.5 模型確實強大,另一方面則是拜「安全」的護身符所賜。不過仔細想想,主打“安全”,除了瞄準的是企業用戶,誰應該是主要的買家?

答案顯而易見:政府。準確地說,是美國政府。

可在參與聯邦政府和相關部門的項目上,Anthropic 作為後來者,顯然沒有OpenAI 吃香。川普2.0 時代的首個AI 大計畫-「星際之門」(Stargate),話事者是白宮,主要參與者是OpenAI 和軟銀,沒有Anthropic 的份兒。

儘管Dario Amodei 隨即在達沃斯論壇上奚落川普政府的“星際之門” 是“一團混亂”,但很顯然,沒有那家AI 企業比Anthropic 更希望參與美國政府主導的項目。為此,他也做過一連串自相矛盾的事:

一方面,在川普即將正式就任前的1月6日,Dario Amodei 在《華爾街日報》發表署名文章《川普能確保美國AI 的領先》,主動合作的投石問路頗為明顯。

另一方面,上一屆民主黨政府任期尾聲推出的備受爭議、致力於加強監管、要求人工智慧企業與政府主動分享模型研究成果的《前沿人工智慧模型的安全與保障創新法案》,幾乎遭到了矽谷來自進步和保守陣營的一致反對,最後被加州州長紐森拒絕簽署。而我們的Dario Amodei,幾乎是全矽谷唯一贊成這項法案的人工智慧企業創辦人。

過去,我曾經天真地認為Anthropic 身上有早期Google 的影子,因為這家企業將透明化、可解釋性和道德置於技術與產品的底層,有理想主義的光輝。可是,早期的Google 是將這種原則內建在創辦人和團隊的價值核心裡的,無論如何都並不主張靠監管和行政意志來實現這一切。 Google 的兩位創辦人,從來沒試圖將自己規訓為白宮的買辦。但我們的Dario Amodei 可不是這樣。

可惜的是,充斥著矽谷新支持者的川普內閣,在人工智慧發展和監管上的理念與拜登內閣大相逕庭。至少目前看來,這個群體並不太買Dario Amodei 的帳。在Amodei 發表了那篇呼籲加強對華算力管制的奇文之後,支援川普的創投機構Andreessen Horowitz 創辦人Marc Andreessen 就出來打臉了:「閉源、不透明、吹毛求疵,尋求政治壟斷與開源和免費的對決,可不是美國需要的贏的方式」。

某種意義上,一心想獲得聯邦政府大單、希望參與國家級人工智慧“大項目”,拜登內閣時期無條件支援AI 監管,川普當選後又吹捧川普才是確保美國AI 領先的大救星的Dario Amodei,目前事實上陷入的是生態上的孤立。他並不在美國AI 政策制定的核心圈子裡,但他又非常想進去,這讓他必須表現出一個更激進和決絕的姿態,獲得這張入場券。

在這個時候,DeepSeek 出現了,在強化學習的路徑上搞得他有些被動,但又給了他一個激進表態遏制中國人工智慧發展的好機會,偏偏Anthropic 的模型訓練路徑依賴的又是算力堆砌的規模擴張,讓他不願意相信演算法效率和工程最佳化真的能降低算力成本,而相信卡死算力的脖子就能斷了中國AI 的前路。而這個主張,偏偏又是白宮最容易聽懂、最可能接受的。於是,Amodei 如此著迷於呼籲更嚴厲的算力出口管制,也就不難理解了。

還是忍不住感慨一句:美國新一代人工智慧企業的核心人物——無論OpenAI 的Sam Altman 還是Anthropic 的Dario Amodei,甚至包括Meta 的祖克柏和Scale.ai 的Alexandr Wang,他們和他們的事業接受美國「國家主義」的規訓是如此的自然和迅速。而中國大多數的人工智慧企業家——最新的代表就是DeepSeek 和他的創辦人梁文鋒接受的「規訓」則是世界主義和全球化的。這真是一個有趣的現象。 (矽星人Pro)


獨立發現不代表創新,你可以獨立發現火但你沒有創新。科學家的邏輯是如此的嚴謹以至於以你的智商根本看不懂。這篇垃圾文還是刪了吧,丟人現眼的舔狗。
1
舔嗎?? 舔美視角的典型特徵就是,對的事情只有美國能作,好的表現只有美國能作。 其他人有一點點點表現,就是不妥。主角只能是美資本菁英一族。 Alstom Plaza Accord NASA尼爾遜登月發言 臺灣偷走晶片製造......美國至上、資本團體利益至上。 而開源=斷相關資本財團財路。 支持並祝福其他地區的人努力作好自己手上的事。 人不必是為了美國而活。 美股艾大叔也加油。