經濟學人承認,矽谷精英都在偷偷用中國AI

GPT-4這樣的頂級模型,是“專有模型”(proprietary AI models)。就是技術是保密的,你只能通過付費API來呼叫它,核心程式碼和資料你都摸不著。美國科技巨頭們正斥巨資 (spending megabucks) 投入這場競賽,試圖破解彼此的秘密。

然而,在中國,戰場完全不同。史丹佛大學的AI大牛吳恩達 (Andrew Ng) 將其形容為一場“達爾文式的殊死搏鬥” (a Darwinian life-or-death struggle)。但這搏鬥,並不是發生在密不透風的實驗室裡,而是在“開源模型”的競技場上。

今年一月,一家名叫“深度求索”(DeepSeek)的中國初創公司,幾乎憑藉“一己之力”撼動了全球市場。

他們幹了件大事:把一個非常先進的AI模型,直接免費開放了。而且他們的研發成本極低 (developed on a shoestring),根本沒花多少錢。

如今,連美國頂級的風險投資公司安德森·霍洛維茨 (Andreessen Horowitz, a16z) 的合夥人都說,現在走進他們辦公室的創業者,十有八九用的都是中國製造的AI模型。他說:“我敢說有八成可能性 (I’d say 80% chance),他們用的都是中國的開源模型。”

想不到吧。矽谷的未來,竟然在悄悄地建立在中國的AI基石之上。

這裡要澄清一個概念,嚴格來說,中國公司提供的不是完全的“開放原始碼軟體”(open-source software),那種是連原始碼都給你。它們提供的是“開放權重模型”(open-weight models)。

簡單理解,就是AI模型訓練好之後,內部有無數個參數,這些參數就像是它學到的所有知識和能力的濃縮。中國公司把這些核心的“權重” (weights) 開放了,讓所有人都能下載、修改、部署在自己的伺服器上。

這直接導致了一個驚人的結果:在各種智力測試中,今年發佈的中國開源模型,已經超越了美國的同類對手,比如社交巨頭Meta的Llama系列。而且,它們的能力正在迅速逼近 (closing in on) 那些最頂尖的專有模型。

面對這種壓力,就連曾經的開源先鋒OpenAI也坐不住了。諷刺的是,它的名字裡就帶著“Open”(開放),但為了賺錢和防止技術濫用,它早就轉向了“閉門造車”的專有模型路線。

最近,他們發現自己的客戶越來越多地在使用包括中國模型在內的開源方案,於是趕緊推出了一個自己的開源模型,叫gpt-oss。

西雅圖艾倫人工智慧研究所的專家說得很直白:中國公司是“全身心投入”(go all-in),把他們最好的模型拿出來開源;而美國公司呢,總是把那個“閃亮的新東西” (the shiny new thing)藏起來,留作自家的專有產品。

艾倫人工智慧研究所的Ali Farhadi說:

“As hard as it is for us all to swallow, I think we’re behind [on open weights] now.”

“儘管我們大家都不太願意承認,但我認為我們(在開源權重方面)現在已經落後了。”

你可能會問,美國專有模型賺的錢、獲得的估值(OpenAI最高可達5000億美元),都遠遠超過中國的開源模型。錢可以用來投入再創新,這難道不是一個良性循環嗎?

沒錯。但開源模型玩的是另一套邏輯。

美國的巨頭們,正在“拓展智能的邊界” (pushing the frontiers of intelligence),他們想造出最強的“超級大腦”。

而中國的開源力量,則更專注於“鼓勵AI的普及應用” (encouraging adoption of AI)。它們讓企業、政府和研究人員能夠更輕鬆地把AI技術應用到各個“犄角旮旯” (nooks and crannies) 的具體場景中。因為開源,你可以把模型部署在本地 (on premises),而不是完全依賴雲服務,這對於資料安全和定製化來說至關重要。

換句話說,一條路是向上走,追求極致的高度;另一條路是向外鋪,追求極致的廣度。

但《經濟學人》在文末給出了一個發人深省的結尾:如果中國的策略成功了,那麼“深度求索”帶來的衝擊波 (the DeepSeek shock),可能僅僅只是一個開始。

未來的AI世界,或許不是由一個“最強大腦”一統天下,而是由無數個經過定製、深入到生活和工作方方面面的AI共同構成。

如果是那樣,誰掌握了“普及”的鑰匙,誰就可能掌握了未來。 (王不留)