【DeepSeek】崛起,一場全球AI話語權的深度轉移



如果你相信AI將是21世紀“人類科技樹”上最重要的技能點的話,那麼中國正在搶佔先機。

1月27日,中國公司深度求索(DeepSeek)旗下生成式AI產品DeepSeek(與公司同名)同時登頂中國區和美國區蘋果AppStore免費榜。這是第一次,有中國科技產品APP實現雙榜登頂。被DeepSeek壓在身後的,包括了OpenAI旗下的ChatGPT以及Google Gemini等AI產品。

造成DeepSeek登頂的推動力,是其在1月20日發佈的推理大模型DeepSeek-R1。

這款免費的推理大模型在大模型排行榜“ Chatbot Arena”上,已經和 OpenAI旗下ChatGPT-4o(最新版)並列基準測試排名第三, 並和OpenAI的旗下的o1模型在Chatbot Arena風格控制類模型分類(即StyleCtrl)中並列第一名。根據DeepSeek自己公佈的資訊“DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等測試中,得分與o1正式版接近,部分測試中得分還超過o1正式版。”

兩個關鍵詞,讓DeepSeek在“評測排名”之外引發滔天熱度:開源+性價比。

DeepSeek-R1是一款開源推理大模型。基於MIT許可協議(即 MIT License,起源於1988年,是科技圈最主流的開放原始碼軟體許可協議之一)DeepSeek-R1允許全球開發者自由地修改、使用、分發模型。甚至DeepSeek-R1允許開發者進行衍生開發和商用。

作為對比,OpenAI旗下主流產品產品(GPT-3.5、GPT-4、GPT-o1、GPT-o3、ChatGPT、DALL-E),截至目前都是閉源產品。OpenAI曾把GPT-2進行了“部分開源”,但基於GPT-2的“開源”並非基於MIT許可協議,使用者有相當多的限制和前置條件。同樣,OpenAI曾在一些場合公開展示過 Codex 的部分程式碼,但這和真正的開源模式全然不同。

DeepSeek開源帶給OpenAI的巨大挑戰是,當開源產品的“能力”和閉源產品接近甚至反超後者時,對閉源產品的衝擊將是巨大的。DeepSeek下載熱度的激增,背後的核心原因之一正是開源:使用者可以在自己的伺服器或雲端免費部署DeepSeek-R1,且大幅降低(甚至不需要)API呼叫費用。根據DeepSeek和OpenAI公佈的資訊顯示,DeepSeek-R1的輸入token定價為0.55 美元/百萬,輸出 token為2.19 美元/百萬;而OpenAI相應的輸入token定價約為15 美元/百萬,輸出token為60美元/百萬。相當於,OpenAI的“使用成本”接近於27.3倍。

而DeepSeek第二個驚人之處,則是其預訓練成本了。公開資訊顯示, DeepSeek-V3的預訓練成本約為557.6萬美元,整體消耗了278萬GPU小時訓練時長。作為對比,OpenAI僅僅是GPT-4的訓練成本就接近1億美元(虎嗅註:《斯坦福大學人工智慧指數資料報告 2024》認為GPT-4 的訓練成本約為 7800 萬美元)。

DeepSeek對OpenAI模式說“不”

DeepSeek的迅速火爆,尚不能說直接戳破過去幾年OpenAI所塑造的“AI神話”,但確實證明了,在OpenAI之外,存在一種完全不同的AI生存邏輯。

OpenAI的模式本質上基於研發和產品側的高投入,這也是輝達等美國科技巨頭在過去幾年所力推的“算力無限主義”,通過無限堆砌算力不斷拉高人工智慧的邊界。而一系列諸如輝達的公司,扮演著OpenAI模式裡的“生態位”公司,與OpenAI形成攻守同盟。

OpenAI最大投入是“硬體算力”和“訓練及資料成本”。前者,OpenAI通過多筆融資,以及被納入“微軟聯盟”後依託微軟提供的“算力券”模式獲得補給;後者OpenAI通過大量僱傭訓練相關人員並與大量資料公司合作,形成穩定的“資料收集、清洗、標註閉環”。在這兩大基本軸的共同運轉下,OpenAI成為了過去幾年AI圈的絕對明星。

這一模式,形成了一個由不同“生態位”公司構築成的“AI有機體”,這個“AI有機體”形成了美國AI核心的基石之一。

在OpenAI的上游,微軟扮演著提供基礎給養的角色,而為了提供足夠的雲和算力,微軟也成為輝達等公司的關鍵客戶,每年數以百億美元計地採購相關硬體。在這一“AI有機體”裡,不只是微軟和輝達這樣的超級巨頭,還包括了Crusoe Energy這樣專注於資料中心、基礎設施的公司,它們都成為這個“AI有機體”的關鍵一環。

在“AI有機體”裡還有大量圍繞“資料”而存活的公司,諸如Scale AI等資料標註類公司,源源不斷給OpenAI提供養料。

這個“AI有機體”本身,絕非是簡單的訂單採購的供給關係。OpenAI的大部分產品,多數需要在輝達等公司的高級晶片上佈置,一些低端晶片是無法佈置OpenAI產品的。同樣,微軟不只是OpenAI的股東、算力提供者,OpenAI也是其AI產品的供應商,二者本質上是一種深層的同盟關係。

也就是說,圍繞OpenAI模式(高額的訓練投入、高額的算力供給、佈置在高端晶片上、閉源的)實際上衍變出來的正是這樣的一個涵蓋了巨額生意的“美式AI生態有機體”。

甚至這一模式與有機體,決定著美國AI道路的方向。在不久前川普的5000億美元星際之門計畫中,OpenAI創始人奧特曼正是重要參與者。這一計畫被視為美國AI領域的“曼哈頓計畫”。

而當2025年初,DeepSeek把自己開源、更低成本投入的模型拿到檯面上時。真正感受到危機的,正是這個“美式AI生態有機體”。

1月27日美股盤前,輝達股價一度跌幅達到12%,截至收盤時輝達股價暴跌17%。”造成輝達股價暴跌的核心原因有二:其一,DeepSeek-R1等產品並不“必須”在輝達高端晶片上部署,甚至可以在一些中低端晶片上部署;其二,DeepSeek所公佈的訓練成本和投入,對於高度依賴巨額算力投入、在預訓練上需要大量GPU時長的“OpenAI-輝達”模式直接Say No。這可能預示著,在“挖礦”之後,輝達在AI大模型圈找到的飯票,已經不再保險。

而更深刻的一擊是來自於“開源”本身。在微軟、OpenAI、輝達等公司構築出的這個“美式AI生態有機體”中,商業化的前體是“不能開源”——要通過AI模型本身收費或者將其納入付費產品之中完成商業閉環。

當DeepSeek舉起“開源大旗”時,一種不同於“美式AI生態有機體”的AI世界正在開啟大門:當聖何塞矽谷、北京中關村、新德里諾伊達、巴黎九區的創業者都可以免費地部署不屬於OpenAI產品的開源大模型並研發自己領域的項目和產品時,AI本身更像是人們在本世紀初對於其“新生產資料”的設定和預期。

諷刺的是,開源本是OpenAI最早的夢想,但最終這個大旗被一家中國的、原本做量化基金的公司不經意間舉起來了。

這是一次“馬鐙與蒸汽機”般的里程碑事件嗎?

大機率是的。

我們先回顧一段歷史,這一幕有可能是今天AI世界的前傳。

在1765年英國人瓦特發明出蒸汽機後,瓦特以及後續的英國發明家馬修·博爾頓、和喬治·斯蒂芬遜接連在蒸汽機商業化、蒸汽火車等領域繼續研發,並推動英國的蒸汽化。

但一個關鍵的節點事件是1807年美國人羅伯特·富爾頓發明了第一個蒸汽商用輪船,這是美國第一次去分享英國在“蒸汽化”這件事上的科技及產品話語權。而在不久後,美國人奧利弗·埃文斯等人,開始推動蒸汽化在美國工廠的落地,於是美國出現了最早一批基於蒸汽機的自動化工業生產線——也就是說,英國人發明出的蒸汽機,但他們並未能獨佔蒸汽時代的“母基發明”。

而隨之而來的是,當美國成為“蒸汽時代”領頭者之一併憑藉更龐大的國力底蘊去完成了“圍繞新關鍵科技的全盤進化”後,其徹底在英國開啟的霸主時代中撕開了一條縫隙,並最終取而代之。

這個故事裡的關鍵邏輯是,當人類的科技樹出現“超級節點”時,最先探索出這個技術節點的國家/民族,有時候並未能品嚐到這個超級技術節點完整紅利:推動關鍵技術國民級商業化的效率以及整體國力的深層底蘊才是博弈的關鍵。同樣的事情在蒸汽機之後的多個“天才技術時刻”都再次重演了,在AI時代這一幕可能繼續。

DeepSeek這件事的意義,不僅僅是技術側。甚至我們應該一點也不奇怪,幾個月後中國或者美國或者什麼地方,又誕生出了更先進的大模型產品。

但我們應該看到這件事背後的深層意義:一家誕生在中國的民營公司,繞開了美國人所探索的“成功模式道路”,並採取了代表“開放、普惠價值”核心的“開源精神”。如果考慮到DeepSeek大量工程師是一群只在中國本國高校求學過的本土95後甚至00後才俊的話,不難洞察到一場更深層的、涉及人類時代科技話語權的交接,可能已經發生了。

在不久前,一家國內頭部端側大模型公司創始人在與虎嗅交流時分享了一個有趣的細節:“2024年上半年,我去參加國際上的AI論壇,大部分面孔是美國人、印度人,但是2024年下半年這些AI國際學術峰會論壇裡,中國人的面孔已經佔一半以上。”

接下來,這場圍繞全球AI角力關鍵視角有三:

其一,在中端視角中,能否確保DeepSeek以及更多的本土DeepSeek誕生、崛起、並長成國民級商業體;這包括了DeepSeek創始人梁文鋒近期所提及的如何讓硬核科技創業者得到足夠大的正向反饋問題。而延展而來的是,在過去20年間,國內多數獲得正向反饋的“科技”創業,多為模式創新,最終這些公司進化為平台型巨頭,掌握流量出入口,然後反向重塑諸如餐飲、超市等一系列日常生意。少有的恰恰是,更為純粹的硬核科技創新。

其二,在更大的視角中,在這場人類21世紀的AI浪潮裡,比拚誰那個經濟體可以更快速地完成工業與生活AI化,從單純的“器”的研究,率先進入到“機理”的探索與推廣。即上文提及的推動關鍵技術國民級商業化的效率以及如何借力於雄厚的整體國力迅速建立足夠高的競爭壁壘。

當然,回歸更小的視角中,對於中國本土那幾個尚在模仿OpenAI的大模型公司而言,2025年初所發生的事情,可能已經不只是引起“警覺”,而是引發“驚悚”了。

畢竟,素來樂於研究美國矽谷的中國投資圈,一定會重新審視此前那些投入額數以十億、百億計的本土生成式AI項目了。 (虎嗅APP)