【DeepSeek】股價崩了!DeepSeek戳破了輝達泡沫,市值蒸發2.9兆


(圖片來源:鈦媒體AGI編輯林志佳拍攝)

DeepSeek“現象級”的崛起,衝擊了全球資本市場,並引發市場對美國技術主導地位的質疑。

鈦媒體AGI 1月27日消息,DeepSeek(深度求索)應用登頂美區蘋果App Store應用程式商店免費榜,力壓ChatGPT、GoogleGemini、微軟Copilot等美國生成式 AI 產品。同時,DeepSeek在國內App Store免費榜同樣位居第一,超越豆包、小紅書等。

隨著DeepSeek走紅,重挫美國晶片股。

27日美股盤前,AI晶片龍頭輝達(NASDAQ:NVDA)股價大跌超過12%,市值蒸發超4000億美元(2.94兆人民幣),這比AMD和英特爾的市值總和還要高。目前AMD市值約為2000億美元,英特爾市值不到900億美元。

同時,博通(NASDAQ:AVGO)跌13%、台積電(NASDAQ:TSM)跌10.1%、阿斯麥(NASDAQ:ASML)跌8%、美光(NASDAQ:MU)跌6.48%;Google母公司Alphabet (NASDAQ:GOOG)跌4.09%、Meta (NASDAQ:META)跌5.79%、亞馬遜(NASDAQ:AMZN)跌6.33%;而A股AI算力指數今日跌3.94%,寒武紀一度跌10%,中際旭創跌超10%,工業富聯跌超8%。

據彭博統計,27日盤前,納斯達克100期貨暴跌1100點。如果開盤後美股跌幅持續,受DeepSeek消息影響,納斯達克100和歐洲斯托克600科技分指數的市值就將共同蒸發約1兆美元。

分析師Holger Zschaepitz表示:“中國的DeepSeek可能代表了對美國股市最大的威脅,因為該公司似乎以極低的價格建立了一個突破性的 AI 模型,而無需依賴最先進的晶片,這引發了對數百億美元資本支出是否有用的質疑,這些資金正被投入到這個行業中。”

對於DeepSeek熱潮,零一萬物CEO李開復最新評價稱,DeepSeek的成功,讓“中國AI有望擊敗美國”這一觀點得到驗證。

中歐國際工商學院決策科學與管理資訊系統教授譚寅亮對鈦媒體AGI表示,對於DeepSeek這樣的產品來說,其成功更多依賴於高效的算力調度和模型最佳化能力,而非單純堆積硬體資源。因此,出口管制等外部限制可能影響行業發展速度,但並不一定會阻礙本土大模型的長期競爭力和全球化擴張。

事實上,由於使用者源源不斷地湧入DeepSeek,繼昨天和今天上午出現局部服務波動導致數分鐘的短暫系統崩潰後,截至發稿前,DeepSeek又火到“當機”,據官方早前回應稱,可能與服務維護、請求限制等因素有關。


DeepSeek走紅後美國科技股暴跌,

美國人到底在擔心什麼?

DeepSeek,不同於國內眾多依賴網際網路巨頭背景的AI公司,它由國內領先的量化私募機構——幻方量化所營運。

2024年5月,公司發佈了DeepSeek-V2,憑藉其創新的模型架構和極高的性價比迅速走紅。該模型的推理成本降低至每百萬Tokens僅1元,僅為開源大模型Llama3 70B的1/7、GPT-4 Turbo的1/70,引發了包括字節、阿里、百度等企業在內的模型降價風潮。

DeepSeek在海外真正“出圈”還是近一月以來的一系列產品發佈。

2024年12月,新一代千億參數規模的基座模型DeepSeek-V3首個版本上線並同步開源;僅一個月後,DeepSeek又開源了R1推理模型,今年1月24日,DeepSeek-R1在Chatbot Arena綜合榜單上位列第三,與OpenAI的頂尖推理模型o1並列。

據DeepSeek介紹,V3的預訓練費用只有557.6萬美元,在2048塊輝達H800 GPU(針對中國市場的低配版GPU)叢集上運行55天完成,僅是OpenAI GPT-4o模型訓練成本的不到十分之一。

中國工程院院士、清華大學電腦系教授鄭緯民認為,DeepSeek自研的MLA架構和DeepSeek MoE架構,為其自身的模型訓練成本下降,起到了關鍵作用。MLA主要通過改造注意力算子壓縮了KV Cache大小,實現了在同樣容量下可以儲存更多的KV Cache,該架構和DeepSeek-V3模型中FFN 層的改造相配合,實現了一個非常大的稀疏MoE 層,而這也成了“DeepSeek訓練成本低最關鍵的原因”。

在算力、資金、晶片限制等外部挑戰之下,包括DeepSeek在內的中國大模型廠商均著力於軟體、演算法等最佳化,利用 AI Infra等手段,最大化“壓榨”算力實現了訓練和推理成本降低、模型性能提升的效果,相對於OpenAI、Meta堆砌資源方案有所區別。

一個對比是,DeepSeek R1模型每百萬token的查詢成本僅為0.14美元,而OpenAI的成本為7.50美元,便宜了98%,而且允許開源。

據公開資訊,OpenAI每年在模型訓練投入高達50億美元以上,Google2024年資本支出超過500億美金;Meta CEO祖克柏最近表示,該公司2025年向 AI 基礎設施等方面計畫資本投入600億-650億美元,比2024年的380億-400億美元增長62%,並到年底將擁有超過130萬個GPU計算卡。然而,OpenAI等企業在 AI 層面至今仍未獲得收入。

因此,華爾街擔憂DeepSeek這種高性價比模式會讓GPU銷量放緩,不應該再大量投入資本到算力層面當中。

彭博社分析稱,DeepSeek在次先進的AI晶片上以更低成本的方式訓練出有效的模型,這令市場對輝達一飛衝天的3兆美金市值產生疑慮,這也讓中國AI發展落後於美國數年的認知受到衝擊。

《紐約時報》 也發文指出,DeepSeek以不到600萬美元的純算力成本訓練大模型,這一成本僅為Meta訓練大模型純算力成本的十分之一,挑戰了“唯有美國科技巨頭才能研發尖端AI”的普遍認知。

不同於中國公司“榨乾每一張卡的性能”,矽谷的敘事更多是“先基建、再研發”。過去兩年多,美國雲廠商不惜投資數千億美元買卡建設大規模算力中心給生成式 AI 模型進行訓練和推理,輝達資料中心業務收入從2023財年第三季度(截至2022年10月底)的36.16億美元,攀升至2025年第三財季的307.71億美元,增長超過9倍。

OpenAI、xAI、Anthropic三家大模型公司甚至在籌建單叢集百萬先進GPU的算力基礎設施。就在本周,OpenAI、軟銀集團和甲骨文公司宣佈成立一家名為Stargate(星際之門)的1000億美元合資企業,輝達將提供大量H100 GPU產品,預計會擁有大量AI算力進行訓練模型。

但是,DeepSeek的走紅,“戳破”了美國算力股的泡沫,勢必讓矽谷公司意識到一味擴大規模並不是必須。

譚寅亮曾在斯坦福大學人工智慧研究院和數字經濟實驗室擔任訪問學者,他對鈦媒體AGI表示,DeepSeek展示了“小而精”模式的潛力,尤其是在資源相對有限的情況下,通過高效的技術路徑和精準的市場定位,可以取得快速突破。但從長期來看,美國企業在“堆砌資源”方面的優勢依然難以忽視。大規模資金投入可以推動更大的模型規模、更強的算力支援以及更廣泛的資料覆蓋,這種技術和資源上的積累效應難以在短期內被完全替代。然而,DeepSeek也提醒業界,不同技術路線和市場策略的多樣化競爭可能削弱“堆砌資源”模式的壟斷性效應,推動創新更廣泛地普及和落地。

中國 AI 加速追趕,
DeepSeek衝破算力限制

中國從2022年ChatGPT發佈之時的落後,到如今國內 AI 大模型產品與OpenAI旗艦產品處於“比肩”程度。

前GoogleCEO埃裡克·施密特(Eric Schmidt)曾表示,中國 AI 發展落後於美國,但之後他改口稱,儘管人們之前認為美國在 AI 競賽中領先中國幾年,但中國在過去六個月裡“以驚人的方式”趕上了美國,有些產品甚至超越了美國 AI 公司。

譚寅亮指出,“DeepSeek的成功表明,中國企業在AI應用層面和使用者體驗上具有強大的創新能力,尤其是在產品快速迭代和市場化方面更具優勢。這為中國在全球AI競爭中提供了重要的信心,特別是在C端市場表現上,中國團隊對使用者需求的深刻理解起到了關鍵作用。但從技術底層來看,美國在基座模型和前沿研究上的持續領先仍是重要支撐,整體競爭格局依然呈現‘底層技術美國強、應用場景中國快’的局面。DeepSeek的崛起進一步推動了這種競爭的動態化發展。”

在譚寅亮看來,中國AI大模型發展的主要制約因素包括以下幾點:

“1)算力:雖然國內的算力基礎設施建設近年來取得了顯著進步,但相比美國頂尖科技企業掌控的超級計算叢集仍存在差距;
2)演算法創新:在底層演算法和理論研究上,與頂尖學術機構和企業的協作尚需進一步加強;
3)出口管制:美國對高端晶片和關鍵技術的出口限制的確構成短期瓶頸,但也在加速中國本土晶片產業的崛起。對於DeepSeek這樣的產品來說,其成功更多依賴於高效的算力調度和模型最佳化能力,而非單純堆積硬體資源。未來,算力瓶頸可能會迫使類似DeepSeek的企業在模型壓縮和推理效率上持續創新,同時推動基礎設施的區域化替代。

因此,出口管制等外部限制可能影響行業發展速度,但並不一定會阻礙本土大模型的長期競爭力和全球化擴張。”

而應對來勢洶洶的DeepSeek,OpenAI CEO奧爾特曼(Sam Altman)發文預告ChatGPT免費套餐將可用o3-mini;Meta被曝緊急成立4個作戰小分隊,層層拆解DeepSeek模型的技術秘訣。OpenAI等其他頂級AI公司的研究人員也一直在仔細研究DeepSeek模型如何做到更便宜高效。

Union Bancaire Privee 董事總經理Vey-Sern Ling表示:“DeepSeek 表明,開發成本更低的強大 AI 模型是可能的。這可能會破壞整個 AI 供應鏈的投資案例,而該供應鏈是由少數超大規模企業的高額支出推動的。”

李開復早前表示,目前一個推理模型的訓練純算力成本僅為300萬美元左右。他表示,“美國在研究和創新方面很出色,尤其是突破性進展,但中國在工程方面更勝一籌。在當今時代,當你擁有有限的計算能力和資金時,你會學會如何非常高效地建構事物。


很顯然,在當前新的中美 AI 熱潮下,DeepSeek一定程度下克服了算力限制瓶頸,讓中國在與 AI 領導地位中得到回報。長期來看,中國和美國的 AI 技術競爭仍將持續 。 (鈦媒體AGI)