再等等梁文鋒

一切快了。

都說梁文鋒變了。

在備受矚目的DeepSeek V4發佈前夕,DeepSeek首輪融資浮出水面——據悉,DeepSeek正以約100億美元估值尋求新一輪融資。然而一年前,梁文鋒明確表示對商業化不感興趣,拒絕了一批試圖洽談融資的人。

那時正逢DeepSeek初芒乍現。2025年1月,DeepSeek R1發佈,彼時輝達單日狂瀉17%,市值蒸發近6000億美元。這場極其優雅的東方開源革命,以超低成本帶來頂尖模型,此後DeepSeek及梁文鋒聲名鵲起。

只是時過境遷,眼下大模型江湖日卷夜囂,世界變化緊湊劇烈,DeepSeek卻遲遲未拿出外界苦等的續作。

有人開始著急,有人開始懷疑,但持續封神的敘事對任何人都是一種負擔。

如無意外,DeepSeek V4本周即將登場。AI圈註定不會平靜。

梁文鋒保持沉默

“任何事情在你懷疑並想突破它的時候,是最吸引人的階段”,《三體》中如此寫道。

這正如今天人們對DeepSeek的期待。

自2025年初以來,國內智譜、MiniMax、Kimi以及字節、阿里等在Agent和coding強化上已經更新了數版模型,春節“百模大戰”一幕更是歷歷在目,造就覆蓋文字、圖像、視訊多模態的AI最強春節檔。

但DeepSeek彷彿不問戰事。

至今,多次傳聞要上線的DeepSeek V4還是沒有來。有人戲言,“DeepSeek已成Next Week。”

不可否認,外界對DeepSeek的好奇、關心從來不減。最近一次DeepSeek關於模型動態的推文官宣,則停留在2025年12月初,彼時其發佈了DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

其實水面之下,並非沒有新鮮事:今年1月,DeepSeek團隊連續發佈了兩篇由梁文鋒署名的論文,mHC(流形約束超連接)及Engram(條件記憶),瞄準對大模型長序列處理的提升。4月8日凌晨,DeepSeek悄悄上線了分層模式介面,出現快速模式和專家模式兩個入口,甚至還埋下了一個視覺模式的新選項。

一切都隱隱被解讀為:V4快了。

有爆料稱,DeepSeek創始人梁文鋒近日在內部溝通中透露,DeepSeek新一代旗艦大模型DeepSeek V4將於4月下旬正式發佈。依然,DeepSeek官方沒有澄清,沒有回應。這風格,相當“DeepSeek”。

任江湖喧囂鼎沸,無論是梁文鋒還是DeepSeek團隊,與外界的互動從來都克制。

這種克制足夠深入,一位AI獵頭就聊起:有認識的大廠員工跳槽去DeepSeek後就“失聯”了,再也沒回覆過微信。投資界此前和一位DeepSeek研究員交流,聊及公司,一律保持緘默。

人們為什麼期待V4

DeepSeek此前堅定不融資。

多年前,中國前首富陳天橋曾與梁文鋒對談四小時,然後樑文鋒婉拒了陳天橋的投資。2024年初,聯想創投也找到梁文鋒想投一筆錢,但同樣無果。

再後來,無論大模型江湖融資如何熱鬧非凡,DeepSeek融資通道始終緊閉。甚至一度有消息稱:梁文鋒不急於獲得投資,擔心外部投資者會干預DeepSeek的決策。

專注,低調,不太做沒把握的事——梁文鋒及DeepSeek給外界留下如此印象。

依稀記得2025年初,DeepSeek R1橫空出世,在純強化學習激發推理能力這條路徑上開創了先河,它向世界宣告著:中國能夠以極低成本做出世界級的模型。

更優雅的是,還是開放原始碼的。

以至於2025年的精彩彷彿就是由“DeepSeek時刻”開啟,這年中國大模型江湖迅速崛起和急劇變化,不僅是價格戰與開源潮襲來,競爭路線也開始高度集中在AI程式設計和多模態。

時至今日,開源者DeepSeek依然無可避免寄託著中國人工智慧的厚望,誠如今天外界對DeepSeek V4的期冀。

如無意外,本周,DeepSeek將推出新一代大模型DeepSeek V4。此時,距離上一次重大版本更新已經過去15個月。

此前有市場傳聞,DeepSeek V4不僅將帶來兆參數規模和百萬級上下文窗口,更首次實現與華為昇騰等國產晶片的深度適配,標誌著中國AI產業在去CUDA化道路上邁出關鍵一步。

一個細節是,2025年DeepSeek V3發佈時,就有開發者發現模型程式碼裡出現了大量PTX(Parallel Thread Execution)指令的蹤跡——這是輝達GPU的彙編語言,比CUDA更底層,當時市場就開始猜測:DeepSeek在修煉脫離CUDA的內功。

隱隱約約,梁文鋒依然是那個要做出創新的人。

中國AI敘事沸騰別催梁文鋒

短短一年,中國AI敘事翻天覆地。

應用端的繁榮肉眼可見。國家資料局3月一則資料顯示,中國日均Token呼叫量已突破140兆,較兩年前的1000億增長超過1400倍。

這帶來了全產業鏈的景氣:Kimi、智譜、Minimax等大模型商,還有阿里、字節等各大雲廠商,以及晶片層、伺服器層、算力調度層的參與者,無一不在積極承接這波需求衝擊。

因此,一種聲音翻湧得更加厲害:DeepSeek應該趁現在來一波大的。

但天下英雄如過江之鯽,巨大機會敞口意味著更激烈的競爭。就在這個傳聞V4將發佈的4月,由姚順宇統籌的混元大模型也將發佈HY 3.0,內部稱之為:混元系列重大版本迭代。

可以感受到,DeepSeek本身壓力也在顯現——2026年開年來,DeepSeek上演了至少7次大規模服務中斷,例如3月29日晚至當月30日上午,其網頁端與APP端同時無法使用,當機時間持續約12小時。

以及肉眼可見的人才流失。2025年底至2026年初,DeepSeek有郭達雅、魏浩然、王炳宣、阮翀、羅福莉等多名核心研發骨幹離開。當這次傳出DeepSeek融資,市場也不可避免想到:DeepSeek不融資就沒有市場估值錨點,無法給拿了期權的核心員工吃下定心丸。

而對於令人興奮的適配國產晶片消息,亦是一項成本極高而沉重的重寫工程。外界幾乎一致認為,DeepSeekV4多次跳票,就與重寫底層程式碼試圖適配國產晶片密切相關。

我們不是有意成為一條鯰魚,只是不小心成了一條鯰魚。”梁文鋒曾如此坦言。此時此刻,或許更不該讓曾無意成為鯰魚的DeepSeek,承擔商業世界的慕強敘事。

不可否認,DeepSeek曾真真切切給中國AI帶來破壁時刻。無論DeepSeek能否再給世人以震撼,它所展現的世界觀和方法論,都極大支撐了對通用大模型的理解甚至對頂尖人才的理解。

不妨再給DeepSeek一些耐心。 (投資界)