再等等梁文鋒

2026/04/21

•

一切快了。

都說梁文鋒變了。

在備受矚目的DeepSeek V4發佈前夕，DeepSeek首輪融資浮出水面——據悉，DeepSeek正以約100億美元估值尋求新一輪融資。然而一年前，梁文鋒明確表示對商業化不感興趣，拒絕了一批試圖洽談融資的人。

那時正逢DeepSeek初芒乍現。2025年1月，DeepSeek R1發佈，彼時輝達單日狂瀉17%，市值蒸發近6000億美元。這場極其優雅的東方開源革命，以超低成本帶來頂尖模型，此後DeepSeek及梁文鋒聲名鵲起。

只是時過境遷，眼下大模型江湖日卷夜囂，世界變化緊湊劇烈，DeepSeek卻遲遲未拿出外界苦等的續作。

有人開始著急，有人開始懷疑，但持續封神的敘事對任何人都是一種負擔。

如無意外，DeepSeek V4本周即將登場。AI圈註定不會平靜。

“任何事情在你懷疑並想突破它的時候，是最吸引人的階段”，《三體》中如此寫道。

這正如今天人們對DeepSeek的期待。

自2025年初以來，國內智譜、MiniMax、Kimi以及字節、阿里等在Agent和coding強化上已經更新了數版模型，春節“百模大戰”一幕更是歷歷在目，造就覆蓋文字、圖像、視訊多模態的AI最強春節檔。

但DeepSeek彷彿不問戰事。

至今，多次傳聞要上線的DeepSeek V4還是沒有來。有人戲言，“DeepSeek已成Next Week。”

不可否認，外界對DeepSeek的好奇、關心從來不減。最近一次DeepSeek關於模型動態的推文官宣，則停留在2025年12月初，彼時其發佈了DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

其實水面之下，並非沒有新鮮事：今年1月，DeepSeek團隊連續發佈了兩篇由梁文鋒署名的論文，mHC（流形約束超連接）及Engram（條件記憶），瞄準對大模型長序列處理的提升。4月8日凌晨，DeepSeek悄悄上線了分層模式介面，出現快速模式和專家模式兩個入口，甚至還埋下了一個視覺模式的新選項。

一切都隱隱被解讀為：V4快了。

有爆料稱，DeepSeek創始人梁文鋒近日在內部溝通中透露，DeepSeek新一代旗艦大模型DeepSeek V4將於4月下旬正式發佈。依然，DeepSeek官方沒有澄清，沒有回應。這風格，相當“DeepSeek”。

任江湖喧囂鼎沸，無論是梁文鋒還是DeepSeek團隊，與外界的互動從來都克制。

這種克制足夠深入，一位AI獵頭就聊起：有認識的大廠員工跳槽去DeepSeek後就“失聯”了，再也沒回覆過微信。投資界此前和一位DeepSeek研究員交流，聊及公司，一律保持緘默。

DeepSeek此前堅定不融資。

多年前，中國前首富陳天橋曾與梁文鋒對談四小時，然後樑文鋒婉拒了陳天橋的投資。2024年初，聯想創投也找到梁文鋒想投一筆錢，但同樣無果。

再後來，無論大模型江湖融資如何熱鬧非凡，DeepSeek融資通道始終緊閉。甚至一度有消息稱：梁文鋒不急於獲得投資，擔心外部投資者會干預DeepSeek的決策。

專注，低調，不太做沒把握的事——梁文鋒及DeepSeek給外界留下如此印象。

依稀記得2025年初，DeepSeek R1橫空出世，在純強化學習激發推理能力這條路徑上開創了先河，它向世界宣告著：中國能夠以極低成本做出世界級的模型。

更優雅的是，還是開放原始碼的。

以至於2025年的精彩彷彿就是由“DeepSeek時刻”開啟，這年中國大模型江湖迅速崛起和急劇變化，不僅是價格戰與開源潮襲來，競爭路線也開始高度集中在AI程式設計和多模態。

時至今日，開源者DeepSeek依然無可避免寄託著中國人工智慧的厚望，誠如今天外界對DeepSeek V4的期冀。

如無意外，本周，DeepSeek將推出新一代大模型DeepSeek V4。此時，距離上一次重大版本更新已經過去15個月。

此前有市場傳聞，DeepSeek V4不僅將帶來兆參數規模和百萬級上下文窗口，更首次實現與華為昇騰等國產晶片的深度適配，標誌著中國AI產業在去CUDA化道路上邁出關鍵一步。

一個細節是，2025年DeepSeek V3發佈時，就有開發者發現模型程式碼裡出現了大量PTX（Parallel Thread Execution）指令的蹤跡——這是輝達GPU的彙編語言，比CUDA更底層，當時市場就開始猜測：DeepSeek在修煉脫離CUDA的內功。

隱隱約約，梁文鋒依然是那個要做出創新的人。

短短一年，中國AI敘事翻天覆地。

應用端的繁榮肉眼可見。國家資料局3月一則資料顯示，中國日均Token呼叫量已突破140兆，較兩年前的1000億增長超過1400倍。

這帶來了全產業鏈的景氣：Kimi、智譜、Minimax等大模型商，還有阿里、字節等各大雲廠商，以及晶片層、伺服器層、算力調度層的參與者，無一不在積極承接這波需求衝擊。

因此，一種聲音翻湧得更加厲害：DeepSeek應該趁現在來一波大的。

但天下英雄如過江之鯽，巨大機會敞口意味著更激烈的競爭。就在這個傳聞V4將發佈的4月，由姚順宇統籌的混元大模型也將發佈HY 3.0，內部稱之為：混元系列重大版本迭代。

可以感受到，DeepSeek本身壓力也在顯現——2026年開年來，DeepSeek上演了至少7次大規模服務中斷，例如3月29日晚至當月30日上午，其網頁端與APP端同時無法使用，當機時間持續約12小時。

以及肉眼可見的人才流失。2025年底至2026年初，DeepSeek有郭達雅、魏浩然、王炳宣、阮翀、羅福莉等多名核心研發骨幹離開。當這次傳出DeepSeek融資，市場也不可避免想到：DeepSeek不融資就沒有市場估值錨點，無法給拿了期權的核心員工吃下定心丸。

而對於令人興奮的適配國產晶片消息，亦是一項成本極高而沉重的重寫工程。外界幾乎一致認為，DeepSeekV4多次跳票，就與重寫底層程式碼試圖適配國產晶片密切相關。

“我們不是有意成為一條鯰魚，只是不小心成了一條鯰魚。”梁文鋒曾如此坦言。此時此刻，或許更不該讓曾無意成為鯰魚的DeepSeek，承擔商業世界的慕強敘事。

不可否認，DeepSeek曾真真切切給中國AI帶來破壁時刻。無論DeepSeek能否再給世人以震撼，它所展現的世界觀和方法論，都極大支撐了對通用大模型的理解甚至對頂尖人才的理解。

不妨再給DeepSeek一些耐心。 (投資界)