FORTUNE雜誌—梁文鋒，不再孤勇

2026/04/29

•

4月的最後一周，梁文鋒做了一件簡單而精準的事。

天眼查資訊顯示，4月27日，DeepSeek註冊資本由1000萬元增至1500萬元，增資幅度50%。梁文鋒的直接持股從1%躍升至34%，寧波程恩（合夥企業）持股則從99%降至66%，這位低調的創始人由此可支配公司約84%的股份。看似一次內部股權結構的微調，微妙之處在於時機，因其恰好發生在一場引爆中國AI產業鏈的旗艦發佈之後。

三天前，DeepSeek-V4帶著1.6兆參數的開源模型登場，再次改寫了遊戲規則。而梁文鋒在這個時間點強化控制權，傳遞了一個明確的訊號——“孤勇者”的時代或許已經結束，屬於梁文鋒的時代則剛剛開始。

中國大模型的“DeepSeek時刻”

4月24日，DeepSeek-V4預覽版正式上線並同步開源。

這是梁文鋒迄今交給世界的最硬核的答案。V4包含兩個版本：V4-Pro總參數達1.6兆（啟動490億）、V4-Flash總參數2840億（啟動130億），雙版本均原生支援百萬token超長上下文。在性能維度上，24項基準測試的評估顯示，V4-Pro在其中3項中超越了所有參與比較的大語言模型；V4在MMMU多模態基準測試中較前代提升了21.4分，複雜場景理解能力顯著增強。

更深遠的變化藏在效率裡。

相比上一代V3.2，V4的單token推理算力需求下降了73%，KV快取被壓縮到原來的十分之一。DeepSeek自己在論文中也坦率承認——V4-Pro-Max的表現“小幅超越當前的領先開源模型，並高於GPT-5.2和Gemini-3.0-Pro，但仍然落後於GPT-5.4和Gemini-3.1-Pro，差距大概在三到六個月”。這句話傳遞了兩個關鍵資訊：中國大模型正以前所未有的速度逼近第一梯隊，而與此同時，這次發佈並未改變中美頂級大模型之間的基本格局——追趕仍在繼續。

正是這種謙遜裡的“實誠”，讓整個行業的價值在這場效應中重新分配。在V4開源模型的衝擊下，市場給出了極其“教科書式”的反饋。

最顯著的效應之一，是當日大模型類股的兩極分化。智譜收盤跌9%，盤中最大跌幅超12%；MiniMax收跌9.44%，盤中一度跳水超12%。“Token第一股”迅策收盤也跌近16%，成為當日港股科技類股跌幅最大的標的之一。與此同時，國產晶片類股全線爆發：華虹半導體港股盤中漲約17%，收漲15%；中芯國際收漲超10%。

摩根大通將“大模型回呼”與“恆生指數當日上漲0.2%”的事實並列在一張結論表中，認為這並非系統性風險，而是一場產業鏈內部價值重分配在資本市場的集中定價，並稱DeepSeek-V4的發佈是“行業利多，而非零和衝擊”。

為何如此樂觀？在摩根大通的分析框架裡，V4事實上強化了中國LLM行業的三個關鍵支柱——算力供應釋放、定價紀律和結構性成本曲線壓縮。DeepSeek一直在其分析師“4-5月事件日曆中最大的單一負面競爭催化劑”中佔據重要位置，隨著V4落地並被消化，這一不確定性正式出清了。

招商證券指出，1M token上下文的V4全系標配“開源SOTA兌現，但並未全面超越海內外旗艦競品”，意味著競爭加劇但未到格局重塑的地步。瑞銀報告也仍然看好智譜在編碼領域的持續領先地位和MiniMax在V4未著重強調的多模態領域的差異化定位。

但不得不承認的另一面是，DeepSeek的開源策略將大大擠壓其它大模型公司在B端市場的議價空間，畢竟企業客戶有了更多開源模型的選擇權，大模型公司的“純技術稀缺性溢價”也隨之下降。而且，這些公司還面臨一個共同的定價壓力：DeepSeek預告下半年昇騰950出貨後V4-Pro價格還會大幅下調，這會進一步壓縮模型的定價空間。

“國芯+國模”：國產AI的雙向奔赴

DeepSeek-V4的真正敘事，從來不僅僅在模型本身。

很長一段時間裡，中國頂級大模型的訓練與推理幾乎完全依賴輝達的GPU和CUDA生態，國產晶片扮演的角色不過是“備選項”。但這一次，行業慣例發生了根本逆轉。DeepSeek-V4並未向輝達和AMD提供早期存取權，反而優先開放給華為昇騰，從而從設計階段就開始了芯模協同最佳化，獲得了數周時間進行底層適配，包括指令級、算子庫和推理框架。

在深度最佳化後，V4在華為昇騰晶片上的推理速度較初期版本提升了整整35倍，華為CANN框架與輝達CUDA的程式碼相容性已逼近95%。而且這種“Day 0”等級的適配已從華為昇騰蔓延至更廣闊的本土晶片陣容，包括寒武紀、沐曦、海光、摩爾線程（FP8）、崑崙芯、平頭哥真武、天數等主流國產AI晶片都迅速實現了全量適配與推理部署。

鏈式反應由此放射。

數月之前，據The Information援引知情人士消息，阿里、字節和騰訊已累計訂購數十萬顆華為AI晶片。這不是一次試驗，而是一項“協調一致的努力，旨在建立一個純國產的AI技術堆疊”。2025年全年，國產AI晶片在國內市場的份額已躍升至41%，其中華為昇騰佔據近半。輝達曾在這個市場上佔據90%以上的絕對壟斷地位，如今，不可動搖的格局開始鬆動。

中銀國際指出這一鏈條的深層意義：“國產大模型已基本跑通全端國產化，理論上已形成從底層硬體、基礎軟體、平台服務到上層應用、安全體系的完整技術鏈條，國產算力類股迎來質變臨界點”。華泰證券研報也表示，市場容易被“降本”二字迷惑，但真正的邊際變化，在於長上下文成本的斷崖式下降將讓複雜Agent、多文件分析、長周期任務等場景變得可用——推理呼叫量與儲存訪問頻次將隨之擴張。

顯然，無論外界如何評價，梁文鋒截至目前仍然保有不被任何人設計好的時間線。他自掏腰包投入DeepSeek的資金據傳累計超過200億元。他曾被媒體貼上所有這些標籤——“不融資”、“不接受外部資本”、“不被任何人的商業化時間表綁架”。他營運著一家近乎“研究機構”而非商業公司的心態。

只是即使是這位“AI隱士”，也不得不在2026年向現實邁出了一步。近期有消息稱DeepSeek正啟動成立以來的首次外部股權融資，以超100億美元的估值，計畫募集不少於3億美元資金。在V4面世之際，梁文鋒在融資啟動和內部增持方面同步推進，無疑是為未來的IPO鋪路，從而全面激發人才留存與發展。而他在融資真正落地前搶先出手加碼控制權，傳遞了清晰的訊號：資本可以進來，但控制權不在談判桌上。

值得注意的是，DeepSeek-V4的發佈公告引用了《荀子》：“不誘於譽，不恐於誹，率道而行，端然正己。”這些話由DeepSeek自己寫上，指向某種遠超股價漲跌的東西，其中最關鍵的是“國芯+國模”的適配處理程序。

4月27日，中國信通院宣佈，正式啟動DeepSeek V4國產化適配測試，推動模型與國產軟硬體深度協同、加速產業落地。本次測試依託工信部重點實驗室與AISHPerf基準體系開展，覆蓋晶片、伺服器、一體機、叢集、開發工具鏈、智算平台等全端AI軟硬體產品，聚焦DeepSeek V4全系列模型的推理、微調流程，並形成立體化評測體系。

DeepSeek的股權變更可被視為其正式融入主流商業競爭的號角，梁文鋒也將不再是在中國大模型發展路上那個“孤勇者”。而這條路，是用國產算力鋪就的。 (財富FORTUNE)