梁文鋒，砍下3400億估值

2026/05/20

•

引入強援，留住人才。

梁文鋒第一次敞開懷抱，引入戰投。

有消息稱，其掌舵的DeepSeek，即將完成首輪融資，投後估值高達500億美元，約合3400億人民幣。

作為杭州深度求索的創始人，梁文鋒的最終受益股份，達到84%。據稱，其個人投入或高達200億元人民幣，佔募資總額的四成。

融資前夕，他剛“交完作業”。4月24日，DeepSeek-V4上線，距離上一代大版本V3的發佈，足足隔了484天。

“DeepSeek被挖走太多人才、高端算力受限。”

一位AI行業資深從業人士向《21CBR》記者表示，這是其轉變融資態度、新版本發佈推遲的原因。

走下理想國的高塔，梁文鋒尋找強援，直面技術創新之外的現實問題。

01. 錨點留人

DeepSeek不差錢。

2025年，其母公司幻方量化的平均收益率，高達56.6%，按照700億元的管理規模計，對應約400億元收益，幻方和出資人按行規二八分帳，可以提走七八十億。

有幻方量化作為出資人，為DeepSeek研發輸血，資金安全墊厚實。“我們面臨的問題，從來不是錢。”梁文鋒曾如此表示。

然而，員工個人會有財務的考慮，DeepSeek最聰明的那群人在流失。

《21CBR》記者翻開DeepSeek V4長達58頁的技術報告，末尾的作者列表，梁文鋒與其他研究員、工程師，近300人並列署名。

10個帶星號的名字有些扎眼，標註著“已離職”。

近期出走的技術骨幹之一，郭達雅，曾深度參與V3、R1等爆款模型研發，加盟字節Seed，傳聞年薪近億元。

字節方面否認了該說法，補拋了個“鉤子”，“不排除有些Seed技術人員，四年後收益會達到數億元”。

其實，梁文鋒開的薪資不低。一名求職者透露，他在2024年面試DeepSeek的深度學習研究員，HR透露薪資能達到150萬元。

這位“技術宅”老闆，還給了足夠多的空間。

一個細節是，DeepSeek的員工通常18點下班，早上不打卡，也沒有KPI。源於梁文鋒認為，人一天能高品質輸出的時間，很難超過6-8小時，創新需要儘可能少的干預和管理。

在AI搶人大戰裡，梁文鋒還需要給團隊更多安全感，尤其是，對員工手裡的期權，有所交代。

有了外部融資，DeepSeek會有一個公開估值，期權才有定價錨點。這是留人的前提。

梁文鋒改變態度，正與國家積體電路產業投資基金、騰訊等機構洽談。

知情人士稱，本輪融資將用於提升計算能力和改善員工福利，以應對激烈的競爭。

02. 算力博弈

人才議題之外，梁文鋒還有一場算力的硬仗要打。

截至5月9日，DeepSeek共有36個職位亟待人才，光4月27日，就批次放出了十余個崗位需求。

梁文鋒對產品的關注度提升，強化Agent方向的人才招募及探索，同時，開招“搜尋演算法研究員”。

該崗位職責包括設計面向AGI的新一代通用搜尋引擎，負責LLM在搜尋場景下的規模化落地。

為了突破算力瓶頸，DeepSeek開始招募“AI超算叢集維運工程師”了。

其職責之一，是“負責新一代計算資源的快速交付與上線，確保資源能高品質、高性能地投入生產”。有千卡以上的大規模AI超算叢集維運經驗，是崗位加分項。

同月開招的，還有“資料中心高級交付經理”“資料中心高級維運工程師”，工作地點在烏蘭察布，月薪最高3萬元。

梁文鋒早在2021年，就頗有先見之明地囤了1萬張輝達A100。

“梁很有情懷，早期手裡的卡多，他開放提供給高校，用於科研。”有AI從業者向記者透露。

在複雜的晶片格局下，梁文鋒及DeepSeek，背負“用國產算力跑國產模型”的巨大期望。DeepSeek一發佈，國內做GPU晶片的架構，也開始變了。

V4技術報告裡，有一處提到了華為昇騰：團隊將細粒度專家平行（EP）方案，同時在輝達GPU和華為昇騰NPU上完成驗證。

“這說明DeepSeek V4的推理路徑，已具備跨算力平台的適配能力。”一位AI行業人士稱。

與之對應，DeepSeek介紹V4價格時，一行標灰的圖注小字，資訊量巨大：

受限於高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批次上市後，Pro的價格會大幅下調。

種種訊號，引人振奮。國產算力要完全“頂起來”，仍需時間。

“國產算力目前集中在推理階段，且限定在容錯率高的場景，離吃算力的核心預訓練階段使用，還有段距離。”

有AI行業從業者給出相對保守的估算，“起碼八到十年的差距要追趕。”

03. 死磕效率

回到V4本身，它是觀察梁文鋒模型taste（品味），最直觀的出口。

總體來說，關鍵詞沒有變：效率。

DeepSeek-V4開創了一種全新的注意力機制——在token維度進行壓縮，結合DSA稀疏注意力，實現極強長上下文能力的同時，相比傳統方法，大幅降低對計算和視訊記憶體的需求。

簡單來說，它讓長文字處理效率，有了質的飛躍。

由此，百萬級上下文，以前是閉源旗艦模型才玩得起的“奢侈品”，一下打成“白菜價”。

V4有兩個版本，DeepSeek-V4-Pro（專家模式）和DeepSeek-V4-Flash（快速模式）。

前者負責“強”，官方稱，性能比肩頂級閉源模型；後者負責“省”，提供快捷、經濟的服務。

專項能力方面，梁文鋒帶隊重點攻Agent方向，V4系列針對Claude Code、OpenClaw等主流Agent產品進行適配和最佳化。

內部稱，在Agentic Coding評測中，V4-Pro已達當前開源模型最佳水平。

“據評測反饋，使用體驗優於Sonnet 4.5，交付質量接近Opus 4.6非思考模式，仍與Opus 4.6思考模式存在一定差距。”DeepSeek罕見披露了內部使用Agentic Coding模型的狀況。

需要指出的是，DeepSeek此次發的是“預覽版”，正式版還要再等等。

“V4的能力水平仍落後於GPT-5.4和Gemini-3.1-Pro，發展軌跡大約滯後前沿閉源模型3至6個月。”在技術報告中，團隊坦言。

錨定頂級模型，梁文鋒仍執著求解，當算力越來越貴的時候，能否通過極致的架構創新，繼續把算力成本砍下來。

“不誘於譽，不恐於誹，率道而行，端然正己。”V4的發佈公告裡，梁和團隊以這樣的一句總結，表明初心。 (EDA365電子論壇)