梁文鋒,砍下3400億估值

引入強援,留住人才。

梁文鋒第一次敞開懷抱,引入戰投。

有消息稱,其掌舵的DeepSeek,即將完成首輪融資,投後估值高達500億美元,約合3400億人民幣

作為杭州深度求索的創始人,梁文鋒的最終受益股份,達到84%。據稱,其個人投入或高達200億元人民幣,佔募資總額的四成。

融資前夕,他剛“交完作業”。4月24日,DeepSeek-V4上線,距離上一代大版本V3的發佈,足足隔了484天。

DeepSeek被挖走太多人才、高端算力受限。”

一位AI行業資深從業人士向《21CBR》記者表示,這是其轉變融資態度、新版本發佈推遲的原因。

走下理想國的高塔,梁文鋒尋找強援,直面技術創新之外的現實問題。

01. 錨點留人

DeepSeek不差錢。

2025年,其母公司幻方量化的平均收益率,高達56.6%,按照700億元的管理規模計,對應約400億元收益,幻方和出資人按行規二八分帳,可以提走七八十億。

有幻方量化作為出資人,為DeepSeek研發輸血,資金安全墊厚實。“我們面臨的問題,從來不是錢。”梁文鋒曾如此表示。

然而,員工個人會有財務的考慮,DeepSeek最聰明的那群人在流失。

《21CBR》記者翻開DeepSeek V4長達58頁的技術報告,末尾的作者列表,梁文鋒與其他研究員、工程師,近300人並列署名。

10個帶星號的名字有些扎眼,標註著“已離職”。

近期出走的技術骨幹之一,郭達雅,曾深度參與V3、R1等爆款模型研發,加盟字節Seed,傳聞年薪近億元

字節方面否認了該說法,補拋了個“鉤子”,“不排除有些Seed技術人員,四年後收益會達到數億元”。

其實,梁文鋒開的薪資不低。一名求職者透露,他在2024年面試DeepSeek的深度學習研究員,HR透露薪資能達到150萬元

這位“技術宅”老闆,還給了足夠多的空間。

一個細節是,DeepSeek的員工通常18點下班,早上不打卡,也沒有KPI。源於梁文鋒認為,人一天能高品質輸出的時間,很難超過6-8小時,創新需要儘可能少的干預和管理。

來源:21財經APP

在AI搶人大戰裡,梁文鋒還需要給團隊更多安全感,尤其是,對員工手裡的期權,有所交代。

有了外部融資,DeepSeek會有一個公開估值,期權才有定價錨點。這是留人的前提。

梁文鋒改變態度,正與國家積體電路產業投資基金、騰訊等機構洽談。

知情人士稱,本輪融資將用於提升計算能力和改善員工福利,以應對激烈的競爭。

02. 算力博弈

人才議題之外,梁文鋒還有一場算力的硬仗要打。

截至5月9日,DeepSeek共有36個職位亟待人才,光4月27日,就批次放出了十余個崗位需求。

梁文鋒對產品的關注度提升,強化Agent方向的人才招募及探索,同時,開招“搜尋演算法研究員”。

該崗位職責包括設計面向AGI的新一代通用搜尋引擎,負責LLM在搜尋場景下的規模化落地。

為了突破算力瓶頸,DeepSeek開始招募“AI超算叢集維運工程師”了。

其職責之一,是“負責新一代計算資源的快速交付與上線,確保資源能高品質、高性能地投入生產”。有千卡以上的大規模AI超算叢集維運經驗,是崗位加分項。

同月開招的,還有“資料中心高級交付經理”“資料中心高級維運工程師”,工作地點在烏蘭察布,月薪最高3萬元。

梁文鋒早在2021年,就頗有先見之明地囤了1萬張輝達A100。

“梁很有情懷,早期手裡的卡多,他開放提供給高校,用於科研。”有AI從業者向記者透露。

幻方“螢火一號”

在複雜的晶片格局下,梁文鋒及DeepSeek,背負“用國產算力跑國產模型”的巨大期望。DeepSeek一發佈,國內做GPU晶片的架構,也開始變了。

V4技術報告裡,有一處提到了華為昇騰:團隊將細粒度專家平行(EP)方案,同時在輝達GPU和華為昇騰NPU上完成驗證。

“這說明DeepSeek V4的推理路徑,已具備跨算力平台的適配能力。”一位AI行業人士稱。

與之對應,DeepSeek介紹V4價格時,一行標灰的圖注小字,資訊量巨大:

受限於高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批次上市後,Pro的價格會大幅下調。

種種訊號,引人振奮。國產算力要完全“頂起來”,仍需時間。

“國產算力目前集中在推理階段,且限定在容錯率高的場景,離吃算力的核心預訓練階段使用,還有段距離。”

有AI行業從業者給出相對保守的估算,“起碼八到十年的差距要追趕。”

03. 死磕效率

回到V4本身,它是觀察梁文鋒模型taste(品味),最直觀的出口。

總體來說,關鍵詞沒有變:效率。

DeepSeek-V4開創了一種全新的注意力機制——在token維度進行壓縮,結合DSA稀疏注意力,實現極強長上下文能力的同時,相比傳統方法,大幅降低對計算和視訊記憶體的需求。

簡單來說,它讓長文字處理效率,有了質的飛躍。

由此,百萬級上下文,以前是閉源旗艦模型才玩得起的“奢侈品”,一下打成“白菜價”。

V4有兩個版本,DeepSeek-V4-Pro(專家模式)和DeepSeek-V4-Flash(快速模式)。

前者負責“強”,官方稱,性能比肩頂級閉源模型;後者負責“省”,提供快捷、經濟的服務。

專項能力方面,梁文鋒帶隊重點攻Agent方向,V4系列針對Claude Code、OpenClaw等主流Agent產品進行適配和最佳化。

DeepSeek-V4-Pro:性能比肩頂級閉源模型

內部稱,在Agentic Coding評測中,V4-Pro已達當前開源模型最佳水平

“據評測反饋,使用體驗優於Sonnet 4.5,交付質量接近Opus 4.6非思考模式,仍與Opus 4.6思考模式存在一定差距。”DeepSeek罕見披露了內部使用Agentic Coding模型的狀況。

需要指出的是,DeepSeek此次發的是“預覽版”,正式版還要再等等。

來源:21財經APP

“V4的能力水平仍落後於GPT-5.4和Gemini-3.1-Pro,發展軌跡大約滯後前沿閉源模型3至6個月。”在技術報告中,團隊坦言。

錨定頂級模型,梁文鋒仍執著求解,當算力越來越貴的時候,能否通過極致的架構創新,繼續把算力成本砍下來。

“不誘於譽,不恐於誹,率道而行,端然正己。”V4的發佈公告裡,梁和團隊以這樣的一句總結,表明初心。 (EDA365電子論壇)