華爾街頂尖分析師鉅亨網開專欄【Joe’s華爾街脈動】，即日起分享會員

什麼是DeepSeek開啟融資的直接導火線？

The Information最新消息曝光：梁文鋒看到Claude Mythos通過海量算力和資料訓練出超強能力，意識到DeepSeek不儲備彈藥根本沒法打下去了。

Anthropic今年4月發佈第一個預覽，DeepSeek融資傳聞也是4月中旬第一次傳出。

融資完成後，DeepSeek本周四罕見地發了一則公開聲明：

所有部門招人“至少翻倍”，覆蓋AI系統開發、基礎設施、產品開發和深度學習研究。

其中負責把模型轉化為自主AI智能體的核心部門 Harness團隊，已經進入每天面試的狀態。

該團隊負責人崔添翼今年3月從Jane Street跳槽加入，本月早些時候在X上透露了這一節奏。

與此同時，DeepSeek正在加緊適配國產晶片，梁文鋒相信華為晶片幾年內就能追上輝達的水平，DeepSeek應該率先完成適配。

華為去年才得知DeepSeek在私下試驗自家晶片後，開始與其直接合作。

DeepSeek的訓練和部署系統是圍繞輝達CUDA軟體搭建的，工程師必須重寫底層軟體才能讓模型在華為晶片上高效運行。

這直接導致DeepSeek長達15個月沒有發佈任何新一代模型，在其他頂級實驗室兩三個月就發一次新模型的時代，這個空窗期格外扎眼。

這也讓DeepSeek錯過了去年下半年Anthropic Claude Code掀起的程式設計工具熱潮。

但梁文鋒在路演中對投資人說，程式設計工具和AI聊天機器人一樣，都只是AI進化中的臨時產物，如果重注押在這些短期產品上，會偏離通往AGI的終極目標。

最新爆料還指出，梁文鋒並非一開始就抗拒風投。

2023年他確實見過投資人，但當他告訴對方DeepSeek只做深度研究和科學探索、沒有任何商業化或產品路線圖時，投資人紛紛打了退堂鼓。

最後樑文鋒自己掏錢養活了這個實驗室，一養就是三年。

這次74億美元的融資中，梁文鋒自己寫了最大的一張支票：200億人民幣（約30億美元），佔總額的五分之二。

融資完成後，DeepSeek設立了員工持股計畫，按實際估值分配股份。

梁文鋒告訴身邊人，他的戰略不會變：繼續開源、保持低價、專注AGI。他把AGI定義為機器在理解、推理、學習、規劃和適應等廣泛任務上達到人類水平。

他還告訴身邊人，AI不應該被少數人控制。

DeepSeek是目前唯一一家將所有模型底層程式碼完全公開的主要AI實驗室。

在美國開發者群體中，DeepSeek的存在感正在急速膨脹。今年4月發佈的旗艦模型V4，5月在Vercel的AI Gateway平台上token用量份額從不到1%飆升至17%，一個月內成為該平台僅次於Anthropic和Google的第三大模型。

輕量版V4 Flash的價格比Anthropic模型便宜20到50倍。

這種增長在6月仍在繼續。   (量子位)

DeepSeek 近期完成 74 億美元融資，其中創辦人梁文鋒個人出資約 30 億美元。此舉旨在應對 Anthropic 等對手的算力壓力，並計畫將團隊規模翻倍。技術路徑上，DeepSeek 採取激進策略，重寫底層軟體以適配華為晶片，雖造成短期發佈空窗，但旨在擺脫 NVIDIA 依賴。梁文鋒重申將堅持「開源、低價、專注 AGI」的戰略，反對 AI 被少數寡頭控制。目前其 V4 模型憑藉極高成本優勢，在 Vercel 等平台的使用份額正迅速增長。

Claude Mythos讓梁文鋒決定融資

DeepSeek三百人團隊要翻倍

“AI不應該被少數人控制”