什麼是DeepSeek開啟融資的直接導火線?
The Information最新消息曝光:梁文鋒看到Claude Mythos通過海量算力和資料訓練出超強能力,意識到DeepSeek不儲備彈藥根本沒法打下去了。
Anthropic今年4月發佈第一個預覽,DeepSeek融資傳聞也是4月中旬第一次傳出。
時間線,剛好對得上。
DeepSeek三百人團隊要翻倍
融資完成後,DeepSeek本周四罕見地發了一則公開聲明:
所有部門招人“至少翻倍”,覆蓋AI系統開發、基礎設施、產品開發和深度學習研究。
目前DeepSeek全公司約300人。
其中負責把模型轉化為自主AI智能體的核心部門 Harness團隊,已經進入每天面試的狀態。
該團隊負責人崔添翼今年3月從Jane Street跳槽加入,本月早些時候在X上透露了這一節奏。
與此同時,DeepSeek正在加緊適配國產晶片,梁文鋒相信華為晶片幾年內就能追上輝達的水平,DeepSeek應該率先完成適配。
華為去年才得知DeepSeek在私下試驗自家晶片後,開始與其直接合作。
但適配的代價不小。
DeepSeek的訓練和部署系統是圍繞輝達CUDA軟體搭建的,工程師必須重寫底層軟體才能讓模型在華為晶片上高效運行。
這直接導致DeepSeek長達15個月沒有發佈任何新一代模型,在其他頂級實驗室兩三個月就發一次新模型的時代,這個空窗期格外扎眼。
這也讓DeepSeek錯過了去年下半年Anthropic Claude Code掀起的程式設計工具熱潮。
但梁文鋒在路演中對投資人說,程式設計工具和AI聊天機器人一樣,都只是AI進化中的臨時產物,如果重注押在這些短期產品上,會偏離通往AGI的終極目標。
“AI不應該被少數人控制”
最新爆料還指出,梁文鋒並非一開始就抗拒風投。
2023年他確實見過投資人,但當他告訴對方DeepSeek只做深度研究和科學探索、沒有任何商業化或產品路線圖時,投資人紛紛打了退堂鼓。
最後樑文鋒自己掏錢養活了這個實驗室,一養就是三年。
這次74億美元的融資中,梁文鋒自己寫了最大的一張支票:200億人民幣(約30億美元),佔總額的五分之二。
融資完成後,DeepSeek設立了員工持股計畫,按實際估值分配股份。
梁文鋒告訴身邊人,他的戰略不會變:繼續開源、保持低價、專注AGI。他把AGI定義為機器在理解、推理、學習、規劃和適應等廣泛任務上達到人類水平。
他還告訴身邊人,AI不應該被少數人控制。
DeepSeek是目前唯一一家將所有模型底層程式碼完全公開的主要AI實驗室。
在美國開發者群體中,DeepSeek的存在感正在急速膨脹。今年4月發佈的旗艦模型V4,5月在Vercel的AI Gateway平台上token用量份額從不到1%飆升至17%,一個月內成為該平台僅次於Anthropic和Google的第三大模型。
輕量版V4 Flash的價格比Anthropic模型便宜20到50倍。
這種增長在6月仍在繼續。 (量子位)
