2025年2月,中國國產AI大模型DeepSeek首次實現單月收入覆蓋營運成本,成為中國AI賽道首個“不燒錢也能活”的標竿。然而,創始人梁文鋒卻選擇了一條與眾不同的路——拒絕資本誘惑,暫停商業化擴張,將全部資源投入通用人工智慧(AGI)研發。在“賺快錢”與“造未來”之間,這位低調的極客為何如此決絕?
據《金融時報》報導,DeepSeek在2025年2月首次實現收入覆蓋營運成本,其使用者規模、API呼叫量及雲平台合作量均呈指數級增長。但梁文鋒卻直言:“盈虧平衡只是起點,AGI才是終點。”
低成本奇蹟:DeepSeek以557萬美元訓練出媲美GPT-4o的模型,成本僅為OpenAI的1/10,其開源框架DeepEP更將推理成本壓至每百萬Token 0.11美元,直接點燃全球AI開發者的熱情。
商業化克制:儘管接入阿里雲、騰訊雲等巨頭平台,並吸引輝達CEO黃仁勳公開讚譽,團隊卻暫停商業化擴張,將算力優先用於研發R2、V4等下一代模型。
梁文鋒的執念:“AGI不是資本遊戲,而是人類認知革命的鑰匙。我們不會為了短期利潤,讓技術淪為‘高級外包’。”
在矽谷大廠瘋狂收割AI紅利時,DeepSeek選擇了一條更孤獨的路——專注底層技術突破,押注通用人工智慧。
1. 技術路徑的三大支柱
數學與程式碼:梁文鋒自幼展現數學天賦,其量化交易背景讓DeepSeek模型在數學推理、程式碼生成等領域超越GPT-4。
多模態融合:DeepSeek-VL模型以混合視覺編碼技術,實現高解析度圖像處理與低計算開銷的平衡,為AGI的“感官協同”鋪路。
自然語言本質:通過MLA和MoE架構最佳化,模型生成速度提升3倍,逼近人類對話流暢度。
2. 開源哲學
DeepSeek不僅開放原始碼,更公開訓練細節,梁文鋒認為“開源是AGI的加速器,而非商業護城河”。這一策略吸引全球開發者共建生態,形成技術“滾雪球”效應。
面對資本追捧,梁文鋒展現出罕見的冷靜:
不融資的底氣:憑藉早期量化投資的資金積累和萬卡算力儲備(1萬枚H800+A100晶片),DeepSeek無需依賴外部輸血。
商業化的底線:即使API呼叫量暴漲,團隊仍堅持“使用者測試免費,核心能力留給AGI研發”。梁文鋒直言:“MaaS價格戰是內耗,我們要做的是重新定義AI的價值鏈。”
長期主義佈局:公司已啟動自研視訊模型,計畫通過算力最佳化“搶灘”多模態應用場景,並與國產算力中心合作建構AGI基礎設施。
行業反思:當其他企業為融資PPT絞盡腦汁時,DeepSeek用技術實力證明——真正的顛覆者,不需要討好資本。
梁文鋒的野心不止於技術領先,他更想證明中國能誕生“改變人類認知範式”的原創創新:
技術目標:2025年發布的R2、V4模型將支援更複雜的邏輯推理和跨模態互動,逼近“人類級思維”。
社會價值:從開源醫療影像系統到鄉村AI教育計畫,DeepSeek始終踐行“技術向善”,讓AI普惠弱勢群體。
全球競合:輝達、微軟等巨頭已主動適配DeepSeek框架,中國AI正從“跟隨者”變為“規則制定者”。
梁文鋒的終極思考:“我們不是在創造AI,而是在重新定義人性的邊界。”
在資本狂潮中,DeepSeek的冷靜與梁文鋒的執著,為中國AI產業提供了另一種答案——不追風口,只造未來。當AGI的曙光初現,這場“技術苦行”或許正是通往星辰大海的最短路徑。 (AI應用學習研究)