【DeepSeek】AI人物:DeepSeek 創始人梁文鋒

梁文鋒,男,1985 年出生於廣東省湛江市,畢業於浙江大學,資訊與電子工程學碩士,量化私募幻方量化創始人、國產大模型企業深度求索(DeepSeek)創始人。

梁文鋒是中國人工智慧與量化投資領域的領軍人物,其職業生涯融合了技術創新與商業突破。


2008 年,在浙大讀研期間,梁文鋒開始帶領團隊使用機器學習等技術探索全自動量化交易。2015 年,創立幻方量化,開始在量化投資領域嶄露頭角。2019 年,幻方量化管理規模已超 100 億,成為國內量化私募“四巨頭”之一。2023 年 7 月,幻方量化宣佈成立大模型公司 DeepSeek,正式進軍通用人工智慧領域。2024 年 12 月 26 日,DeepSeek 宣佈上線並同步開放原始碼的 DeepSeek-V3 模型,採用 MLA(多頭潛在注意力)和 MoE 架構,訓練成本僅為 GPT-4o 的十分之一,引發行業價格戰。2025 年 1 月 20 日,DeepSeek 正式發佈 DeepSeek-R1 模型,該模型在數學、程式碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。

職業經歷

  • 2008 年,在浙大讀研期間,他帶領團隊探索全自動量化交易,結合機器學習技術分析金融市場資料,期間曾拒絕加入大疆創始人汪滔的創業邀請。
  • 2013 年,與同學徐進共同創立杭州雅克比投資管理公司,初步涉足量化投資領域。
  • 2015 年,成立幻方量化,依託數學建模與 AI 技術進行量化投資,2016 年上線首個 AI 策略,2017 年全面實現投資策略 AI 化。
  • 2019 年,管理規模突破百億,2021 年一度超千億,成為國內量化私募“四大天王”之一。
  • 2019 年,投資 2 億元自建“螢火一號”超算(1100 塊 GPU),2021 年斥資 10 億升級至“螢火二號”(萬卡級 A100 GPU 叢集),算力規模媲美頭部科技公司。
  • 2023 年,7 月成立深度求索(DeepSeek),專注於通用人工智慧(AGI)與大模型研發,初期資金由幻方量化支援。
  • 2024 年,推出高性價比的 DeepSeek-V2(2024 年 5 月)和 V3(2024 年 12 月),採用 MLA(多頭潛在注意力)和 MoE 架構,訓練成本僅為 GPT-4o 的十分之一,引發行業價格戰。
  • 2025 年,1月正式發佈 DeepSeek-R1,完全開源模型並公開技術細節,推動 AI 技術普惠化。

核心理念

梁文鋒堅信“AI 將改變世界”,主張從基礎研究切入,探索 AGI 本質,而非短期商業化。提出“普惠 AI”理念,通過低價 API(如 V3 定價為 GPT-4 的 1%)推動技術普及,被喻為“AI 界拼多多”。倡導開源技術,認為閉源護城河短暫,開放生態才能促進全球協作與技術進步。

行業影響

梁文鋒被矽谷稱為“來自東方的神秘力量”,其模型性能在數學、程式碼等領域比肩 GPT-4o,獲 Meta 首席科學家 Yann LeCun 等國際認可。

個人風格

梁文鋒低調務實,極少接受採訪,網上無公開照片,以“技術極客”形象著稱。崇尚長期主義,強調“用最長期的眼光回答最大的問題”,拒絕中庸,專注前沿探索。

總結

梁文鋒以量化投資積累的財力與算力,推動 DeepSeek 在 AI 大模型領域實現低成本技術突破,其開源策略與普惠理念重塑行業格局。他的職業生涯體現了技術創新與商業理想的結合,被視為中國 AI 全球化競爭的關鍵人物。 (FED實驗室)