【DeepSeek】創始人梁文鋒不同尋常的42個觀點...

已經火出圈的DeepSeek創始人梁文鋒極其低調,網路上只能找到兩張照片和一次訪談內容,訪談內容前文已經分享過(DeepSeek創始人梁文鋒專訪:不是所有人都能瘋狂一輩子,中國的AI不可能永遠跟隨,需要有人站到技術的前沿!)

現在將其中梁文鋒提交的內容進行梳理和整理分享給大家,讓大家能快速清晰的理解這位傳奇CEO與眾不同的思維和思考角度。


一、技術創新觀

  1. 原創性差距
    "中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差"
    ▶ 必須突破技術跟隨慣性,建立自主創新體系
  2. 架構突破
    "Llama結構在訓練效率和推理成本上,和國外先進水平估計也已有兩代差距"
    ▶ 主動研發MLA等新型架構替代傳統結構
  3. 效率革命
    "國內訓練效率與資料效率存在雙倍差距,合起來要多消耗4倍算力"
    ▶ 通過演算法創新突破算力依賴

二、商業模式觀

  1. 定價邏輯
    "我們降價是因為成本先降下來了,AI應該是普惠的"
    ▶ 基於真實成本定價,拒絕燒錢補貼
  2. 開源戰略
    "閉源形成的護城河是短暫的,開源更像文化行為而非商業行為"
    ▶ 選擇永久開源建立技術生態
  3. 專業分工
    "我們專注基礎模型,其他公司建構應用,形成產業上下游"
    ▶ 建構"基礎模型+垂直應用"分工體系

三、組織文化觀

  1. 管理哲學
    "每個人隨時可以呼叫訓練叢集的卡無需審批"
    ▶ 實行無層級架構,資源自由調配
  2. 創新機制
    "創新都是自己產生的,不是刻意安排的,更不是教出來的"
    ▶ 自下而上探索替代KPI驅動
  3. 價值觀篩選
    "選人標準是熱愛和好奇心,遠超對錢的在意"
    ▶ 通過精神驅動篩選人才

四、人才策略觀

  1. 人才標準
    "核心技術崗位以應屆和畢業一兩年的人為主"
    ▶ 重基礎能力,輕行業經驗
  2. 培養理念
    "交給他重要的事不干預,讓他自己想辦法"
    ▶ 通過實戰項目自主成長

五、行業趨勢觀

  1. 算力泡沫
    "訓練成本1/20的降維打擊,揭穿了兆算力泡沫"
    ▶ 演算法突破正在重構產業邏輯
  2. 終局預判
    "最終存活2-3家,有價值的東西會換種方式存在"
    ▶ 精細化營運者方能生存

六、研發投入觀

  1. 算力儲備
    "萬卡儲備是逐步發生的,主要源於好奇心驅動"
    ▶ 16年持續積累算力基礎設施
  2. 長期主義
    "AGI可能在2年、5年或10年實現,但必定在我們有生之年"
    ▶ 接受長周期研發現實 (阿拉丁AI神燈)