【DeepSeek】創始人梁文鋒不同尋常的42個觀點...

2025/01/28

•

已經火出圈的DeepSeek創始人梁文鋒極其低調，網路上只能找到兩張照片和一次訪談內容，訪談內容前文已經分享過(DeepSeek創始人梁文鋒專訪：不是所有人都能瘋狂一輩子，中國的AI不可能永遠跟隨，需要有人站到技術的前沿！)

現在將其中梁文鋒提交的內容進行梳理和整理分享給大家，讓大家能快速清晰的理解這位傳奇CEO與眾不同的思維和思考角度。

一、技術創新觀

原創性差距
"中國AI和美國有一兩年差距，但真實的gap是原創和模仿之差"
▶ 必須突破技術跟隨慣性，建立自主創新體系
架構突破
"Llama結構在訓練效率和推理成本上，和國外先進水平估計也已有兩代差距"
▶ 主動研發MLA等新型架構替代傳統結構
效率革命
"國內訓練效率與資料效率存在雙倍差距，合起來要多消耗4倍算力"
▶ 通過演算法創新突破算力依賴

二、商業模式觀

定價邏輯
"我們降價是因為成本先降下來了，AI應該是普惠的"
▶ 基於真實成本定價，拒絕燒錢補貼
開源戰略
"閉源形成的護城河是短暫的，開源更像文化行為而非商業行為"
▶ 選擇永久開源建立技術生態
專業分工
"我們專注基礎模型，其他公司建構應用，形成產業上下游"
▶ 建構"基礎模型+垂直應用"分工體系

三、組織文化觀

管理哲學
"每個人隨時可以呼叫訓練叢集的卡無需審批"
▶ 實行無層級架構，資源自由調配
創新機制
"創新都是自己產生的，不是刻意安排的，更不是教出來的"
▶ 自下而上探索替代KPI驅動
價值觀篩選
"選人標準是熱愛和好奇心，遠超對錢的在意"
▶ 通過精神驅動篩選人才

四、人才策略觀

人才標準
"核心技術崗位以應屆和畢業一兩年的人為主"
▶ 重基礎能力，輕行業經驗
培養理念
"交給他重要的事不干預，讓他自己想辦法"
▶ 通過實戰項目自主成長

五、行業趨勢觀

算力泡沫
"訓練成本1/20的降維打擊，揭穿了兆算力泡沫"
▶ 演算法突破正在重構產業邏輯
終局預判
"最終存活2-3家，有價值的東西會換種方式存在"
▶ 精細化營運者方能生存

六、研發投入觀

算力儲備
"萬卡儲備是逐步發生的，主要源於好奇心驅動"
▶ 16年持續積累算力基礎設施
長期主義
"AGI可能在2年、5年或10年實現，但必定在我們有生之年"
▶ 接受長周期研發現實 (阿拉丁AI神燈)

從這裡可透過《Google 新聞》追蹤鉅亨號創作者