已經火出圈的DeepSeek創始人梁文鋒極其低調,網路上只能找到兩張照片和一次訪談內容,訪談內容前文已經分享過(DeepSeek創始人梁文鋒專訪:不是所有人都能瘋狂一輩子,中國的AI不可能永遠跟隨,需要有人站到技術的前沿!)
現在將其中梁文鋒提交的內容進行梳理和整理分享給大家,讓大家能快速清晰的理解這位傳奇CEO與眾不同的思維和思考角度。
一、技術創新觀
- 原創性差距
"中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差"
▶ 必須突破技術跟隨慣性,建立自主創新體系 - 架構突破
"Llama結構在訓練效率和推理成本上,和國外先進水平估計也已有兩代差距"
▶ 主動研發MLA等新型架構替代傳統結構 - 效率革命
"國內訓練效率與資料效率存在雙倍差距,合起來要多消耗4倍算力"
▶ 通過演算法創新突破算力依賴
二、商業模式觀
- 定價邏輯
"我們降價是因為成本先降下來了,AI應該是普惠的"
▶ 基於真實成本定價,拒絕燒錢補貼 - 開源戰略
"閉源形成的護城河是短暫的,開源更像文化行為而非商業行為"
▶ 選擇永久開源建立技術生態 - 專業分工
"我們專注基礎模型,其他公司建構應用,形成產業上下游"
▶ 建構"基礎模型+垂直應用"分工體系
三、組織文化觀
- 管理哲學
"每個人隨時可以呼叫訓練叢集的卡無需審批"
▶ 實行無層級架構,資源自由調配 - 創新機制
"創新都是自己產生的,不是刻意安排的,更不是教出來的"
▶ 自下而上探索替代KPI驅動 - 價值觀篩選
"選人標準是熱愛和好奇心,遠超對錢的在意"
▶ 通過精神驅動篩選人才
四、人才策略觀
- 人才標準
"核心技術崗位以應屆和畢業一兩年的人為主"
▶ 重基礎能力,輕行業經驗 - 培養理念
"交給他重要的事不干預,讓他自己想辦法"
▶ 通過實戰項目自主成長
五、行業趨勢觀
- 算力泡沫
"訓練成本1/20的降維打擊,揭穿了兆算力泡沫"
▶ 演算法突破正在重構產業邏輯 - 終局預判
"最終存活2-3家,有價值的東西會換種方式存在"
▶ 精細化營運者方能生存
六、研發投入觀
- 算力儲備
"萬卡儲備是逐步發生的,主要源於好奇心驅動"
▶ 16年持續積累算力基礎設施 - 長期主義
"AGI可能在2年、5年或10年實現,但必定在我們有生之年"
▶ 接受長周期研發現實 (阿拉丁AI神燈)
