DeepSeek開源第三彈,是支援稠密和MoE模型的FP8計算庫——DeepGEMM,支援V3/R1訓推。僅憑300行程式碼,就超過了專家最佳化的核心。開發者驚嘆:DeepSeek有最好的GPU工程師,彷彿擁有某種編譯器黑魔法!更令人興奮的是,DeepSeek-R2有望在5月前提前發佈。
第三天,DeepSeek發佈了DeepGEMM。
這是一個支援稠密和MoE模型的FP8 GEMM(通用矩陣乘法)計算庫,可為V3/R1的訓練和推理提供強大支援。
僅用300行程式碼,DeepGEMM開源庫就能超越專家精心調優的矩陣計算核心,為AI訓練和推理帶來史詩級的性能提升!