NVIDIA PTX ISA(平行執行緒執行,PTX 指令集)文件裡面早就已經出現了 .ue8m0 這個資料類型地址:https://docs.nvidia.com/cuda/parallel-thread-execution/#mma-scaling-kind-type-valid-combinationUE8M0 fp8 並不是 DeepSeek 獨創至少從 PTX 8.0/9.0(對應 Hopper/Ada 架構 GPU)開始,NVIDIA 已經在 ISA 等級支援 .ue8m0它就是 NVIDIA 官方 scale 資料格式之一,用在 FP8/FP4 混合精度量化的場景NVIDIA Hopper 架構 (H100 系列)H100 GPU(2022 年發佈),面向資料中心和 AI 訓練/推理,是 首個官方支援 FP8 (E4M3 / E5M2) 混合精度 的 GPU 架構,在 PTX 指令裡引入了 .ue8m0 作為 scale data type。NVIDIA Ada Lovelace 架構 (RTX 40 系列)RTX 4090 / 4080 / 4070 等消費級顯示卡(2022 年底發佈),面向遊戲和 AI 推理。同樣在底層指令集裡繼承了 .ue8m0、E4M3/E5M2 的支援。也就是說技術上:UE8M0 已經在 NVIDIA 硬體生態存在因此個人覺得DeepSeek 這句話應該這麼理解這相當於DeepSeek V3.1 把原本只在硬體/核心實現層面存在的 scale 表達方式,提升到模型部署和訓練標準,適配了國產下一代晶片,但DeepSeek的確是在走別人沒走過的路 (AI寒武紀)