#V3論文
2025/01/29
•
【DeepSeek】繞開CUDA壟斷,V3論文細節再挖出!輝達護城河不存在了?
【新智元導讀】DeepSeek模型開發竟繞過了CUDA?最新爆料稱,DeepSeek團隊走了一條不尋常的路——針對輝達GPU低級彙編語言PTX進行最佳化實現最大性能。業界人士紛紛表示,CUDA護城河不存在了? 原本DeepSeek低成本訓出的R1,就已經讓整個矽谷和華爾街為之虎軀一震。 而現在又曝出,打造這款超級AI,竟連CUDA也不需要了? 根據外媒的報導,他們在短短兩個月時間,在2,048個H800 GPU叢集上,訓出6710億參數的MoE語言模型,比頂尖AI效率高出10倍。