登入
關鍵字
#CUDA壟斷
官方認證
美股艾大叔
2025/01/29
•
【DeepSeek】繞開CUDA壟斷,V3論文細節再挖出!輝達護城河不存在了?
【新智元導讀】DeepSeek模型開發竟繞過了CUDA?最新爆料稱,DeepSeek團隊走了一條不尋常的路——針對輝達GPU低級彙編語言PTX進行最佳化實現最大性能。業界人士紛紛表示,CUDA護城河不存在了? 原本DeepSeek低成本訓出的R1,就已經讓整個矽谷和華爾街為之虎軀一震。 而現在又曝出,打造這款超級AI,竟連CUDA也不需要了? 根據外媒的報導,他們在短短兩個月時間,在2,048個H800 GPU叢集上,訓出6710億參數的MoE語言模型,比頂尖AI效率高出10倍。
#DeepSeek
#CUDA壟斷
#V3論文
285人
讚
留言
分享
官方認證
RexAA
2024/06/23
•
打破CUDA的壟斷
隨著人工智慧不斷滲透到生活的各個領域,這些工具將運行在哪種軟體上仍然是一個問題。軟體堆疊(或協同工作以在計算系統上實現特定功能的軟體元件集合)的選擇在以 GPU 為中心的人工智慧任務計算需求中變得越來越重要。 隨著 AI 和 HPC 應用不斷突破計算能力的極限,軟體堆疊的選擇會顯著影響性能、效率和開發人員的生產力。 目前,軟體堆疊競爭中有三個主要參與者:Nvidia 的計算統一裝置架構 (CUDA)、英特爾的 oneAPI 和 AMD 的 Radeon Open Compute (ROCm)。雖然它們各有優缺點,但 Nvidia 的 CUDA 繼續佔據主導地位,主要是因為其硬體在 HPC 和現在的 AI 領域處於領先地位。 在這裡,我們將深入研究每個軟體堆疊的複雜性——探索它們的功能、硬體支援以及與流行的 AI 框架 PyTorch 的整合。此外,我們將最後快速瞭解兩種高級 HPC 語言:Chapel 和 Julia。
#CUDA
#壟斷
#Nvidia
256人
讚
留言
分享