一夜爆火全球的DeepSeek,自從其發表DeepSeek-R1大模型之後,震撼了全球人工智慧撼動了美國科技界。更是憑藉一己之力拉崩了納斯達克,致使輝達暴跌17%。
但被美國大V們一頓猛誇之後,發現常規的科技競爭打不過了,於是只能再次祭出所謂「國家安全」的幌子。根據財聯社消息,美國於1月29日確認正在準備對DeepSeek進行所謂的安全調查。
當然, 除了美國之外,義大利隱私監管機構(Garante)於2025年1月28日晚間宣佈,已向DeepSeek的中國公司傳送了正式的資訊請求,要求其說明如何處理使用者資料。1月29日義大利下架DeepSeek應用,已無法在義大利蘋果Store 和Google的Play Store 上下載了。另外,愛爾蘭、澳洲等國也對DeepSeek的下載和應用開始使用設限。
與這些國家行為截然相反的是,全球科技巨頭集體「著急」接入DeepSeek,如微軟、輝達、亞馬遜等都已接入DeepSeek。而輝達直接的競爭對手AMD更是第一個站出來支援DeepSeek ,希望透過DeepSeek的背刺進一步參與到全球高階GPU市場,提升自身的市場份額。
這意味著,美國科技巨頭們已經站隊DeepSeek,與當局政府背道而馳,足以說明DeepSeek在全球市場的號召力與影響力。
然而飆叔認為,這些全球巨頭的站隊固然重要;但讓人振奮的無疑還是國產巨頭——華為正式接入DeepSeek 。當然,最讓人意想不到的是,DeepSeek直接用上了華為升騰910B晶片,據說已經將部分算力遷移到華為升騰910B上,採用的是精準動態調節技術,雖然性能損耗5%,但成本降低一半以上。
也就是說,華為與DeepSeek正式合體了;飆叔認為兩者的合體,超越了單純的市場價值,而具有超越行業的巨大價值和意義;同時也是輝達以及美國人工智慧行業最為擔心和害怕的!為何這麼說呢?
我們知道2024年美國對於中國半導體的打壓和限制,其中最為嚴格的就在於人工智慧領域,如其要求輝達出口中國的GPT連續兩次降頻,從H100到H800,再到H20;閹割兩次後,從特定的計算任務或績效指標來看,H20綜合算力僅相當於H100的20%左右。
對於DeepSeek而言,直接使用華為升騰910B,不僅是可以繞過美國的晶片管制;更重要的是其性能接近輝達A800水平,已實現了從設計到量產的全國產化鏈條。當然,大家可能會擔心升騰910晶片的產能問題,從供應鏈相關消息來看,目前國產晶片製造的技術與能力7nm工藝良率已經達到90%以上,這意味著同樣是7nm製程的升騰910系列晶片產能將不會有問題。
從而,DeepSeek的這個選擇不僅打破了一流AI大模型非得使用輝達GPU不可的神話;同時也給予了國產AI晶片更大的市場機會。
當然,不可否認的是目前國產AI晶片與輝達主流產品依然差距不小;如華為的升騰910B,與輝達的A100還存在代差。
但這種硬體層面的代差,DeepSeek透過軟體層面進行了彌補;而且非常關鍵的是DeepSeek甚至繞過了CUDA,使用更底層的程式語言做最佳化。
根據Mirae Asset Securities Research (韓國未來資產證券)的分析:DeepSeek V3的硬體效率之所以能比Meta等高出10倍,可以總結為“他們從頭開始重建了一切” 。即DeepSeek繞過了CUDA,使用的是PTX(Parallel Thread Execution)語言實現的;PTX在接近彙編語言的層級運行,允許進行細粒度的最佳化,如暫存器分配和Thread/Warp等級的調整。
這對輝達來說,幾乎是致命的,CUDA是輝達經過幾十年的積累和沈降而來的,現在CUDA已經做到了從開發者到使用者的全產業鏈繫結。無論是訓練大模型還是進行即時推理,CUDA都提供了無與倫比的工具鏈支援。詳細可參看:破局!調查輝達,一步險棋,但國產GPU還有更好選擇?
因而,DeepSeek繞過CUDA不僅在技術上實現了突破;更重要的是全球第一次真正意義上衝破了CUDA的束縛。這意味著,強大而近乎完美CUDA生態被撕開了一個口子;這或許才是輝達老黃「仰天長嘆」的最主要原因吧。
一直以來,由於美國打壓和市場的雙重壓力,國產AI生態從硬體到軟體,以致整個AI生態都是被輝達為代表的全球巨頭所定義。
而此次DeepSeek開源AI模型,使用升騰910晶片,繞過CUDA生態;這給國產AI大模型,甚至是其他後發國家的AI發展提供了「第二條發展路徑」。
DeepSeek大模型與升騰平台的深度融合,則提供了「演算法+晶片」一站式解決方案。當然,這不是說直接顛覆了CUDA生態,但對於相當一部分的開發者有了一個新的選擇——從CUDA生態遷移到新的國產平台。
同時鑑於DeepSeek從底層重構了程式碼,直接繞過了輝達的CUDA架構生態,避免被輝達技術綁架;也就是說其他國產AI大模型遷移到各個國產算力晶片平台將變得可能,甚至將變得輕而易舉。
如上所述,底層程式碼的AI大模型、華為升騰AI晶片,以及繞過CUDA的工具鏈;這意味著國產AI生態正在形成閉環,甚至未來將形成國產AI技術標準。
因此,飆叔認為縱然DeepSeek技術確實有過人之處,但僅僅是單個大模型並不足以撼動美國在人工智慧產業上的絕對優勢;而當與華為升騰合體之後產生的生態效應將無限放大國產AI產業在全球的模倣傚應,成為其他國家AI產業發展的範本,這意味著不僅輝達AI產業壟斷地位的喪失,同時也動搖了美國人工智慧新科技霸權的地位。 (飆叔科技洞察)