【DeepSeek】獲四大中國國產GPU力挺!給全世界上了重要一課


饒毅:DeepSeek是鴉片戰爭以來,中國對人類最大的科技震撼。


智東西2月4日消息,上線20天,日活突破2000萬,這是DeepSeek創下的又一個新紀錄。


▲DeepSeek與ChatGPT日活使用者增長趨勢對比,來源:AI產品榜

根據國內AI產品榜統計,DeepSeek應用(不包含網站資料)上線5天日活就已超過ChatGPT上線同期日活,成為全球增速最快的AI應用。

相比之下,根據Quest Mobile資料,國內前AI應用明星Kimi在2024年12月的月活使用者數為2101萬。

就在昨天,矽谷頂尖風險投資家、a16Z聯合創始人Marc Andreessen發文引用SensorTower資料:目前DeepSeek日活使用者數已經達到了ChatGPT的23%,並且應用每日下載量接近500萬。


▲Marc Andreessen X平台發文

不過SensorTower統計的DeepSeek日活使用者數絕對值在1250萬左右,與國內AI產品榜統計資料有較大差異。


▲Marc Andreessen引用的資料圖表,來源:SensorTower

DeepSeek日活數、下載量的暴漲也側面印證了其在普通消費者中的火爆,春節期間DeepSeek相關話題頻頻刷屏。

昨天央視新聞官方發文“點贊”DeepSeek,DeepSeek對於網友一系列問題的回答可以說是驚豔、深刻而富有溫度。

比如對於“‘過好這一生’的真相是什麼”這一問題,DeepSeek在回答中提到,沒有完美的人生劇本,所有選擇都有代價,關鍵是承擔選擇的勇氣。我們不是來“贏”的,而是來感受花開、日落、愛與被愛的。


▲DeepSeek針對網友提問給出的答案,來源:央視新聞

就在今天,中國常駐聯合國代表傅聰在紐約聯合國總部舉行記者會中回答記者提問時特別說道:“永遠不要低估中國科研人員的聰明才智。DeepSeek引發全球轟動和一些人的焦慮恐慌,說明技術遏制和技術限制無法奏效,這是全世界、特別是美國需要學習的一課。”

傅聰反問:“從華為到TikTok,再到DeepSeek,美國還想禁多少?”


▲中國常駐聯合國代表傅聰在紐約聯合國總部舉行記者會中回答記者提問,來源:CMG國際時訊

DeepSeek在消費者中引爆的同時,這兩天國內又有更多雲巨頭加入到支援行列中。昨天下午,阿里雲和百度智能雲先後官宣了對DeepSeek-V3、DeepSeek-R1模型的支援。百度智能雲更是直接公佈了模型的輸入和輸出價格。


▲百度智能雲公佈的模型的輸入和輸出價格

加上此前的華為雲、騰訊雲,目前國內四大雲巨頭都已正式支援DeepSeek。此前海外的AWS、微軟智能雲等雲巨頭已官宣支援。


▲近期官宣支援DeepSeek模型的雲服務企業(按照時間順序排列,資訊來自各家官網、官方媒體平台)

在晶片領域,今天一大早,天數智芯、摩爾執行緒接連宣佈支援DeepSeek模型,而輝達、AMD、英特爾等海外晶片巨頭已早早完成支援。


▲近期官宣支援DeepSeek模型的晶片企業(按照時間順序排列,資訊來自各家官網、官方媒體平台)

DeepSeek捲起的全球AI風暴,已深度捲入產業中的每一位玩家,而中國晶片圈和雲服務領域的巨頭和創企們,已然集體出動。


01.

中國四大雲巨頭官宣支援DeepSeek
亞馬遜、微軟雲擁抱積極

隨著春節假期進入尾聲,國內企業也逐漸進入復工狀態,越來越多的國內企業陸續宣佈對DeepSeek的模型支援。

2月1日大年初四,華為雲正式官宣,經過華為雲和矽基流動團隊連日攻堅,雙方聯合首發並上線了基於華為雲昇騰雲服務的DeepSeek-R1/V3推理服務。


▲矽基流動聯合華為雲上線的DeepSeek-R1/V3推理服務

華為雲提到,得益於自研推理加速引擎加持,雙方支援部署的DeepSeek模型可以獲得持平全球高端GPU部署模型的效果。

2月2日,騰訊雲官宣了對DeepSeek-R1模型的支援,在騰訊雲的HAI平台上,開發者大約花3分鐘就可以接入並呼叫模型。


▲騰訊雲HAI平台

2月3日下午16點58分,阿里雲官宣其PAI Model Gallery支援雲上一鍵部署DeepSeek-V3、DeepSeek-R1。44分鐘後,百度智能雲也宣佈了其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,並直接公佈了價格。


▲PAI Model Gallery

根據官方資訊,從上線到2月18日24點,模型限時免費。

除了四大雲巨頭,國內雲服務廠商無問芯穹更是早在1月28日除夕一大早就宣佈了其Infini-AI異構雲對DeepSeek-R1-Distill 32B模型的支援。


PPIO派歐、雲軸科技則同在2月2日官宣了其對應雲服務平台對於DeepSeek模型的支援。

PPIO派歐算力雲支援了DeepSeek-V3、DeepSeek-R1、蒸餾模型DeepSeek-R1-Distill-Llama-70B,模型價格與官方價格保持一致。


▲PPIO派歐算力雲

雲軸科技ZStack宣佈AI Infra平台ZStack智塔支援企業私有化部署 DeepSeek V3/R1/Janus Pro三種模型,可基於海光、昇騰、輝達、英特爾等國內外CPU/GPU適配。


▲雲軸科技ZStack智塔

海外市場,全球第一大雲巨頭AWS也在1月31日官宣了DeepSeek-R1模型的全面上線。


使用者可以在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart上部署DeepSeek-R1模型;在Amazon Bedrock上自訂匯入DeepSeek-R1-Distill模型並在Amazon EC2 Trn1實例上部署DeepSeek-R1-Distill模型。



▲Amazon Bedrock

微軟的Azure雲服務則是在1月30日宣佈DeepSeek-R1正式上線微軟的Azure AI Foundry以及GitHub。


微軟還貼心地給出了使用教學視訊。


雖然DeepSeek的模型是開放原始碼的,但全球雲服務廠商們對模型的支援仍然十分關鍵。

簡單來說,通過支援DeepSeek模型的雲平台,開發者可以省去買卡、裝驅動、配網路、配儲存、裝環境、裝框架、下載模型等一系列繁瑣步驟,直接在雲服務廠商的平台上去呼叫DeepSeek模型。

客觀來說,像DeepSeek-V3這樣的MoE模型總參數量有671B,部署門檻並不低。

同時開發者還能在平台上以更少甚至零程式碼去實現從訓練到部署再到推理的全過程,AI開發和應用的流程更簡單、更高效。


02.

國內GPU創企紛紛力挺響應
美國晶片三巨頭到齊

除了雲巨頭,國內外晶片廠商也紛紛快速響應,宣佈對於DeepSeek模型的支援。

在海外晶片三巨頭輝達、英特爾、AMD之中,AMD是響應最積極的一個,AMD早在1月25日新年前就已經官宣,他們將DeepSeek-V3模型整合到了自家的Instinct MI300X GPU上。


在X平台發文中,AMD特別感謝了DeepSeek和SGLang團隊的密切配合。

1月31日,AI晶片算力扛把子輝達也正式官宣了其NVIDIA NIM微服務預覽版對於DeepSeek-R1模型的支援,NIM微服務基於HGX H200系統,每秒能夠處理3872個tokens。


開發者們可以呼叫API進行測試和試驗,而這一API後續會作為輝達AI企業軟體平台的一部分進行提供。

同樣在1月31日,英特爾也宣佈DeepSeek能夠在英特爾產品上運行,包括在搭載英特爾處理器的AI PC上離線使用。

英特爾提到,在其最新發佈的酷睿Ultra 200H(Arrow Lake H)平台上,DeepSeek-R1-1.5B模型能夠順利運行,在因式分解演示中,能夠迅速演繹邏輯思維,並最終解決數學難題。

基於DeepSeek-R1模型,一台輕薄筆記型電腦可以完全離線、本地化地幫你翻譯、做會議紀要、進行文件撰寫。

國內晶片廠商這邊,華為的昇騰系列AI晶片自然不必多說,此外還有GPU晶片廠商沐曦也聯合中國開源大模型平台Gitee AI發佈了全套DeepSeek-R1千問蒸餾模型。


▲沐曦模型資源包發佈

根據官方資訊,2月2日首批上線的四個較小規模的模型(1.5B、7B、14B、32B),均部署在國產沐曦曦雲GPU上。

DeepSeek-R1模型+沐曦曦雲GPU+Gitee AI平台,實現了從晶片到平台,從算力到模型,全國產研發、中國製造。官方稱之為“100%國產AI的力量”。

今天一大早,天數智芯和摩爾執行緒也接連宣佈了對DeepSeek模型的支援。

根據天數智芯官方資訊,天數智芯與Gitee AI合作,僅用時一天,就完成了與 DeepSeek-R1模型的適配工作,並且已正式上線多個大模型服務,包括 DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。


▲天數智芯完成DeepSeek-R1模型適配,上線多個大模型服務

天數智芯提到,國內GPU與DeepSeek的適配可實現深度學習框架與國內自主硬體的深度融合,能促進國內AI產業鏈自主可控發展,減少對國外硬體平台的依賴,降低技術風險和成本,有助於國內GPU 拓展市場,吸引更多上下游企業合作,完善產業鏈生態,促進應用加速落地。

國產GPU創企摩爾執行緒這邊,其已經實現對DeepSeek蒸餾模型推理服務的部署,這意味著開發者可以基於摩爾執行緒的GPU進行AI應用開發。


▲摩爾執行緒官宣資訊

此外,摩爾執行緒即將開放自主設計的誇娥(KUAE)GPU智算叢集,支援DeepSeek V3、R1模型及新一代蒸餾模型的分佈式部署。

摩爾執行緒提到,DeepSeek的開源模型與摩爾執行緒的硬體形成閉環,驗證了國產全功能GPU對複雜AI任務的支援能力,為AGI技術普惠化提供了可行路徑。


03.

日活2000萬跑出“中國速度”
DeepSeek倒逼行業跑得更快
競爭焦點來到應用層

從上線第5天的259萬日活使用者數到今天突破2000萬大關,DeepSeek只用了15天,可以說是實實在在的“中國速度”。

根據AI產品榜資料,DeepSeek上線18天日活使用者數達到1500萬,而ChatGPT達到同樣的數字,花了244天,DeepSeek的速度是其13倍之多。


▲DeepSeek與ChatGPT日活使用者增長趨勢對比,來源:AI產品榜

根據雪球平台使用者明月橋投資2024年11月28日引用的Quest Mobile資料,當時豆包的日活使用者數大約為1200萬,而Kimi到日活使用者數約為300萬。


▲來源:雪球

有業內人士稱,DeepSeek如此之快的爆發速度,一方面刺激著各路廠商加速適配模型,另一方面也刺激著算力產業的整合,隨著模型同質化趨勢凸顯、開源模型的加速成長,AI應用生態層的商業價值會越來越高,應用層競爭也將成為後續行業聚焦的重點。

根據Sensor Tower資料,DeepSeek現在的日活使用者已經遠超GoogleGemini、Perplexity、Claude等熱門海外AI應用,其應用日下載量更是斷崖式領先。

DeepSeek的飆漲態勢能持續多久,會是後續的一個關注點。


04.

結語:DeepSeek朋友圈陣容豪華
合作共贏才是未來AI發展必由之路

DeepSeek給整個AI產業帶來的影響是全方位、多層次的,除了自身模型的優秀,DeepSeek對於產業的帶動效應更值得關注,從晶片產業到上層雲服務產業,幾乎所有頭部玩家和創企都在積極湧入DeepSeek“生態圈”。

DeepSeek無疑正在重塑全球AI產業的競爭版圖,中美之間的AI競爭格局也在改變。算力神話被打破、更多玩家有機會在AI新時代更輕鬆地拿到“入場券”,AI應用生態的發展也愈發重要。

諸多國產GPU玩家的加入,讓我們看到在AI的蓬勃發展中,不可能只有一家獨大,必定是百花齊放。

正如DeepSeek創始人梁文鋒近日在接受《暗湧》採訪時提到的,在這波AI浪潮中,DeepSeek的出發點是走到技術前沿,去推動整個生態發展。正如輝達的領先不只是一個公司到努力,也是整個西方技術社區和產業共同努力的結果,中國AI的發展,同樣需要這樣的生態。

梁文鋒說,DeepSeek希望形成一種生態,他們只負責基礎模型和前沿的創新,其它公司在DeepSeek的基礎上建構toB、toC的業務。

中國知名生物學家、北京大學終身講席教授饒毅昨天一大早發佈了題為“鴉片戰爭以來,中國對人類最大的科技震撼:DeepSeek”的文章,一時激起廣泛熱議。

毫無疑問,DeepSeek給海外諸多產業和領域都帶來了巨大震撼,中美之間的AI競爭仍然事態焦灼、充滿不確定性。中國AI或許正走在一個歷史最關鍵時刻。

正如傅聰所說:“我們不需要更多的禁令,中美作為在當今人工智慧領域最領先的兩個國家,不能不合作。只有共同合作發展,才能彌合數字和智能鴻溝,特別是幫助全球南方在人工智慧發展處理程序中平等受益。” (智東西)