阿里達摩院祭出開源架構CPU王炸,直指AI Agent

RISC-V摘掉緊箍咒!坐上高端算力牌桌,首次原生跑通千億大模型。

近期,“龍蝦熱”席捲全球,以OpenClaw為代表的各類智能體加速湧向企業和個人,隨之而來的不僅是各行業領域生產力範式的變革,也帶來了底層晶片算力市場格局的深刻改變。

AI大模型已經全面進入Agentic AI(AI智能體)時代的今天,算力瓶頸不再侷限於GPU等大算力AI加速器,由於多並行和海量資料流轉的需求,CPU的重要性愈發凸顯,重新回到系統調度的舞台C位。

海外GPU巨頭輝達也在最近的GTC大會上發佈了其自研的Vera伺服器CPU,以應對Agentic AI帶來的CPU瓶頸問題。

CPU領域,相比傳統x86架構和Arm架構,RISC-V作為新興的指令集架構,其簡潔靈活易擴展、兼顧通用與AI算力、開源開放等特點幾乎都成為當前AI時代的“剛需”,成為其突出優勢。

在這樣的產業大變局下,就在今天上午,阿里達摩院在2026玄鐵RISC-V生態大會上重磅發佈了新一代旗艦CPU IP——C950,其不僅在SPECint2006基準測試中史無前例地突破了70分大關,更首次實現了RISC-V CPU流暢跑通千億參數頂尖大模型。

玄鐵C950的問世,標誌著RISC-V正式撕下“低端”標籤,在高性能與AI計算兩大核心戰場,與x86、Arm形成了實質性的“三足鼎立”之勢,成為Agentic AI時代晶片算力賽道的最大變數。

01.

衝刺高性能與AI市場

徹底撕掉“低端”標籤

AI智能體給RISC-V按下加速鍵

從第一個5年的開源學術探索項目,到第二個5年國際標準和商用IP開始萌芽,再到如今第三個五年,今天基於RISC-V架構的晶片正迎來井噴式湧現。從架構提出到出貨100億顆處理器,RISC-V只用了12年,而x86架構用了30多年。

走過第15個年頭的RISC-V,正在AI時代技術創新和市場需求的雙重驅動下,迸發出更旺盛生命力。

目前,RISC-V晶片的商業化版圖正在快速擴張。在物聯網與邊緣計算市場,輝達、英飛凌等海外巨頭都在大量出貨基於RISC-V架構的MCU(微控製器)。

輝達每年大約消耗10億個RISC-V核心,內建於其GPU、CPU、SoC 和其他產品中,其在2025年曾透露正在推進CUDA相容RISC-V架構;英飛凌則宣佈今後所有MCU都要基於RISC-V架構開發。

在RISC-V高性能領域,資本動作也從未停止,比如高通此前就收購了RISC-V初創企業Ventana,試圖在高端市場尋找切入點。Meta則基於RISC-V架構自研AI晶片。

行業資料的預測進一步印證了這一爆發趨勢。根據半導體權威分析機構SHD Group的最新預測資料,到2031年,RISC-V裝置數量將超過360億顆,年複合增長率高達31.7%;相關市場規模將超3000億美元。部分行業智庫甚至預測,到2030年,RISC-V有望佔據全球處理器市場25%的份額。

儘管RISC-V在MCU、嵌入式、家電、儲存、多媒體、汽車、通訊、安全、終端等眾多領域呈現星火燎原之勢,但其長期以來始終無法擺脫“低端”晶片的固化標籤。

RISC-V要想真正躋身主流晶片架構的牌桌,僅僅在邊緣側“打游擊”是遠遠不夠的。要想與x86和Arm三足鼎立,RISC-V必須在伺服器(高性能)和AI計算兩大核心戰場上證明自己。

這不僅是技術層面的突破,也是晶片生態話語權的爭奪。

02.

C950打破RISC-V性能天花板

7年深耕建構國內頂級RISC-V生態

這次大會上阿里達摩院亮出的新一代旗艦CPU IP——C950,正是RISC-V在突圍高性能與AI計算、打破固有印象的一次“里程碑”式突破。

在高性能方面,根據官方資料,在工業界公認的SPECint2006基準測試中,C950直接突破70分大關,其單核性能超過了22/GHz,最高主頻達3.2GHz,成為當之無愧的全球最強RISC-V CPU,逼近AMD Zen5、Intel GNR、Arm V2等行業高端產品。

為了驗證其在真實環境下的可用性,達摩院進行了嚴苛的聯合測試。結果顯示,面對MySQL(資料庫)、Redis(記憶體快取)、Nginx(Web伺服器)、OpenSSL(安全協議)等伺服器經典工作負載,經軟硬體協同最佳化,C950的性能達到行業第一梯隊水平,雲網路、雲端儲存性能較部分主流產品提升在30%以上。

眾所周知,AI Agent並非單純AI推理任務,而是典型的CPU密集型任務,大量並行指令需要序列執行,海量資料高頻流轉。C950通用計算性能的大幅提升,會顯著提升整體的系統效率。

在軟體生態相容性方面,C950支援了國際最新規範檔案RVA23.1的全部標配和可選擴展。這一Profile標準的落地至關重要,它關係到整體系統的可靠性、安全性和資源利用率,可以極大便利RISC-V進入伺服器、AI、汽車等高端平台,並能無縫適配Linux、Android等主流作業系統環境。

據瞭解,此次發佈的C950可以用於雲端運算、生成式AI、高端機器人、邊緣計算等諸多領域。

實際上,在向高性能迭代的路上,達摩院玄鐵一直是RISC-V陣營中毋庸置疑的領跑者,回顧其產品演進,幾乎每一次迭代都在不斷打破行業的“天花板”,C950的推出不是曇花一現,而是持久深耕之下技術創新力的一次階段性集中體現。

阿里巴巴從2018年起開始佈局RISC-V,是國內最早涉足RISC-V的技術團隊之一。早在2019年7月,阿里就發佈了當時業界性能最強的RISC-V CPU IP——玄鐵C910,其首次突破運行頻率2GHz的門檻,Specint2k6評測7/GHz。

這一成績在當時給了行業極強的信心:RISC-V的架構設計在原理上沒有性能天花板。

隨後C910的生態落地更進一步證明了其可用性。2024年,達摩院聯合中科院軟體所研發出全球首台穩定運行的RISC-V筆記型電腦、歐洲雲服務商Scaleway發佈了全球首個RISC-V雲實例,它們的計算底座都是C910。

可以說,C910吹響了RISC-V衝向高性能的衝鋒號。

當然,這只是一個開始,伺服器晶片才是真正考驗CPU通用算力極限的終極戰場。2025年發佈的玄鐵C930,通用算力達到SPECint2006基準測試15/GHz,首次邁過了伺服器晶片的入門門檻。

RISC-V實現行業里程碑式突破的每一個關鍵節點,我們都能看到玄鐵的身影。而每一代玄鐵CPU的推出,都會帶動產業上下游企業參與進來,進一步加速RISC-V向高性能領域迭代的步伐。

7年多來,阿里陸續推出C、E、R系列的16款RISC-V CPU,分別對應高性能、高能效、高可靠場景,這些CPU已經廣泛應用於伺服器、機器人、新能源汽車、工業控制、AI智能終端、儲存控製器等領域。

根據官方資料,目前玄鐵CPU已應用於200多款量產晶片和近千款終端產品,客觀來看,玄鐵CPU已經形成了目前國內規模最大、最成熟的RISC-V產業生態。

03.

業內首次跑通頂級千億大模型

劍指AI Agent時代新型算力中樞

正如前文所說,高性能和AI計算是當前RISC-V晶片聚焦突破的核心戰場。在AI產業全面進入Agentic AI時代的今天,在新的計算範式下,CPU的重要性愈發突出,而玄鐵C950則是一款真正為AI Agent而生的新型CPU。

在智能體當道的今天,使用電腦和筆記本的可能不再是單一個人,而是無數個自主運行的智能體,系統的Token呼叫量呈現出指數級的暴增。

如何高效地載入和流轉KV-Cache、如何降低首Token延遲,成為了系統真正的瓶頸。在這個過程中,CPU不再是GPU的“配角”,而是作為系統任務調度和龐巨量資料流轉的“中樞”。

針對這一行業趨勢痛點,達摩院玄鐵利用RISC-V架構天然的開放性和靈活性,賦予了CPU原生AI能力。

此次達摩院發佈了兩款RISC-V原生AI計算引擎——4K超寬Vector引擎和Matrix引擎,與玄鐵CPU統一編址,消除資料複製瓶頸,從而將通用高性能算力與AI算力進行原生融合。

其中,Matrix引擎專門為大模型張量計算加速,單核算力可以達到8TFLOPS。在實測中,搭載了玄鐵全自研Matrix(矩陣)加速引擎的C950,其AI推理表現稱得上驚豔,平均執行效率超過90%,典型演算法性能較行業提升2-3倍,其順利運行了當前業界頂級的Qwen3開源模型,以及對算力要求極高的DeepSeek V3“滿血版”。

具體來看,運行Qwen3的輸出速度達34 Tokens/s,首Token延遲僅為3.4s;而運行DeepSeek V3的輸出速度達18 Tokens/s,首Token延遲1.7s。

這是RISC-V CPU首次原生支援千億參數規模的大模型。這一突破意味著,在處理複雜的AI Agent推理與調度任務時,CPU可以極大緩解GPU的壓力,承擔更多AI計算任務,成為AI Agent時代AI計算新架構中的核心組成部分。

在加速落地,讓行業客戶能充分發揮RISC-V特性優勢方面,此次阿里達摩院發佈的Flex平台無疑是RISC-V可擴展性的最佳證明,其可以很好的解決真實產業中的高度定製化需求。

去年,達摩院玄鐵共支援了35家客戶進行了多達38項的CPU底層改動,其中超過一半的定製需求集中在AI加速、儲存最佳化、可靠性增強等特定垂直場景。

簡單來說,Flex平台將造芯的主導權依然交還給產業,這一平台包括處理器建模、開發環境和軟體工具鏈等完整元件,客戶不僅能選擇“標配”的高性能玄鐵CPU作為基座,還可基於Flex進行深度的自訂修改,從而打造出最符合自身垂直場景需求的創新CPU。

值得一提的是,像Vector(向量)加速、Matrix(矩陣)加速等高端AI能力,客戶也可以自行通過Flex平台來實現與整合,這無疑會顯著降低高端定製晶片的設計門檻。

整體來看,RISC-V沒有歷史包袱,不需要相容過往幾十年的軟體棧,可以專注於實現最高效的AI Agent性能;RISC-V簡潔、靈活,易於擴展的特性則可以讓晶片設計企業根據AI軟體棧變化快速迭代,及時響應最新的算力需求。

此外,AI Agent任務同時需要高性能的通用算力與AI算力,而RISC-V開源社區正在編製麵向矩陣計算(Matrix)的擴展指令,也就是把AI能力寫入RISC-V的“基因”,有望令RISC-V成為高性能通用計算與AI計算融合的最佳載體。

最後,RISC-V開源開放的特點也進一步有助於破除技術壁壘,便於國家和企業層面將技術主動權握在自己手中。

04.

中國開源力量“會師”RISC-V

主導全球標準話語權,產學研邁入深水區

晶片行業多年發展證明:晶片架構的競爭從來不是單打獨鬥,而是生態陣營的較量。

由於美國對高端半導體技術的持續限制,中國產業界正將RISC-V視為實現“矽主權”(Silicon Sovereignty)和底層技術自主可控的重要賽道。

當前,中國開源力量正在RISC-V高性能生態中完成一次史無前例的“大會師”。

從宏觀背景來看,RISC-V國際基金會(RISC-V International)為了保持技術中立,已將總部遷至瑞士。而在這個主導RISC-V技術走向的最高組織中,中國企業展現出了壓倒性的存在感。

據最新公開資訊,在RISC-V國際基金會的19家“Premier(高級)”會員中,中國企業佔據了8家,遠超其他單一國家。

在具體落地層面,阿里達摩院玄鐵正串聯起中國本土的產業生態。

一方面,玄鐵與北京開源晶片研究院、中國科學院軟體研究所達成合作,共同研發下一代開源RISC-V高性能CPU香山及軟體生態,形成科研層面的“共振”。

軟體生態層面,達摩院玄鐵積極參與OpenRuyi社區,目前以25.27%的Patch貢獻率穩居排名第一。

在產業協同層面,達摩院玄鐵與中興通訊在RV國際基金會和開放原始碼軟體社區中強強聯手,共同推進伺服器領域開源元件的深度最佳化,使相關的儲存和編解碼性能得到了顯著提升。

2023年,達摩院牽頭髮起的“無劍聯盟”,圍繞玄鐵CPU建構開放、協同、普惠的RISC-V晶片商業服務體系,給企業提供從晶片設計到應用的全鏈路能力,降低開發成本與風險,加速RISC-V產業化處理程序。

在國際標準指定方面,達摩院玄鐵正在積極投入RISC-V國際基金會的核心工作,不僅主導了伺服器級晶片標準的制定並正式發佈,還深度參與了BRS、RPMI等伺服器關鍵規範的起草。

特別是在AI領域,玄鐵正在主導Matrix擴展(AME)社區的討論及標準制定,這意味著未來全球的RISC-V晶片在演進AI矩陣計算能力時,可能遵循由中國主導制定的技術底層標準。

05.

結語:“頂峰相見”

RISC-V開源生態劍指AI智能體時代

達摩院玄鐵C950的發佈,絕不是一次測試跑分的“刷榜”,而是真正從通用計算性能和AI計算性能兩個關鍵方面實現突破,徹底打破了RISC-V“做不了高性能計算”的刻板印象。

在產業層面,基於Flex平台的開放性,橫向聯合中國各領域RISC-V開源力量,達摩院玄鐵正在牽頭建構一套能夠與傳統封閉生態體系對抗的新業態。

在這場“AI時代計算架構之戰”中,以玄鐵為代表的RISC-V陣營,已經拿到了AI Agent時代的高端算力殿堂“入場券”。 (智東西)