#CPU
英特爾宣佈:與Google擴大CPU、IPU合作
近來翻轉多年頹勢的美國晶片公司英特爾周四宣佈與AI巨頭Google擴大CPU和IPU領域的合作。(來源:公司官網)公告寫道,Google雲將繼續部署英特爾至強(Xeon)處理器,同時英特爾和Google正在擴大雙方基於定製ASIC的IPU(基礎設施處理單元)方面的聯合開發。對於資本市場有些陌生的IPU,英特爾介紹稱,這類可程式設計加速器可將網路、儲存和安全等功能從CPU中卸下,提高系統整體效率,並在超大規模AI計算環境中實現更可預測的性能表現。英特爾首席執行長陳立武對最新合作評論稱,擴展AI不僅需要加速器,還需要更加平衡的系統。CPU與IPU是實現現代AI工作負載所需性能、效率與靈活性的核心。這番表態也與近幾個月資本市場關注CPU的邏輯相近。輝達AI基礎設施負責人Dion Harris上個月曾表示,隨著AI智能體將計算需求進一步擴展到CPU領域,後者正在“逐漸成為新的瓶頸”。雖然最新聲明沒有列明具體的財務條款,但對於英特爾的代工業務來說,獲得主要大客戶的未來承諾依然構成利多。公司已經在亞利桑那工廠使用其最先進的18A工藝生產至強處理器。儘管英特爾在代工業務上投入巨大,但亞利桑那工廠的最大客戶目前仍是英特爾自己。本周早些時候,公司曾在社交媒體發文稱,加入世界首富馬斯克的半導體製造項目Terafab,為這個計畫“年產1太瓦等級算力晶片”的項目提供設計、製造和封裝超高性能晶片方面的能力。另有消息稱,英特爾也在與Google、亞馬遜洽談,為他們的定製晶片提供先進封裝服務。英特爾的首席財務官戴維·津斯納近期也曾在摩根士丹利TMT大會上提及,公司正接近達成一些每年以十億美元計算的封裝收入交易。英特爾的先進封裝主要圍繞兩條核心路線展開。一條是EMIB技術,屬於2.5D封裝方案,在晶片封裝內部嵌入一塊小型“矽橋”,用來把多個chiplet(小晶片模組)高速連接在一起。另一條是3D堆疊封裝方案Foveros。下一代EMIB-T技術預期將會在年內匯入生產,主要變化在矽橋內部增加了矽通孔(TSV)結構,從而提升供電能力和訊號穩定性。在層層疊疊的利多下,英特爾股價周四開盤後沖上60美元關口,這也是該公司自2021年4月以來首次達到這一水平。從去年8月算起,公司股價已經翻了3倍。(英特爾周線圖,來源:TradingView)去年8月,英特爾將10%的股份出售給美國政府。次月,輝達宣佈將斥資50億美元收購英特爾股份。這些投資到今天已經獲得翻倍收益。 (科創日報)
英特爾怎麼也沒想到,全球CPU第一的位置,被中國龍芯搶走了
上周,我師傅給我發了一條消息:"你知道嗎?中國現在有CPU了,叫龍芯,性能可以對標英特爾了。"我的第一反應是:真的假的?說實話,我對CPU這東西,一直有一個根深蒂固的認知:英特爾就是CPU的天花板。這麼多年,不管用什麼電腦,處理器不是Intel就是AMD,就沒有第三個選項。但我師傅發來的這條消息,讓我查了一下。一查,不得了。龍芯3C6000:16核對標至強,64核超過至強83802025年6月,龍芯中科在北京發佈了最新的伺服器CPU——龍芯3C6000系列。這是龍芯第一款真正能跟英特爾正面掰手腕的產品。先說最硬的資料:龍芯3C6000,單矽片16核32線程。16核是什麼概念?普通桌上型電腦一般4到8核,16核已經是高性能伺服器的等級了。然後龍芯做了一件很有意思的事:他們把這款CPU拿去,跟英特爾的產品做了實測對比。結果:3C6000/S(16核32線程)單核性能,對標的是英特爾至強Silver 4314。3C6000/D(32核64線程)多核性能,對標的是英特爾至強Gold 6338。64核的3C6000/Q,性能超過了英特爾至強 Platinum 8380——而8380是英特爾在中國市場賣得最貴的伺服器CPU之一。換句話說:龍芯伺服器CPU,在多個核心配置下,已經追上了英特爾在2021年發佈的旗艦產品。桌面CPU:8核對標英特爾第12/13代酷睿i7伺服器之外,還有桌面端。2026年,龍芯還有一款正在測試的桌面CPU,叫3B6600。8核心,單核性能相比上一代提升30%,實測性能可以媲美英特爾第12代或第13代酷睿i5/i7。i5和i7是什麼水平?就是你買遊戲本或者高性能辦公電腦時,商家重點宣傳的那個處理器。英特爾在中國消費者心裡的地位,就是這麼高。而現在,龍芯說:我也可以了。自主指令集:不依賴任何國外授權光性能追上還不夠,更重要的是,龍芯走了一條最難的路:完全自主。目前全球CPU市場,主要有兩個架構:英特爾的X86,以及ARM的ARM64。這兩個架構,都需要國外公司授權才能用。龍芯從2001年開始研發,走的是第三條路:完全自主設計的LoongArch指令集架構。什麼意思?就是龍芯的CPU,從指令集到架構到設計,全是中國團隊自己做的,不依賴任何國外技術授權。這意味著,龍芯的每一行程式碼,每一個電晶體的佈局,都是中國人自己的。這也是為什麼胡偉武(龍芯首席科學家)說:"我們的目標是建構第三套資訊技術體系,與X86、ARM三足鼎立。"三足鼎立:中國CPU的這二十年說起來容易,做起來難。龍芯成立於2001年,到今天,已經走過了24年。這二十四年裡,龍芯走了很長的路。最初十年,龍芯的性能跟主流產品差距極大,只能用在一些特定領域,比如工控機、嵌入式裝置。2015年前後,龍芯開始進入政府機關和國企的採購名單,慢慢有了穩定的收入來源。2020年,龍芯推出3A5000,第一次在桌面CPU領域追上了主流產品的性能。2025年,3C6000發佈,第一次在伺服器CPU領域,正面對標英特爾旗艦。2026年,3B6600即將量產,桌面端也要站上主流擂台。這二十四年,是一段很長的時間。長到很多人根本不知道中國還有自研CPU這件事。長到很多人一聽說"中國CPU",第一反應是"真的假的"。長到英特爾可能真的從來沒把龍芯當成對手。但它就是追上來了。這跟我們普通人有什麼關係很多人覺得,CPU再厲害,跟我有什麼關係?我又不寫程式碼,又不做伺服器。其實不是。你用的每一台電腦,每一個手機,裡面都有CPU。英特爾、高通、蘋果、華為——這些名字聽起來很遠,但它們決定了你打開一個網頁要多久,決定了你打遊戲卡不卡,決定了你手機能用幾年不卡。中國有自研CPU,意味著什麼?意味著有一天,如果國外的CPU突然不賣給我們了,中國人有自己的替代品。這不是假設。2019年,美國把華為列入實體清單,禁止華為使用美國技術和晶片。一夜之間,華為的手機業務遭到重創。那一年,華為第一次讓我們意識到:核心技術不在自己手裡,就是會被卡脖子。CPU就是最核心的那個技術。龍芯現在追上了英特爾,意味著中國人手裡多了一張底牌。有一天,當你買電腦的時候,也許會多一個選擇:一個裝著中國芯的電腦,性能不差,價格更便宜,系統也是自己的。這一天,可能不會很快到來。但龍芯在讓它變成可能。寫在最後我師傅發消息給我的時候,有一句話讓我印象很深。他說:"以前總覺得CPU這東西,只有美國人才做得出來。現在看看,好像也不一定。"我想了想,回了他一句:"不是不一定,是中國真的做出來了。"英特爾統治全球CPU市場幾十年,靠的是技術積累和產品迭代。龍芯用了二十四年,從零開始,一步一步追了上來。不是靠口號,不是靠PPT,是一個個電晶體,一個個核心,一道道測試,磨出來的。這二十四年裡,龍芯被很多人嘲笑過——嘲笑它性能差,嘲笑它沒有生態,嘲笑它不可能成功。但嘲笑沒有阻擋它。英特爾大概真的沒想到。全球CPU第一的位置,可能真的要開始動一動了。關注我,我會繼續追蹤這類變化的真實資料。我是鴒玥,我們下次再聊。 (硅基智翔)
繞開禁令!Arm CEO:AGI CPU可對華銷售!
4月2日消息,據《中國日報》近日報導,總部位於英國的Arm公司首席執行長Rene Haas在接受線上採訪時表示,其最新發佈的資料中心中央處理器Arm AGI CPU將可在中國市場銷售,並且該公司也正打算這樣做。Rene Haas進一步指出:“我們今天沒有任何可以公開談論的客戶。但我們預計這種產品在中國的需求與世界其他地區一樣強勁。”3月24日,Arm公司首次突破了其原有的產品矩陣和商業務模式,將產品矩陣延伸至量產晶片產品領域,正式發佈了一款由 Arm 自主設計、面向人工智慧 (AI) 資料中心的CPU——AGI CPU,旨在滿足日益增長的代理式 AI (agentic AI) 工作負載需求,網際網路巨頭Meta已經確認將是AGI CPU的首批客戶。據介紹,AGI CPU基於台積電3nm製程,由兩個小矽片組合而成,整合了 136 個 Arm最新的Neoverse V3 核心,每個核心配備 2 MB 二級快取,主頻3.2 GHz,最高頻率3.7 GHz,每線程獨立核心,可在持續負載下提供確定性性能,避免降頻與線程閒置。在記憶體和介面支援方面,AGI CPU支援 12 通道 DDR5 記憶體,最高可達 8800 MT/s,可提供超過 800 GB/s 的總記憶體頻寬,或每核心 6GB/s的頻寬,延遲低於100ns。I/O包含96條PCIe Gen6通道,並原生支援CXL 3.0以實現記憶體擴展和池化。整個晶片的TDP在300瓦左右。Arm表示,基於AGI CPU每個伺服器機架的性能超過x86平台的兩倍,並且每1吉瓦基於Arm AGI CPU的AI 資料中心算力的資本支出 (CAPEX) 相比x86 CPU平台可節省高達 100 億美元。需要指出的是,Arm公司曾在2023年8月披露的IPO招股書中表示,其Neoverse 系列處理器當中的高端處理器IP對華出口需要美國和英國的許可,但這種許可證可能很難獲得。Arm指出,其“Neoverse 系列處理器中性能最高的處理器IP達到或超過了美國和英國出口管制制度下的性能閾值,從而在出口和交付給中國客戶之前觸發了出口許可證要求。” “鑑於對運往中國的 HPC 技術的國家安全擔憂更高,而且政府的響應時間表尚未確定,獲得此類出口許可證可能具有挑戰性且不可預測。”當時Arm Neoverse 系列處理器中性能最高的處理器IP則是Neoverse  N2/V2,顯然Arm隨後推出的Neoverse  N3/V3 IP也是會受到英國的出口管制,使得其無法對華出口。但是,Arm最新推出的ArmAGI CPU雖然也是基於高端的Neoverse  V3 IP,但是它是一個完整的CPU晶片,因此該晶片對華出口並不會違反針對Arm Neoverse IP的出口禁令。這或許也是為什麼Arm CEO Rene Haas說,AGI CPU將可在中國市場銷售的原因。 (芯智訊)
既當裁判又當選手,Arm推出136核CPU給輝達氣瘋了
既當裁判,又當選手的現實上演了。就在前兩天,一直穩坐幕後的架構大佬 ARM 終於拋出了一枚震撼全球的重磅炸彈:他們不再只賣設計圖紙了,而是歷史上首次親自下場造晶片,推出了首款專為資料中心設計的 Arm AGI CPU。Arm 大夥兒應該不陌生了,作為掌控著全球 90% 以上移動處理器 CPU 的架構基座,一直靠著賣架構和指令集授權賺得不亦樂乎。那為何要從「包租公」轉化為「實業家」呢?答案很簡單,眼紅。根據 Arm 2026 財年(Q4 為官方指導值)的收入來看,全年營收 49 億美元(約合人民幣 338 億元)。看起來不少了是吧?來看看隔壁 NVIDIA,其 2026 財年的營收已經衝到了恐怖的 2159.38 億美元(約合 1.56 兆元人民幣),毛利率更是飆到75.5%,這已經跟印錢沒啥區別了。這意味著辛辛苦苦設計了一年,還不到人的 2%。更扎心的是,NVIDIA 賣得火熱的 Grace CPU 裡面用的還是 ARM 的技術。這讓 Arm 實在是有點想不通,不過在 AI 大模型競賽時期,主要依靠 GPU 平行算力為主導的。在這個行業,NVIDIA 可以說是隻手遮天,並且隔壁 AMD 和 intel 也不是吃素的,Arm 壓根擠不進去。但火遍全網的龍蝦(OpenClaw)AI 智能體讓 AI 行業的風向開始發生改變了。大夥兒逐漸意識到,縱使大模型再強,也只能動動嘴皮子,它沒有綜合性的執行能力,所以 AI 智能體就這麼火了。這個大家也熟悉,如果把大模型當做大腦,那 AI 智能體(Agentic AI)就是腦幹和肢體。讓 AI 能開始擁有自主生產力了。所以這種變化也就對硬體要求發生了改變,以前 AI 只需要 GPU 的「暴力計算」,但現在的「龍蝦們」需要頻繁地做邏輯判斷、任務編排、多系統呼叫——這些都是 CPU 的強項。看到這,Arm 表示,機會來了。正式推出了咱們開頭的提到的 AGI CPU。簡單過一下參數。AGI CPU 採用台積電 3nm 工藝製造,採用 Neoverse V3 核心,單顆晶片可以整合最多 136 核。單顆核心之間記憶體頻寬達 6 GB/s,延遲低於 100ns,最高 6 TB 的單芯記憶體容量,支援 DDR5-8800 規格。具備 96 條 PCIe Gen 6 通道,支援 CXL 3.0 和 AMBA CHI 互連。TDP 為 300W。看不懂沒關係,咱們做個簡易表把隔壁 intel、AMD 都拉過來簡單對比一下核心數和功耗。雖然性價比和核心性能都不是最突出的,但它有兩個優點,一是專門針對SVE2單元,在處理 Agentic AI(代理式 AI) 常見的決策樹、輕量化推理和多工編排時,其每瓦特性能表現極佳。第二點就是 TDP,雖然 300W 對於 Arm 來說是非常高了,但對比隔壁的 intel 和 AMD 動輒 500-600W,還是要涼快不少。稍微瞭解的同學就知道,散熱和電力對於資料中心來說,是佔營運支出的大頭,一般要佔到 60% 以上(含電力運轉)。所以 Arm 官方也囂張地喊出其方案每機架的性能比傳統 x86 高出 2 倍以上,因為能塞下更多的處理器。這意味著對於像 Meta 這樣規模的巨頭,建設一個吉瓦級的 AI 資料中心,改用 ARM 方案能省下整整 100 億美元(約合人民幣 723 億元)。當然了,除了 x86,最受傷的莫過於是基於 Arm 的 Neoverse V3 開發的「友商們」了,這其中就有 NVIDIA。拿 NVIDIA 剛發佈深度定製的 Vera CPU(88核心)來說,核心規模上就要壓上一頭,雖然不敵 NVLink 以 1.8 TB/s 的速度和 GPU 交換資料,但 NVIDIA這個屬於「閉源」,意味著你買了它的 CPU,就得買它的 GPU,消費選擇給限制了。而Arm支援CXL 3.0 和通用 PCIe Gen 6,這意味著它能和 Meta 的 MTIA 加速器、OpenAI 的自研晶片相配合。如果單看規模的話,亞馬遜的 Graviton5 擁有 192 個 Neoverse V3 核心,似乎更大,但人壓根不賣,你只能在它的雲伺服器裡租著用。同樣用著同款核心微軟的 Azure Cobalt 200,不過是定製款,是專門為 Azure 雲服務最佳化。所以,大夥兒能看出來,之前的 Neoverse V3 被雲巨頭拿過去後都是放在自己的「後花園」用,現在 Arm 直接把圍牆拆了,大家都可以買。算是給自家盟友來了一刀。看到這可能有同學要說了,那跟咱們普通人有什麼關係?當然也有。首先是對傳統 x86 CPU 的衝擊,在市場一定的前提下,AGI CPU 勢必也會吃掉一部分傳統通用計算 CPU 市場,從而倒逼 intel、AMD 進行快速的技術迭代和工藝升級,而這些技術也會輻射到消費級 CPU 領域,例如 AMD 的 3D V-Cache 技術。其次就是「養龍蝦」會變得更便宜、更聰明。當雲巨頭們或者更多的入局者大規模部署這種 AGI CPU 後,我們使用的模型、國內的各類智能體工具,響應速度會成倍提升。那些複雜的「個人私人秘書」功能將從雲端下放到更廉價的伺服器甚至你的個人裝置上。不過這一切都建立在AI持續爆火並有大廠不斷投入和內卷的基礎上。至於什麼時候能實現「養蝦自由」,還很難說。咱們就拭目以待吧。 (電手)
阿里突然甩出“王炸”!5nm晶片性能炸裂,外媒:這仗沒法打了
就在3月24日,半導體圈子裡炸開了鍋。阿里達摩院默默放了個大招——全球性能最強的RISC-V CPU,來了。名字叫玄鐵C950。這次不是PPT發佈,不是概念晶片,是真真切切能跑起來的硬傢伙。咱們先看幾個硬核參數。5nm製程,主頻3.2GHz,64位多核架構。這些數字放在行業裡是什麼水平?簡單說,就是直接對標全球主流廠商最頂級的量產CPU。但真正讓業內震驚的,是它的跑分資料。SPECint2006基準測試突破70分,這個成績刷新了全球RISC-V的性能紀錄。要知道,RISC-V這個架構之前一直被詬病性能不夠看,現在阿里直接用成績單打了所有人的臉。更狠的是,它在SPECint2006上每GHz能跑22分以上,SPECint2017也能跑到2.6/GHz。這意味著什麼?意味著這顆中國芯,在性能上已經可以和世界頂流的ARM架構掰手腕了。不過光跑分高沒用,關鍵看能不能幹活。玄鐵C950這次最讓人意外的地方,是它對大模型的支援。阿里這次在晶片裡塞了兩個加速器:一個是4K超寬向量加速引擎,另一個是張量計算引擎。後者最高能提供8TFLOPS的單核算力,這算力放在AI晶片裡都是個不錯的資料。重點來了——這顆晶片原生支援Qwen3和DeepSeek V3這類千億參數的大模型。FP8、FP4、MXFP8這些新型低精度資料類型,它全都支援。這就意味著,以後跑大模型可能不用專門買昂貴的GPU了,一顆玄鐵C950就能幹這個活。阿里還公佈了實際跑模型的數字。單晶片跑Qwen3-30B、Qwen3-235B,甚至671B的DeepSeek V3,都有不錯的性能表現。放在雲端運算場景裡,它的處理能力比主流產品提升了30%以上。這就有意思了。以前大家覺得RISC-V就是做做物聯網、搞搞嵌入式,現在阿里直接把它推到雲端運算、生成式AI、高端機器人的賽道上了。除了C950這個大殺器,阿里還順手發了一顆C925。這顆走的是能效路線,SPECint2006每GHz能跑12分以上,能效比C930提升了11%,面積卻小了34%。做智能終端、工業控制的廠商,估計要開始琢磨這顆晶片了。但最值得琢磨的,其實是阿里在生態上的動作。達摩院首席科學家孟建熠宣佈了一個消息:玄鐵要和香山合作了。香山是啥?是中國開放原始碼的RISC-V高性能處理器項目,相當於RISC-V界的Linux。這次玄鐵參與下一代香山“昆明湖V3”的聯合研發,在SMT多線程技術、片上互聯、通推一體架構這些硬核技術上深度合作。說白了,阿里這是要兩條腿走路。自己造頂級晶片,同時拉著整個生態一起往前走。這不光是造一顆晶片的問題,而是要把RISC-V的整個盤子做大。回頭看看阿里這次發佈的節奏,其實能品出點味道來。從玄鐵C930到現在的C950,不到一年時間,性能從跟跑到領跑。RISC-V這個曾經被看作“玩具”的架構,正在以肉眼可見的速度變成“真傢伙”。現在的問題是,性能已經追上來了,生態能不能跟上?軟體相容性怎麼樣?開發工具鏈好不好用?這些才是決定RISC-V能不能真正取代ARM的關鍵。阿里現在做的,就是把性能和生態這兩件事同時往前推。C950證明了硬體實力沒問題,和香山的合作則是在解決軟體生態的短板。回頭看看外媒的反應,有句話挺扎心:“這仗沒法打了”。雖然有點誇張,但確實說明了一個趨勢——在晶片這個賽道,中國企業正在從追趕者變成定義者。玄鐵C950的出現,可能是個轉折點。它證明了RISC-V架構不再是低功耗、低性能的代名詞,而是有實力站在世界舞台中央的選手。 (世界半導體技術論壇)
毛利率98%的ARM,想換個姿勢“躺著賺錢”
一切跟算力有關的產品,產能都遭遇到了AI需求的擠佔,過去是儲存,現在輪到CPU。目前,英特爾、AMD都在推動產品漲價,漲幅在10%-15%之間。“聽說CPU的提貨周期已經延長到8個月了。”一位長期跟蹤儲存產業的研究員援引知情人士的消息說。在這種背景下,ARM決定入局CPU晶片自研,注意不是GPU自研。“我要明確表態——我們現在進入了一個對ARM而言全新的業務領域,我們正在供應CPU。”當地時間3月24日,ARM CEO雷內·哈斯(Rene Haas)在一場官宣的發佈會上說。ARM首顆AGI CPU晶片。圖片由AI生成根據ARM提供的資料,其首顆自研AGI CPU搭載136個ARM Neoverse V3核心,每核心提供6GB/s記憶體頻寬、低於100納秒的訪問延遲,熱設計功耗為300瓦;單個風冷機櫃最高可容納60顆CPU,即8160個核心,若採用液冷方案,總核心數可以突破45000個。ARM AGI CPU採用台積電3奈米工藝製造,由兩塊芯粒封裝而成,作為一顆完整晶片協同運行。ARM強調,相較於同類x86晶片,每機櫃性能功耗比提升超過兩倍,每吉瓦AI資料中心容量可為客戶節省高達100億美元的資本支出。目前晶片已完成測試,計畫於2026年下半年進入量產。01 98%毛利率不香了?ARM的“IP授權”模式鏈路清晰,設計晶片架構,將智慧財產權授權給蘋果、輝達、高通等公司,然後坐收授權費和版稅。不要工廠,不需要生產線,毛利率高達98%,屬於全行業最高水平之一。有分析師將這種模式稱為“躺著印錢”——每一顆搭載ARM架構的晶片出貨,這家公司都能分到一筆錢,全球迄今出貨量超過3250億顆。那麼,哈斯為什麼要放棄這個近乎完美的模式?財報裡已有訊號。ARM最新一個財季的營收達到創紀錄的12.4億美元,同比上漲26%,連續四個季度單季破10億美元,其中版稅收入(晶片出貨分成)增長27%,但由於5.05億美元的許可收入(IP授權)低於分析師預期的5.19億美元,市場立即作出負反饋——其股價盤後下跌超過5%。晶片出貨分成相關的版稅收入屬於滯後指標,許可則是領先指標,反映客戶願意為下一代技術預付多大的賭注。許可收入的波動,讓投資者很難為ARM的AI故事建立穩定的估值模型。ARM必須回答一個問題:增量訂單在那裡?所以,被動等待IP授權許可,不如直接下場自研出售晶片,將收入結構從“等單上門”轉變為持續的硬體銷售流水,創造可持續、規模化、可預測的硬體收入。當然,代價則是98%這種超高毛利率被侵蝕。可以這樣理解,ARM的轉向是在IP授權模式觸及天花板之前,主動規劃第二增長曲線。02 ARM伺服器CPU“站起來了”ARM架構的伺服器CPU,靠譜嗎?輝達已給答案。2021年GTC,輝達就推出了ARM架構的Grace CPU,並搭配Blackwell GPU在大量資料中心部署,新一代的Vera CPU也已經量產。此次ARM的發佈會上,黃仁勳親自發視訊祝賀,稱雙方合作近二十年,ARM的適應性使輝達得以將其整合至“全平台、全AI階段”。之所以請黃仁勳來站台背書,ARM也就是想強調其解決方案已經被市場上最成功的AI晶片公司用實際銷售額反覆驗證。現在自己下場,某種程度上只是“去掉了輝達這個中間商”,將原本版稅分潤的收益,以硬體利潤的形式收入囊中,在自己的商業模式中完成了閉環。事實上不僅是輝達,全球主流雲廠幾乎都在轉向ARM架構伺服器CPU:亞馬遜AWS的Graviton 5搭載192個ARM核心,2025年AWS新增算力中大多數由其驅動;微軟Azure的Cobalt 200擁有132個核心。這些公司已在ARM架構上投入了數十億美元的研發資源,建構了龐大的軟體生態。ARM對伺服器CPU市場的影響,剛剛正在從專利,轉向生態。03 GPU為CPU“帶貨”站在市場的邏輯,GPU的暴增和AI晶片自研的陣營越來越大,不僅加大了對HBM記憶體的需求,也帶來了CPU需求的增長。騰訊科技此前給了一個資料——2026年台積電的CoWoS晶圓產能是1150000片。按雙Die晶片總面積1500mm²、80%良率估算,全年可產出約4324萬顆GPU晶片。若按每8顆GPU搭配2顆CPU的比例,4324萬顆GPU共需要1081萬顆CPU。注意,這1000多萬顆對應的是AI伺服器的需求,不包含通用伺服器,由於英特爾、AMD已經供不應求了,所以這是文章開頭提到的漲價的邏輯,也是提貨周期變長的原因。行業研究機構Futurum Group將這一現象稱為“悄然而至的供應危機”,並預測到2028年CPU市場增速將超越GPU。ARM下場做AGI CPU,著重強調了自己與x86架構的優勢——每機櫃性能功耗比是同類晶片的兩倍,並表示每吉瓦AI資料中心容量可節省高達100億美元的資本支出。這對於Meta、微軟、Google這些正在大手筆建設資料中心的超大規模雲廠商而言,存在巨大的吸引力。Creative Strategies預測,資料中心CPU需求將從2026年的250億美元增長至2030年的600億美元;若疊加AI智能體的需求,這一數字將接近1000億美元。即便ARM只能拿下其中一個零頭,也足以支撐哈斯描繪的財務藍圖。04 先和Meta抱團“造芯”祖克柏和他的Meta雖然在這一代模型上掉進了大坑,但一直在算力市場玩的風生水起,又是賣卡又是自研,不久之前也公佈了新一代MTIA晶片。ARM下場做AGI CPU,也選擇了和Meta抱團:一方面當客戶,一方面作為聯合開發者。Meta軟體工程師保羅·薩阿布從2023年項目啟動之初便全程參與晶片設計。他解釋了Meta入局的動機:“在當今世界,真正的玩家屈指可數。這為我們的生態系統又增添了一個新選擇。”根據財報電話會議的資料,Meta今年資本支出高達1350億美元,正在路易斯安那、俄亥俄、印第安納等地大規模建設AI資料中心,僅路易斯安那州的“Hyperion”超級資料中心裝機容量就達5吉瓦。不過,在此前,Meta的CPU幾乎完全依賴英特爾和AMD。多一個ARM可選項,就多一條供應鏈、多一個議價籌碼。薩阿布直言:“我們不是晶片公司,我們希望它能面向全世界開放。”Meta之外,OpenAI、Cloudflare、SAP、SK電信、Cerebras也相繼確認為早期客戶。AWS、Google、微軟、輝達、三星電子、台積電等超過50家公司為ARM站隊。資深晶片行業研究員穆爾黑德強調:如果ARM能拿到Meta未來年度資本支出的5%,就已經是“改變遊戲規則”的量級,而Meta只是其客戶名單中的第一個。05 五年250億美元下場自研AGI CPU,在哈斯的財務藍圖中:ARM預期五年內,年營收達到250億美元,約為當前的五倍,其中AGI CPU貢獻約150億美元,傳統IP授權業務翻倍貢獻約100億美元。雖然在CPU漲價潮下官宣自研,但ARM早在2023年就已秘密啟動晶片研發。外媒報導顯示,當時ARM拿出了7100萬美元在德克薩斯州奧斯汀建立專屬晶片實驗室,從一支曾經規模極小的團隊壯大至逾1000名工程師。只不過,雖然有IP護城河以及輝達等在ARM伺服器CPU市場的驗證,硬體業務要面臨包括供應鏈管理、客戶服務、競爭響應等在內的諸多問題,每一項都是ARM從未系統性面對過的挑戰。另外,作為對手,英特爾和AMD也不會坐視增量市場份額被搶走,x86陣營數十年積累的軟體生態和客戶慣性,依然是ARM需要逐步攻克的壁壘。好在整個市場的需求不斷地被AI推高,只要產品被客戶驗證可靠,再加上它還沒有GPU這樣的出口管制,最終產品可以在全球市場裡“暢通無阻”。現在的ARM,最在意的可能是台積電的量產交付能力了。 (騰訊科技)
打破30年IP模式!剛剛,Arm自研CPU發佈:3nm+136核!
重磅!Arm CPU 路線圖公開發佈剛剛,歷史性突破!Arm發佈三十多年來首顆自研專用CPU——Arm AGI CPU。打破長期IP授權模式,直擊AI算力剛需,劍指x86陣營。核心參數拉滿:3nm工藝,136核Neoverse V3核心。主頻3.2-3.7GHz,300瓦功耗,雙Chiplet封裝(台積電代工)。快取亮眼:2MB L2/核心,128MB共享SLC。介面拉滿:96條PCIe 6.0,支援CXL 3.0,12通道DDR5,總頻寬825GB/s。極致能效!放棄同步多線程,剔除冗餘功能。每瓦性能碾壓英特爾、AMD最新x86晶片,號稱“最高效agentic CPU”。強強聯手!與Meta聯合開發,Meta為首個客戶。OpenAI、SAP等巨頭已確認採購,商業化勢頭強勁。量產明確:今年下半年全面量產,中國是重要目標市場。巨額投入:斥資7100萬美元,耗時18個月新建實驗室。伺服器方案雙選擇:風冷36kW(8160核)、液冷200kW(超45000核)。定價具競爭力,可直接替代Meta現有計算CPU。行業震動!打破Arm中立定位,衝擊x86陣營格局。Arm高管表態:此舉核心是滿足客戶需求,有望帶來數十億美元收入。AI時代算力革新,Arm正式從IP授權商,躋身自研晶片賽道。全新Arm AGI CPU核心亮點高性能 CPU:採用 Armv9.2 架構,Arm AGI CPU 最高整合 136 個 Neoverse V3 高性能核心,每核配雙 128 位 SVE2 單元,支援 bfloat16/INT8 AI 加速。全核主頻 3.2GHz,睿頻 3.7GHz。高記憶體頻寬:單核心記憶體頻寬最高 6GB/s,緩解高吞吐 AI 負載的記憶體瓶頸,提升 AI 與雲端系統性能。先進 I/O 與加速器互聯:支援 96 路 PCIe Gen6、CXL 3.0 及 AMBA CHI 擴展鏈路,實現大規模異構計算。企業級安全架構:面向多租戶雲與 AI 基礎設施提供硬體級安全,包含根安全引擎、指針認證、分支目標間接保護。 (芯榜)PDF文件:https://www.arm.com/static/az/pdf/product-brief/arm-agi-cpu-product-brief.pdf
阿里達摩院祭出開源架構CPU王炸,直指AI Agent
RISC-V摘掉緊箍咒!坐上高端算力牌桌,首次原生跑通千億大模型。近期,“龍蝦熱”席捲全球,以OpenClaw為代表的各類智能體加速湧向企業和個人,隨之而來的不僅是各行業領域生產力範式的變革,也帶來了底層晶片算力市場格局的深刻改變。在AI大模型已經全面進入Agentic AI(AI智能體)時代的今天,算力瓶頸不再侷限於GPU等大算力AI加速器,由於多並行和海量資料流轉的需求,CPU的重要性愈發凸顯,重新回到系統調度的舞台C位。海外GPU巨頭輝達也在最近的GTC大會上發佈了其自研的Vera伺服器CPU,以應對Agentic AI帶來的CPU瓶頸問題。CPU領域,相比傳統x86架構和Arm架構,RISC-V作為新興的指令集架構,其簡潔靈活易擴展、兼顧通用與AI算力、開源開放等特點幾乎都成為當前AI時代的“剛需”,成為其突出優勢。在這樣的產業大變局下,就在今天上午,阿里達摩院在2026玄鐵RISC-V生態大會上重磅發佈了新一代旗艦CPU IP——C950,其不僅在SPECint2006基準測試中史無前例地突破了70分大關,更首次實現了RISC-V CPU流暢跑通千億參數頂尖大模型。玄鐵C950的問世,標誌著RISC-V正式撕下“低端”標籤,在高性能與AI計算兩大核心戰場,與x86、Arm形成了實質性的“三足鼎立”之勢,成為Agentic AI時代晶片算力賽道的最大變數。01.衝刺高性能與AI市場徹底撕掉“低端”標籤AI智能體給RISC-V按下加速鍵從第一個5年的開源學術探索項目,到第二個5年國際標準和商用IP開始萌芽,再到如今第三個五年,今天基於RISC-V架構的晶片正迎來井噴式湧現。從架構提出到出貨100億顆處理器,RISC-V只用了12年,而x86架構用了30多年。走過第15個年頭的RISC-V,正在AI時代技術創新和市場需求的雙重驅動下,迸發出更旺盛生命力。目前,RISC-V晶片的商業化版圖正在快速擴張。在物聯網與邊緣計算市場,輝達、英飛凌等海外巨頭都在大量出貨基於RISC-V架構的MCU(微控製器)。輝達每年大約消耗10億個RISC-V核心,內建於其GPU、CPU、SoC 和其他產品中,其在2025年曾透露正在推進CUDA相容RISC-V架構;英飛凌則宣佈今後所有MCU都要基於RISC-V架構開發。在RISC-V高性能領域,資本動作也從未停止,比如高通此前就收購了RISC-V初創企業Ventana,試圖在高端市場尋找切入點。Meta則基於RISC-V架構自研AI晶片。行業資料的預測進一步印證了這一爆發趨勢。根據半導體權威分析機構SHD Group的最新預測資料,到2031年,RISC-V裝置數量將超過360億顆,年複合增長率高達31.7%;相關市場規模將超3000億美元。部分行業智庫甚至預測,到2030年,RISC-V有望佔據全球處理器市場25%的份額。儘管RISC-V在MCU、嵌入式、家電、儲存、多媒體、汽車、通訊、安全、終端等眾多領域呈現星火燎原之勢,但其長期以來始終無法擺脫“低端”晶片的固化標籤。RISC-V要想真正躋身主流晶片架構的牌桌,僅僅在邊緣側“打游擊”是遠遠不夠的。要想與x86和Arm三足鼎立,RISC-V必須在伺服器(高性能)和AI計算兩大核心戰場上證明自己。這不僅是技術層面的突破,也是晶片生態話語權的爭奪。02.C950打破RISC-V性能天花板7年深耕建構國內頂級RISC-V生態這次大會上阿里達摩院亮出的新一代旗艦CPU IP——C950,正是RISC-V在突圍高性能與AI計算、打破固有印象的一次“里程碑”式突破。在高性能方面,根據官方資料,在工業界公認的SPECint2006基準測試中,C950直接突破70分大關,其單核性能超過了22/GHz,最高主頻達3.2GHz,成為當之無愧的全球最強RISC-V CPU,逼近AMD Zen5、Intel GNR、Arm V2等行業高端產品。為了驗證其在真實環境下的可用性,達摩院進行了嚴苛的聯合測試。結果顯示,面對MySQL(資料庫)、Redis(記憶體快取)、Nginx(Web伺服器)、OpenSSL(安全協議)等伺服器經典工作負載,經軟硬體協同最佳化,C950的性能達到行業第一梯隊水平,雲網路、雲端儲存性能較部分主流產品提升在30%以上。眾所周知,AI Agent並非單純AI推理任務,而是典型的CPU密集型任務,大量並行指令需要序列執行,海量資料高頻流轉。C950通用計算性能的大幅提升,會顯著提升整體的系統效率。在軟體生態相容性方面,C950支援了國際最新規範檔案RVA23.1的全部標配和可選擴展。這一Profile標準的落地至關重要,它關係到整體系統的可靠性、安全性和資源利用率,可以極大便利RISC-V進入伺服器、AI、汽車等高端平台,並能無縫適配Linux、Android等主流作業系統環境。據瞭解,此次發佈的C950可以用於雲端運算、生成式AI、高端機器人、邊緣計算等諸多領域。實際上,在向高性能迭代的路上,達摩院玄鐵一直是RISC-V陣營中毋庸置疑的領跑者,回顧其產品演進,幾乎每一次迭代都在不斷打破行業的“天花板”,C950的推出不是曇花一現,而是持久深耕之下技術創新力的一次階段性集中體現。阿里巴巴從2018年起開始佈局RISC-V,是國內最早涉足RISC-V的技術團隊之一。早在2019年7月,阿里就發佈了當時業界性能最強的RISC-V CPU IP——玄鐵C910,其首次突破運行頻率2GHz的門檻,Specint2k6評測7/GHz。這一成績在當時給了行業極強的信心:RISC-V的架構設計在原理上沒有性能天花板。隨後C910的生態落地更進一步證明了其可用性。2024年,達摩院聯合中科院軟體所研發出全球首台穩定運行的RISC-V筆記型電腦、歐洲雲服務商Scaleway發佈了全球首個RISC-V雲實例,它們的計算底座都是C910。可以說,C910吹響了RISC-V衝向高性能的衝鋒號。當然,這只是一個開始,伺服器晶片才是真正考驗CPU通用算力極限的終極戰場。2025年發佈的玄鐵C930,通用算力達到SPECint2006基準測試15/GHz,首次邁過了伺服器晶片的入門門檻。RISC-V實現行業里程碑式突破的每一個關鍵節點,我們都能看到玄鐵的身影。而每一代玄鐵CPU的推出,都會帶動產業上下游企業參與進來,進一步加速RISC-V向高性能領域迭代的步伐。7年多來,阿里陸續推出C、E、R系列的16款RISC-V CPU,分別對應高性能、高能效、高可靠場景,這些CPU已經廣泛應用於伺服器、機器人、新能源汽車、工業控制、AI智能終端、儲存控製器等領域。根據官方資料,目前玄鐵CPU已應用於200多款量產晶片和近千款終端產品,客觀來看,玄鐵CPU已經形成了目前國內規模最大、最成熟的RISC-V產業生態。03.業內首次跑通頂級千億大模型劍指AI Agent時代新型算力中樞正如前文所說,高性能和AI計算是當前RISC-V晶片聚焦突破的核心戰場。在AI產業全面進入Agentic AI時代的今天,在新的計算範式下,CPU的重要性愈發突出,而玄鐵C950則是一款真正為AI Agent而生的新型CPU。在智能體當道的今天,使用電腦和筆記本的可能不再是單一個人,而是無數個自主運行的智能體,系統的Token呼叫量呈現出指數級的暴增。如何高效地載入和流轉KV-Cache、如何降低首Token延遲,成為了系統真正的瓶頸。在這個過程中,CPU不再是GPU的“配角”,而是作為系統任務調度和龐巨量資料流轉的“中樞”。針對這一行業趨勢痛點,達摩院玄鐵利用RISC-V架構天然的開放性和靈活性,賦予了CPU原生AI能力。此次達摩院發佈了兩款RISC-V原生AI計算引擎——4K超寬Vector引擎和Matrix引擎,與玄鐵CPU統一編址,消除資料複製瓶頸,從而將通用高性能算力與AI算力進行原生融合。其中,Matrix引擎專門為大模型張量計算加速,單核算力可以達到8TFLOPS。在實測中,搭載了玄鐵全自研Matrix(矩陣)加速引擎的C950,其AI推理表現稱得上驚豔,平均執行效率超過90%,典型演算法性能較行業提升2-3倍,其順利運行了當前業界頂級的Qwen3開源模型,以及對算力要求極高的DeepSeek V3“滿血版”。具體來看,運行Qwen3的輸出速度達34 Tokens/s,首Token延遲僅為3.4s;而運行DeepSeek V3的輸出速度達18 Tokens/s,首Token延遲1.7s。這是RISC-V CPU首次原生支援千億參數規模的大模型。這一突破意味著,在處理複雜的AI Agent推理與調度任務時,CPU可以極大緩解GPU的壓力,承擔更多AI計算任務,成為AI Agent時代AI計算新架構中的核心組成部分。在加速落地,讓行業客戶能充分發揮RISC-V特性優勢方面,此次阿里達摩院發佈的Flex平台無疑是RISC-V可擴展性的最佳證明,其可以很好的解決真實產業中的高度定製化需求。去年,達摩院玄鐵共支援了35家客戶進行了多達38項的CPU底層改動,其中超過一半的定製需求集中在AI加速、儲存最佳化、可靠性增強等特定垂直場景。簡單來說,Flex平台將造芯的主導權依然交還給產業,這一平台包括處理器建模、開發環境和軟體工具鏈等完整元件,客戶不僅能選擇“標配”的高性能玄鐵CPU作為基座,還可基於Flex進行深度的自訂修改,從而打造出最符合自身垂直場景需求的創新CPU。值得一提的是,像Vector(向量)加速、Matrix(矩陣)加速等高端AI能力,客戶也可以自行通過Flex平台來實現與整合,這無疑會顯著降低高端定製晶片的設計門檻。整體來看,RISC-V沒有歷史包袱,不需要相容過往幾十年的軟體棧,可以專注於實現最高效的AI Agent性能;RISC-V簡潔、靈活,易於擴展的特性則可以讓晶片設計企業根據AI軟體棧變化快速迭代,及時響應最新的算力需求。此外,AI Agent任務同時需要高性能的通用算力與AI算力,而RISC-V開源社區正在編製麵向矩陣計算(Matrix)的擴展指令,也就是把AI能力寫入RISC-V的“基因”,有望令RISC-V成為高性能通用計算與AI計算融合的最佳載體。最後,RISC-V開源開放的特點也進一步有助於破除技術壁壘,便於國家和企業層面將技術主動權握在自己手中。04.中國開源力量“會師”RISC-V主導全球標準話語權,產學研邁入深水區晶片行業多年發展證明:晶片架構的競爭從來不是單打獨鬥,而是生態陣營的較量。由於美國對高端半導體技術的持續限制,中國產業界正將RISC-V視為實現“矽主權”(Silicon Sovereignty)和底層技術自主可控的重要賽道。當前,中國開源力量正在RISC-V高性能生態中完成一次史無前例的“大會師”。從宏觀背景來看,RISC-V國際基金會(RISC-V International)為了保持技術中立,已將總部遷至瑞士。而在這個主導RISC-V技術走向的最高組織中,中國企業展現出了壓倒性的存在感。據最新公開資訊,在RISC-V國際基金會的19家“Premier(高級)”會員中,中國企業佔據了8家,遠超其他單一國家。在具體落地層面,阿里達摩院玄鐵正串聯起中國本土的產業生態。一方面,玄鐵與北京開源晶片研究院、中國科學院軟體研究所達成合作,共同研發下一代開源RISC-V高性能CPU香山及軟體生態,形成科研層面的“共振”。軟體生態層面,達摩院玄鐵積極參與OpenRuyi社區,目前以25.27%的Patch貢獻率穩居排名第一。在產業協同層面,達摩院玄鐵與中興通訊在RV國際基金會和開放原始碼軟體社區中強強聯手,共同推進伺服器領域開源元件的深度最佳化,使相關的儲存和編解碼性能得到了顯著提升。2023年,達摩院牽頭髮起的“無劍聯盟”,圍繞玄鐵CPU建構開放、協同、普惠的RISC-V晶片商業服務體系,給企業提供從晶片設計到應用的全鏈路能力,降低開發成本與風險,加速RISC-V產業化處理程序。在國際標準指定方面,達摩院玄鐵正在積極投入RISC-V國際基金會的核心工作,不僅主導了伺服器級晶片標準的制定並正式發佈,還深度參與了BRS、RPMI等伺服器關鍵規範的起草。特別是在AI領域,玄鐵正在主導Matrix擴展(AME)社區的討論及標準制定,這意味著未來全球的RISC-V晶片在演進AI矩陣計算能力時,可能遵循由中國主導制定的技術底層標準。05.結語:“頂峰相見”RISC-V開源生態劍指AI智能體時代達摩院玄鐵C950的發佈,絕不是一次測試跑分的“刷榜”,而是真正從通用計算性能和AI計算性能兩個關鍵方面實現突破,徹底打破了RISC-V“做不了高性能計算”的刻板印象。在產業層面,基於Flex平台的開放性,橫向聯合中國各領域RISC-V開源力量,達摩院玄鐵正在牽頭建構一套能夠與傳統封閉生態體系對抗的新業態。在這場“AI時代計算架構之戰”中,以玄鐵為代表的RISC-V陣營,已經拿到了AI Agent時代的高端算力殿堂“入場券”。 (智東西)