#CPU
從GPU到CPU全面告急:美系晶片封鎖在即?
當業界目光聚焦於輝達H200命運之際,伺服器CPU市場突傳警報。Techi.com今日援引多名管道商與OEM廠商稱,英特爾Xeon Scalable與AMD EPYC系列處理器對華供應"顯著收緊",部分型號交貨周期從4周延長至16周,價格漲幅達20%-35%。這是繼GPU之後,美國對華半導體封鎖向資料中心核心算力蔓延的最新訊號。管道證實,英特爾自2025年12月起對中國區伺服器CPU實行"配額制",季度出貨量較2024年同期下降約30%;AMD雖未明文限制,但米蘭、熱那亞等高端EPYC型號優先供應北美雲廠商,中國區實際可分配量縮減25%。某頭部伺服器ODM採購總監告訴記者:"原來季度能拿5萬顆Xeon,現在只給3萬顆,剩下2萬顆要麼等下個季度,要麼加錢去現貨市場搶。"漲價與缺貨雙重壓力下,中國網際網路大廠與營運商被迫調整採購策略。阿里雲已把2026年Q1伺服器招標中x86架構佔比從70%下調至45%,空出份額轉向華為鯤鵬920與飛騰S5000C;中國移動則要求集采伺服器"國產CPU佔比不低於50%",海光資訊C86-3G與兆芯KH-40000系列中標份額同比提升三倍。中國國產CPU廠商迎來訂單井噴。華為鯤鵬產品線內部人士透露,2026年1月伺服器CPU出貨量突破8萬顆,為2024年同期四倍,深圳、東莞封裝基地已實行"三班倒"擴產;海光資訊則宣佈DCU與CPU產線滿產,2026年資本開支上調40%用於7nm以下先進封裝。管道反饋,鯤鵬920現貨價從年初1800元漲至2400元,仍供不應求。美國商務部尚未就伺服器CPU供應收緊發表官方評論,但業內普遍認為這與2025年10月更新的"先進計算與半導體製造裝置"規則有關——雖未直接點名CPU,但BIS已將"高性能資料中心處理器"納入出口審查範圍,Intel、AMD為規避合規風險主動縮減對華出貨。對於中國國產CPU生態而言,窗口期與挑戰並存。華為鯤鵬、飛騰基於ARM架構,軟體適配仍需時間;海光、兆芯雖相容x86,但7nm以下先進製程仍依賴境外代工。某雲廠商技術總監表示:"現在不是選不選國產,而是沒得選。ARM生態遷移成本比x86高30%,但總比斷供強。"分析人士指出,若Intel、AMD供應持續收緊,2026年中國伺服器CPU市場國產佔比有望從2024年的18%躍升至35%,ARM與x86雙路線平行格局正式確立。對於仍在攻堅7nm以下的國產晶圓廠而言,伺服器CPU的"被動替代"意味著每年新增約50萬片12英吋晶圓需求,國產裝置與材料產業鏈將同步受益。從GPU到CPU,美國對華資料中心算力的封鎖正在層層加碼。當"洋芯"供應不再確定,國產替代從"可選項"變成"必選項",中國半導體產業的自主化處理程序,正被外部壓力倒逼進入加速期。 (晶片行業)
CPU市場:AMD進,英特爾退
截至2025年第三季度,英特爾伺服器處理器出貨量份額已降至72%。英特爾在客戶端和伺服器市場的主導地位正日益岌岌可危,最新資料顯示,AMD 持續在這兩個領域攻城略地。AMD伺服器CPU市場份額在不到7年內接近28%,英特爾跌至72%,營收份額低至60%。過去七年間,英特爾在客戶端和伺服器 CPU 市場均呈下滑態勢,Mercury Research 的最新統計資料顯示,該公司的市場份額已跌至歷史新低。作為對比,AMD 的份額每個季度都在穩步增長,使得英特爾難以維持其在整體 CPU 市場的掌控力。雖然英特爾在這兩個領域仍保持領先,但這種優勢似乎難以長久維持。截至 2025 年第三季度,其伺服器處理器出貨量份額已降至 72%,營收份額更是僅為 61%。觀察圖表資料可見,2019 年第一季度,英特爾在伺服器市場的出貨量和營收份額均高達 97%。在不到 7 年的時間裡,該公司的份額持續萎縮,為 AMD 騰出了巨大的擴張空間。據 Mercury Research 資料,AMD 的份額現已逼近 30%,而在 2018 年,這一數字僅為 1% 至 2% 左右。此外,隨著 AMD 後續每一代 EPYC處理器的發佈,英特爾的市場地位都在進一步下滑。第一代EPYC系列Naples於 2017 年年中推出,雖然市場接受度起初較慢,但早期使用者對其性能和能效感到驚喜,口碑因此迅速傳播。這使得EPYC取得了巨大成功,並一直保持著強勁的市場競爭力。EPYC 處理器推動了AMD的發展,吸引了眾多尋求更高核心數和更強能效比的雲服務提供商及企業客戶。而在客戶端市場,英特爾表現更為疲軟。在 2016-2017 年獲得微弱優勢後,自 AMD Zen 架構發佈以來,英特爾的份額便一路走低。隨著更新一代 Zen 架構及 X3D 晶片的推出,英特爾在桌上型電腦和筆記本細分市場均流失了大量份額。英特爾的市場份額大約從 2017 年開始下滑,而這正是第一代 Ryzen CPU 問世的時間。雖然英特爾曾憑藉第 12 代 Alder Lake 和第 13 代 Raptor Lake 系列扳回了一些份額,但由於第 13 代和第 14 代晶片出現了穩定性問題,大量 DIY 及 OEM 市場轉向了 Ryzen,這也是 AMD 在桌上型電腦領域份額大幅提升的原因。目前,英特爾在這兩個領域的出貨量份額均已降至 60% 左右,而 AMD 在桌上型電腦市場的份額已超過 30%。在筆記本領域,由於 ARM 處理器在移動領域頗具競爭力,AMD 的份額似乎停滯在 20% 左右。看起來,蘋果和 AMD 都從英特爾在筆記本市場的衰退中獲益,而在 AMD 增長強勁的桌上型電腦領域,蘋果的份額則保持停滯。總而言之,英特爾在客戶端和伺服器領域似乎都陷入了困境。得益於 Panther Lake 等產品,英特爾在移動領域有可能實現反彈;而在桌上型電腦市場,所有人的目光都聚焦在 Nova Lake 上。 (半導體產業縱橫)
凌晨,CPU迎來大考!
隨著AI硬體的火熱需求進一步從儲存晶片燒向CPU,英特爾和超微半導體(AMD)的業績表現無疑正成為本輪美股財報季的熱門焦點。而在台北時間周五凌晨(周四美股盤後)英特爾的財報即將率先發佈之際,這兩家全球CPU龍頭企業的股價,無疑也正進一步迎來飆升。行情資料顯示,AMD股價在周三迎來了七連漲,主要由於市場對該公司AI伺服器CPU業務的樂觀情緒不斷升溫。而與此同時,英特爾在年內也表現搶眼,其股價2026年以來已累計上漲47%,在標普500指數成分股的漲幅榜中高居第三。AMD股價當天收盤上漲了近8%。根據道瓊斯市場資料,該股目前已連續七個交易日走高,創下了自2025年2月19日以來最長的連漲紀錄。而英特爾當天的漲幅則更為驚人——在財報發佈前的倒數第二個交易日收漲了11.7%,報於54.25美元,創下自2022年1月18日以來的最高收盤價。對英特爾CPU強勁增長勢頭的樂觀情緒,以及該公司製造業務潛在的復甦跡象,使該股近期表現出色。此前,KeyBanc資料顯示,由於超大規模雲服務商“掃貨”,英特爾與AMD在2026全年的伺服器CPU產能已基本售罄。為了應對供需極端失衡並確保後續供應穩定,兩家公司均計畫將伺服器CPU價格上調10-15%。目前,隨著AI從簡單的助手演進為能夠規劃並執行任務的AI代理,業內對通用計算能力的需求正在加速增長,這也使得CPU需求水漲船高。按照日程安排,英特爾與AMD將分別於當地時間1月22日與2月3日披露Q4財報,日前華爾街多家投行上調相關目標價。而其中,明日凌晨率先登場的英特爾,無疑正在這股熱潮下成為各方關注的重頭戲。其業績表現也將決定該股作為人工智慧領域新興贏家的地位是否能延續……英特爾能否真的迎來“涅槃重生”?韋德布什分析師Matt Bryson在最近的報告中寫道,儘管英特爾在人工智慧加速器市場舉步維艱,但隨著人工智慧系統日益複雜,其伺服器CPU似乎需求旺盛,這可能推動該公司最新的季度業績表現亮眼。匯豐銀行本周早些時候已將英特爾目標價從26美元大幅上調至50美元,評級由“減持”上調至“持有”。“隨著AI從簡單的助手轉向能夠規劃和執行任務的自主代理,對通用計算(即由CPU執行的操作)的需求正在加速,”匯豐銀行分析師Frank Lee在上調英特爾股票評級時補充道。當然,面對近來股價如此強勁的漲勢以及被不斷抬升的預期,市場明日凌晨的一大關注焦點也在於英特爾在伺服器CPU領域的優勢能否彌補其他業務類股的問題。例如,韋德布什的Bryson指出,英特爾面臨記憶體成本上漲的風險,這可能影響公司利潤率並抑制個人電腦需求。Bernstein分析師Stacy Rasgon則強調了英特爾面臨的持續挑戰,他指出該公司在伺服器業務中的市場份額有所流失。他補充稱,英特爾的另一個問題可能是客戶仍傾向於選擇其舊產品而非新產品,這種趨勢模糊了該公司CPU供應具體短缺程度的認知。他還提及了對英特爾傳統PC業務的擔憂。“儘管這似乎是老生常談,但我們仍認為CPU出貨量長期超過PC需求,”Rasgon在周三的報告中表示,並指出若記憶體價格上漲衝擊PC出貨量,這一矛盾可能在今年激化。FactSet資料顯示,目前業內人士預計英特爾去年第四季度調整後每股收益為8美分,營收達134億美元。這家晶片製造商的客戶端計算部門(包含PC業務)預計營收將達到84億美元,而其資料中心和人工智慧部門的營收預計為44億美元。此外,華爾街對今年第一季度的營收預期為125億美元。此外,Susquehanna分析師Christopher Rolland表示,在英特爾本月早些時候推出的Panther Lake處理器獲得積極反響,以及有報導稱其代工業務客戶興趣日益濃厚之後,他將關注英特爾代工業務是否有正式的客戶簽約聲明。Rolland表示,儘管他懷疑英特爾四季報能否表現出明顯的毛利率增長,但在Panther Lake取得看似成功的表現後,他在財報發佈前持“稍微更積極”的態度。“簡而言之,這種小幅的潛在利多可能使英特爾迎來一段時間以來表現最好的財報之一,”Rolland指出。Freedom Capital Markets技術研究負責人Paul Meeks表示,他不指望英特爾會有爆發式的表現,但他將關注公司是否會分享晶片合作夥伴或主要客戶的細節。“我認為唯一可能構成真正根本性驚喜的,將是確認蘋果或其他合作夥伴——不是傳聞,而是真正的合作夥伴——使用其最新的製造技術。”AMD伺服器CPU庫存即將售罄?而在AMD這邊,KeyBanc分析師John Vinh表示,當這家晶片製造商下個月公佈第四季度財報時,他預計營收將超出預期並上調業績指引。這主要受AMD伺服器CPU業務的強勁需求推動,他特別提到了最新一代的Turin資料中心CPU。Vinh在周二晚間報告中指出,AMD今年的伺服器CPU庫存即將售罄,隨著超大規模企業爭相鎖定產能,該公司平均售價有望提升10%至15%。他在本月早些時候的報告中還提到,受人工智慧資料中心關鍵晶片需求強勁推動,AMD伺服器CPU業務今年增速至少可達50%。伯恩斯坦分析師Stacy Rasgon在周三的報告中也上調了對AMD去年第四季度營收的預期,部分原因在於對該公司伺服器業務動能持更樂觀態度。Rasgon同時預測,包含第五代Turin處理器的EPYC系列產品今年銷量將增長30%。不過,儘管AMD股價近來接連大漲,但Vinh也指出,目前華爾街對AMD仍持“喜憂參半”態度,因其GPU相較輝達的競爭力存在不確定性。“多頭投資者受到AMD在AI領域與輝達競爭的進展以及強勁的伺服器CPU表現鼓舞,而看空者則仍對AMD能否滿足其GPU在產量和性能方面的預期持懷疑態度,”Vinh表示。Vinh表示,當AMD下月發佈財報時,投資者將重點關注其首款機架級解決方案Helios及配套Instinct MI455系列GPU的生產時間表,以及相關產品的客戶進展。他補充道,市場還將關注AI營收預期調整情況,以及該公司對傳統伺服器晶片供需動態的表態。Rasgon表示,AMD“至少”已經與OpenAI達成了關於其Helios機架的協議,並將從今年下半年開始供應,但這家人工智慧初創公司目前仍是其“唯一”的重量級客戶。因此,AMD在人工智慧方面的“整個敘事”都取決於該合作夥伴關係的進展,以及AMD是否能為Helios爭取到更多有份量的客戶。整體而言,Rasgon認為,AMD “似乎有可能從其核心業務的伺服器強勢和市場份額增長中獲益”,他認為投資者在等待其人工智慧晶片成效的同時,會保持樂觀態度。 (科創日報)
關於伺服器 CPU 缺貨與漲價傳聞的幾點核心驗證
周三華爾街股市收高,英特爾大漲 11.72%,盤後繼續走高,雖然宏觀面有“格陵蘭島協議”和“關稅豁免”的情緒提振,但回歸行業層面,核心驅動力是我們前天重點聊的CPU 漲價與缺貨。結合這幾天的上下游供應鏈交流看,簡單來說:缺貨是真的,但漲價的性質不同。今天重點拆解三個大家最關心的邏輯偏差:1/英特爾與 AMD 在漲價策略上的根本分歧(到底誰在漲?);2/本輪缺貨的底層邏輯(為什麼是老款缺貨?);“3/儲存漲價”如何倒逼伺服器整機搶裝。1/ 英特爾與 AMD 在漲價策略上的根本分歧(到底誰在漲?)首先要釐清一個概念。AMD 這邊,PC漲價 10%-15% 是鐵板釘釘了,但在 伺服器端,我瞭解到的情況是——內部還在打架。為什麼?因為 AMD 現在的戰略目標非常清晰:沖市場份額。 截至 25 年 Q3,AMD 在資料中心的份額已經過了 40%,他們的野心是 2026 年要幹到 50%。為實現份額的快速增長,通常需要採取價格競爭策略而非漲價。因此,儘管存在通過漲價獲利的聲音,但衝刺市場份額可能仍是其主要考量,伺服器CPU不一定會漲多少。反觀 Intel,官方並沒有發漲價函。那市場上的‘漲價’是怎麼回事? 說白了,是OEM 廠商為了搶貨主動加價。現在的情況是,Intel 的第 4 代、第 5 代 伺服器CPU,幾十個型號全線缺貨,交付周期已經拉到了 16-24 周。國內有些廠商等不及了,直接跟 Intel 說:‘我多付錢,能不能把周期從 6 個月壓到 3 個月?’所以這不叫官方漲價,這叫‘供應鏈擁堵費’。現在CPU那邊的銷售經理都在給客戶打預防針:不管你們是做伺服器的還是做消費電子的,只要今年還要出貨、要裝機,最好現在就多囤點貨。 因為萬一到了下半年或者明年,市場一旦又像2020、2021年那樣出現瘋狂的‘缺芯潮’和搶購熱,到時候的情況就不是我們能控制得了的了。2/ 缺貨根源:一次典型的“預判失誤”如果不深挖,大家可能以為是需求突然暴增了 50%?其實不是。如果把邏輯下沉到產能規劃層面,本質上是Intel 和 OEM 都在 2024 年底‘押錯題’了。回顧一下,當時大家的共識是:2025 年是 PCIe 5.0 的元年,Gen 6 CPU 會快速放量。所以大家把產能全切給了 Gen 6。結果呢?現實非常骨感。到了 2025 年,75% 的實際需求依然趴在 Gen 4 和 Gen 5 上。 這就導致了一個巨大的錯配。 特別是 Q2、Q3,美國的 超大規模資料中心突然追加老款訂單,Dell 甚至直接把單子翻倍了。Intel 雖然承諾給 Dell 加 60% 的量,但那個周期太長了。這就直接引爆了現在的‘恐慌性缺貨’。3/ 儲存漲價”如何倒逼伺服器整機搶裝儲存這個變數是超出大部分人的預期的, 從 Q3 開始,儲存價格飛漲。這對客戶意味著什麼? 意味著如果你手裡有 26 年上半年要交付的項目,你現在如果不買,明年預算就爆了。 所以我們看到一個很反常的現象:囤整機。 比如江蘇、浙江那邊的大型製造業客戶,為了鎖成本,不是在囤記憶體條,而是在囤伺服器整機。最典型的例子是25 年 Q4 這一波網際網路大廠(字節、阿里)的招標。 我聽到的細節是:幾乎不壓價,也不搞複雜的定製化,核心條件只有一個——‘26 年 3 月底前必須到貨’。 這種‘只求有貨’的姿態,在過去幾年是非常罕見的。這也驗證了 伺服器市場的需求是高度缺乏彈性的——PC 貴了你可以不換,但企業的業務要擴容,再貴你也得買。短期看,這波行情是‘老款 CPU 產能錯配’ + ‘儲存漲價恐慌’雙重疊加的結果。 如果你在看伺服器產業鏈,春節前這波‘搶裝行情’還會持續。 但拉長周期看,等到這波囤貨在 2026 年 Q1 消化完,如果儲存價格不回落,非剛性需求可能會觀望。但在當下,邏輯非常硬:缺貨就是漲價最有力的支撐。The Information今天發了一篇資料中心通膨已至的文章(已上傳星球),今年前幾周 ,資料中心建設成本上漲的趨勢已十分明顯。由於核心元件的漲價,接下來電子市場將面臨各方面的擠出效應。 (北向牧風)
全系中招!AMD裂開了
AMD出大事了。德國人在年初就給AMD送了一份“驚喜”,或者說驚嚇,德國CISPA亥姆霍茲資訊安全中心的研究人員對外披露了一個關於AMD處理器的底層漏洞——StackWarp。從公佈的資訊來看,這個漏洞目前已經確定會影響從Zen 1到最新的Zen 5架構在內的所有AMD處理器。而且,考慮到EPYC等伺服器處理器也是基於Zen架構設計的,那麼大機率也在受影響的範圍內。因為StackWarp並非軟體級的漏洞,而是直接涉及到底層硬體的設計缺陷,這也意味著通過簡單的韌體升級是無法解決的。估計雷科技的讀者裡也有不少在用銳龍處理器的,那麼就讓小雷來和大家聊聊,這玩意對你到底會有什麼影響。晶片開年“第一炸”,來自AMD想瞭解StackWarp漏洞的危害,首先要瞭解這玩意的緣由,從查詢到的報告來看,這是一項針對AMD處理器堆疊引擎邏輯缺陷的漏洞,這個引擎原本是為了加速處理器處理堆疊操作而設計的性能最佳化元件,但研究人員發現可以通過操控特定的暫存器控制位來干擾其同步機制。圖源:cyberkendra這麼說吧,你可以把整個CPU看做是一個生產線,CPU核心是負責操作的技術員,而堆疊引擎則是專門負責管理資料進出和擺放位置的記帳員,有堆疊引擎的幫助,CPU就可以專心負責生產,不用考慮資料的進出問題。而StackWarp漏洞正是利用這一點,它通過欺騙記帳員的方式,把原本應該正常運行的自動計數器暫停,此時記帳員在前面不停清點資料,但是後面的計數器卻一直卡在初始數字上。然後當記帳員清點到足夠的資料,準備把它們保存到安全區時,駭客突然把暫停的計數器打開,讓數字突然從1跳到640,等於把記帳員直接踢出清點序列,等他跑回來清點資料時,這批資料早就已經被駭客打包帶走。更進一步的,駭客可以利用這個機制讓系統在驗證金鑰時,直接跳過對金鑰的“清點”,直接進入驗證通過的通道里,讓入侵者繞過OpenSSH身份驗證從虛擬機器進入到主系統中,甚至將普通使用者的權限提升至Root權限,獲取系統的全部控制權。圖源:CISPA因為整個入侵過程都發生在CPU正式處理資料前的階段,所以入侵會變得非常隱秘,幾乎不會觸發任何安全機制。如果要舉個例子的話,就等於駭客把倉庫的建築和保安挪走,但是倉庫內的物質還留在原地,可以任意取用。從小雷的描述中,我想多數人都能理解這個漏洞的危害是非常嚴重的,因為駭客可以用它直接繞過最終防線入侵系統,而且整個入侵鏈路也非常清晰,從網路安全事件定級的角度來說,估計能算作2026年的第一個重大危害漏洞了,唯一的好消息是並非0-day等級。而且,這個漏洞最危險的地方就在於它不是用於“本地提權”(僅能夠入侵本地電腦或單一虛擬機器),而是可以從虛擬機器中逃逸。換言之,你可以通過雲服務商的任意一個虛擬機器去嘗試突破伺服器的安全機制,一旦成功,你就可以擁有整個伺服器的控制權。當然了,在實際入侵時肯定不會這麼簡單,雲伺服器的防禦體系並不僅依賴於虛擬機器隔離這一道防線,即時運行的各種安全軟體和防禦機制都會成為入侵者需要克服的問題。但是其中最困難的從虛擬機器到主系統的防禦都已經被突破,後續的安全機制能否攔住入侵者就難說了。圖源:CISPA說到這裡,小雷也是要對披露該漏洞的研究員表示敬佩,如果他偷偷將這個漏洞通過暗網等地下管道出售,有機會直接獲得上百萬美元的報酬。因為在2023年時,曾經有一個名為Zenbleed的漏洞被安全研究員提交給AMD,該漏洞僅針對Zen 2架構的處理器,但是當時已有傳聞稱曾有駭客組織叫價50萬美元購買該漏洞。看到這裡,估計不少用著銳龍處理器的讀者都要心中一涼,不過大家不用擔心,從披露的文件來看,想要利用這個漏洞進行攻擊並不輕鬆,對於駭客來說如果沒有足夠的利益驅動是不可能去做的,所以大家的個人電腦基本都是安全的。無法修復,CPU性能減半?肯定還是有朋友擔心自己的電腦安全問題,那麼StackWarp漏洞是否可以修復呢?答案是不能,因為這個漏洞設計到硬體層面的設計缺陷,總不可能讓你把處理器拆了寄回廠返修吧?即使你願意等,目前也只有在實驗室裡才能實現對奈米級晶片的修復,成本能把你接下來一輩子的處理器都包圓了。所以,AMD能做的只有通過更新微程式碼來引導CPU繞過故障區域,通過軟體來模擬故障區域的功能,維持CPU的正常運行。簡單來說,就是把給記帳員安排一個保安,檢查他稽核的資料材料,雖然慢是慢了點,但是至少不會被“賄賂”(入侵)。事實上類似的事情在2018年也發生過,不過當時被披露的兩大漏洞:Meltdown(熔斷)與 Spectre(幽靈),直接影響全球幾乎所有處理器,英特爾、AMD和ARM都無法避開,也是現代電腦歷史中最具破壞性的漏洞,甚至可以說直到今天仍有許多裝置受到這些漏洞的威脅。圖源:微博當時,幾大晶片廠商為了修復這兩個漏洞紛紛推出了微程式碼補丁,據安裝補丁後的使用者反饋,處理器在部分場景下性能會直接下降5%到30%不等,後續各大廠商又陸續發佈了迭代補丁,才最終把性能損失控制在可接受的範圍內。聊回StackWarp漏洞,這玩意的問題根源來自堆疊引擎,該硬體區域的功能直接與超線程相關,如果想徹底杜絕基於該漏洞的攻擊,那麼就必須停用超線程技術。簡單來說,如果你的處理器原本是16核32線程,那麼現在就變成16核16線程了,驚不驚喜?意不意外?雖然這對單核遊戲性能影響甚微,但在渲染、視訊剪輯等多線程平行的重度場景下,綜合性能損失理論上最高可達 50%。當然,這是最極端和最安全的處理方式,AMD目前已經向合作夥伴推送了第一版微程式碼補丁,雖然軟體補丁不能從物理層面徹底切斷StackWarp漏洞的所有攻擊路徑,但是已經可以將攻擊方法收束到少數幾種方式上,這樣就讓合作夥伴(主要是雲服務商)能夠針對性部署防禦措施。不過,對於那些必須聯網但是又有高等級保密需求的電腦系統來說,關閉超線程技術還是目前最徹底的解決方案,只不過這個方案對於雲服務商和資料中心來說影響實在太大,小雷估計大家都不會輕易啟用的。性能狂飆,安全風險不容忽視?最近幾年,關於CPU的嚴重漏洞報導比十幾二十年前多了不少,而且很多都是直接影響多代處理器的硬體架構性漏洞,實在是讓人忍不住吐槽:“整個網際網路世界的地基,居然是豆腐渣嗎?”網際網路的地基是不是“豆腐渣”暫且不說,但是CPU的安全性確實在持續下降,最近10年來,CPU廠商為了壓榨核心的每一分性能,除了不斷更新製程工藝塞入更多的電晶體外,主要做的就是往裡面不停增加預測和快取機制。圖源:veer你可以這麼理解,以前的CPU是需求和資料都到位後才開始進行計算,而現在的CPU則是提前收到下一階段的工作計畫,同時身邊還提前存放了部分未來能用到的資料,讓CPU可以在核心資料還沒到達前就開始處理部分工作,接下來只需要等核心資料到達後將兩者融合,就可以輸出結果。隨著類似機制在CPU層面的運用越來越廣泛,也就給了駭客很大的利用空間,因為他們可以通過傳送特定程式碼,誤導處理器接下來使用者會需要訪問管理員密碼等區塊的資料,然後駭客再傳送攻擊指令,觸發處理器對密碼等區域的預快取。雖然這個指令會因為入侵者不具備管理員權限而被終止,但是已經被預快取的資料仍然會在快取裡留下痕跡,這就給了駭客讀取金鑰等加密資料的機會,這也是近年來側通道攻擊越來越常見的原因。說白了,效率和安全,兩者不可兼得,半導體廠商選擇擁抱更高的效率,那麼就必須要面對安全性下降的問題。不過,業內也在尋求解決的方法,如StackWarp漏洞這樣的側通道攻擊最大的問題在於,即使發現漏洞也無法直接修復,只能用微程式碼補丁來降低危害。於是就有人提議在CPU設計階段就加入一塊專門的邏輯硬體區域,如果發現硬體架構層面的漏洞,就將補丁載入該區域,讓它直接替換出錯的區域維持處理器的正常運行。這個想法雖然看起來不錯,但是對於“寸土寸金”的CPU來說,預留修復區域就等於犧牲性能,所以大機率不會在消費級處理器上使用,頂多會用在需要高度安全性的企業級晶片上。當然,這些安全性上的問題,對於多數普通人來說是不用太過擔心的,俗話說得好:“天塌下來有高個子頂著”,類似StackWarp這樣的高危漏洞,最該擔心的還是雲服務商,他們也會想盡辦法將問題控制在小範圍內。所以,普通使用者該吃吃、該睡睡,而對於AMD來說,這個漏洞問題估計會讓他們的伺服器市場增長暫時剎車,而早已虎視眈眈的英特爾大機率不會放過這個機會。 (雷科技)
【CES 2026】AMD發佈Helios機架:18個2nm CPU+72個MI455,FP4算力2.9EFLOPS!
1月6日,在2026年國際消費電子展(CES 2026)上,處理器大廠AMD公佈了其即將推出的Helios機架級AI解決方案,其內部整合了下一代 Zen 6架構的EPYC“Venice” CPU和Instinct MI400系列AI加速器。根據AMD披露的資料顯示,“Venice”CPU將基於2nm製程,擁有多達256個Zen 6 核心,CPU到GPU的互聯頻寬將達到上一代的兩倍,CPU性能將提升70%,記憶體頻寬也將高達1.6TB/s。Instinct MI400 系列也基於2nm製程,並可帶來高達 40PFLOPs的算力輸出,並配備了432 GB HBM4 記憶體,頻寬為 19.6 TB/s(HBM容量和頻寬等方面將達到輝達Vera Rubin的1.5倍)。此前披露的MI430X同時面向主權AI計算和高性能計算需求,因此完全支援FP32和FP64技術計算以及傳統超級計算任務。最新披露的MI440X和MI455X將針對低精度工作負載進行最佳化,比如支援FP4、FP8和BF16計算。據介紹,Instinct MI430X、MI440X 和 MI455X 加速器預計將配備 Infinity Fabric 與 UALink 一同實現大規模連接,成為首批支援新互聯的加速器。然而,UALink的實際應用將取決於Astera Labs、Auradine、Enfabrica和Xconn等生態系統合作夥伴。Helios 機架級AI解決方案將整合18個 Zen 6架構的EPYC“Venice” CPU和配備了72個Instinct MI455X系列加速器,擁有總計31TB的HBM4記憶體,總記憶體頻寬為1.4 PB/s,預計AI推理時可實現最高2.9 FP4 exaFLOPS和1.4 FP8 exaFLOPS用於AI訓練。Helios 的功耗和冷卻需求都很高,因此設計用於配備足夠支援基礎設施的現代人工智慧資料中心。至於可擴展連接,AMD計畫為其Helios平台提供Ultra Ethernet乙太網路支援。與UALink不同,Ultra Ethernet可以依賴現有的網路介面卡,如AMD的Pensando Pollara 400G和即將推出的Pensando Vulcano 800G卡,這些卡能夠在已經使用最新技術的資料中心實現先進的連接。AMD還計畫推出基於MI440X 驅動 AMD 新的企業級 AI 平台,該平台不是機架級解決方案,而是標準機架伺服器,配備一台 EPYC “Venice” CPU 和八塊 MI440X GPU。AMD將該系統定位為一個面向企業級AI部署的本地平台,旨在處理訓練、微調和推理工作負載,同時在電力和冷卻方面保持與現有資料中心基礎設施的直接插入相容性,且無需任何架構更改。此外,AMD還將提供基於Epyc“Venice-X”處理器、擁有額外快取和單線程性能的主權AI和高性能計算平台,以及能夠處理低精度AI資料和高精度高性能計算工作負載的Instinct MI430X加速器。 (芯智訊)
【CES 2026】MI455X晶片+72卡機架,2027年沖2nm,蘇姿丰:4年算力漲1000倍
黃仁勳在CES2026上的演講過去不到3個小時,人稱“蘇媽”的AMD CEO蘇姿丰就帶著AMD的AI全家桶登台亮相。為了給自己產品鋪墊,蘇姿丰開場大談推理需求的暴漲,強調算力接下來將進入Yotta Flops時代(1Yotta Flops=1,000,000 ExaFLOPS,即每秒可執行10的24次方次浮點運算)。針對這一變化趨勢,AMD的解決方案是最新的MI455X GPU,並且基於72顆MI455X GPU和18顆Venice CPU,打造了一台開放式72卡伺服器“Helios”。蘇姿丰展示MI455X GPU蘇姿丰強調稱,MI455X系列相較於MI355X擁有10倍的性能提升,其公佈的路線圖顯示,2027年將推出基於2nm工藝,搭載HBM4e記憶體的MI500系列。“未來四年,要實現AI性能1000倍的提升,”蘇姿丰說。01蘇媽的“算力核彈”AMD GPU路線圖這張路線圖清晰地展示了AMD INSTINCT系列GPU路線圖。最強大的是2027年要上市的MI500,屆時將會匯入2nm工藝,採用HBM4e記憶體,AI性能又是一次巨大飛躍。如果MI455X的性能是MI355的10倍,對照官方折線圖,粗略量化一下,MI500的提升可能是MI455X的30倍。不過,拋開PPT上的故事,明年下半年的重點產品還是MI455X和“Helios”機架。不過這裡比較有意思,在說MI455X的時候,官方曬的是一張MI450的參數對比圖。按照蘇媽的說法,2026年上市的MI450,相當於MI300X+MI350,堪稱階梯式的創新和性能跨越。升級的核心思路和輝達的邏輯一樣,借助HBM記憶體,實現視訊記憶體、頻寬和算力三個維度擴展,打破AI推理的“記憶體牆”限制。這種升級的好處體現在三個方面:首先是更強的擴展能力(Scale-up),更大的視訊記憶體意味著能裝下更巨型的模型;其次是更高的生成效率,通過極高的頻寬解決了“出字速度”慢的問題,提升了每秒Token的輸出量;最後是極高的QPS(每秒查詢率),讓伺服器在單位時間內能同時響應更多使用者的提問。MI450在主流的FP8精度下提供了20PF的算力,性能表現接近初代的4倍。不僅如此,FP4精度下能達到40PF的極高性能。機架方面,根據官方資料,Helios總共18個計算托盤,一個計算托盤採用1顆Venice CPU+4顆MI455X GPU。部分細節雖未詳細說,但從現場的配置來看,其中Venice CPU採用2nm工藝,總計4600個核心,MI455X GPU則採用了3nm工藝,總計18000個計算核心,搭配總計31TB HBM4視訊記憶體和43TB/s的總頻寬,提供2.9Exaflops的FP8算力。AMD也強調,Helios是一個通往Yotta級計算擴展的開放式機架平台。02AI PC的故事端側AI不是附加值,而是必需品展示完機架級“算力核彈”之後,蘇姿丰將敘事重心拉回到個人裝置,並給AI PC下了一個明確判斷:AI PC並不是雲端AI的替代品,而是下一代個人計算的基礎設施。AMD在本次發佈中正式推出Ryzen AI 400系列處理器。該系列採用Zen 5 CPU架構與RDNA 3.5 GPU,整合最高60 TOPS的NPU算力,並已全面支援Windows Copilot+生態。蘇姿丰在現場多次提到,AI已不再是PC的附加功能,而是正在成為其“默認能力”。緊接著,AMD還正式發佈了面向高性能開發者和創作者的Ryzen AI Max平台。從現場大屏展示的參數來看,Ryzen AI Max並非一次常規的移動端升級,而是AMD對“本地AI計算單元”形態的一次重新定義。CPU最高配備16核/32線程Zen 5架構,GPU整合40個RDNA 3.5計算單元,NPU算力達到50TOPS,並配備128GB統一記憶體。這一配置不僅支撐多模態AI推理和生成,也能夠處理編譯、渲染、資料預處理等高負載任務。在此基礎上,AMD進一步向上延展,推出面向高性能本地AI場景的Ryzen AI Max平台。Ryzen AI Max被定義為面向遊戲玩家、內容創作者與開發者的“終極處理器”,其核心並不在於單一模組性能,而在於 CPU、GPU與NPU之間高度整合的記憶體架構,以提升本地 AI 推理時的頻寬效率和響應速度。真正引發現場討論的,則是擺在舞台一側的一個“小盒子”——Ryzen AI Halo。形態上,Ryzen AI Halo更像是一台迷你主機,體積遠小於傳統工作站,卻被蘇姿丰稱為“世界上最小的AI開發系統”。該裝置基於旗艦級Ryzen AI Max處理器打造,採用統一記憶體設計,最高可配置 128GB記憶體,以滿足本地運行大模型時對容量與頻寬的雙重需求。與傳統意義上的AI PC不同,Ryzen AI Halo的目標使用者並非普通消費者,而是開發者、研究人員以及小型創作團隊。AMD在現場明確強調,這並不是一台展示型硬體,而是一個開箱即可使用的本地AI平台。Ryzen AI Halo出廠即預裝多款主流開源模型,包括GPT-OSS、FLUX.2、Stable Diffusion XL(SDXL) 等,開發者無需複雜配置,即可在本地完成模型推理、偵錯和應用驗證。這一設計思路,顯然意在降低“使用AI的工程門檻”,而不是單純追求跑分或峰值算力。這一開箱即用的設計,不僅展示了Halo在實際應用場景中的便利性,也凸顯了AMD對本地AI平台的整體架構思路:它不僅是軟體友好,更是在硬體層面為開發者提供充足算力和統一記憶體支撐。Ryzen AI Max/Halo與MI系列GPU的核心共性在於:都通過大容量、高頻寬的統一記憶體設計,將算力單元與資料緊密耦合,以打破本地或節點間的記憶體瓶頸,實現高效推理與生成。與輝達DGX Spark的對比中,AMD並未強調絕對性能,而是提出了一個更貼近實際使用場景的衡量方式:tokens/dollar/second。這一指標背後,是AMD對AI PC的核心判斷,即未來的個人AI裝置,並不是“縮小版資料中心”,而是效率優先、隨時可用、成本可控的本地智能節點。從Ryzen AI 400系列筆記本,到Ryzen AI Max,再到“小盒子”形態的Ryzen AI Halo,AMD在CES 2026上給出的AI PC路線已經十分清晰:AI正在從雲端服務,下沉為每一台個人裝置中的常駐能力。03抱完OpenAI總裁,再抱李飛飛蘇姿丰與OpenAI總裁、聯創格雷格·布洛克曼CES 2026的舞台上,蘇姿丰不再單純堆疊參數、製程或峰值算力資料,也把時間留給了幾類“正在真實消耗算力的公司”。這些公司共同構成了AMD此次發佈中最重要的一條暗線:算力究竟流向了那裡,又在改變什麼。首先登台的,是OpenAI總裁、聯合創始人格雷格·布洛克曼(Greg Brockman)。他並未談論模型細節,而是反覆強調一個事實:OpenAI內部長期處於“算力緊張”狀態,模型能力的每一次躍遷,都會迅速吞噬掉新增的計算資源。蘇姿丰在台上半開玩笑地回應道:“每次我遇到你,你都在說需要更多算力。”這句玩笑背後,其實是一次非常直接的確認——通用大模型仍然是當前算力需求的上限場景。對AMD來說,OpenAI的存在並不只是一個客戶案例,而是為Helios、MI455X這類機架級產品提供了最直觀的合理性:只要模型規模和使用頻率持續上升,算力就永遠不夠。蘇姿丰與Luma AI首席執行長阿米特·賈恩緊接著,AMD將舞台交給了AI初創公司Luma AI。Luma AI首席執行長阿米特·賈恩(Amit Jain)展示了其最新一代多模態視訊模型Ray3以及即時編輯功能Ray3 Modify。這些模型已經能夠在4K、HDR 條件下生成和修改長視訊內容,並支援將真人拍攝素材與 AI 生成世界進行動態融合。賈恩特別強調,2025年是Luma從“模型展示”走向“商業部署”的一年,一些客戶甚至已經開始使用其系統生成90分鐘長度的完整影片。更關鍵的一點在於,目前約60%的Luma推理負載運行在AMD GPU上。這一比例本身釋放出一個明確訊號:推理正在成為比訓練更長期、更穩定的算力消耗來源。相比一次性的超大規模訓練,視訊生成、即時編輯、內容修改和多模態互動,對算力的需求更高頻、更持續,也更依賴單位成本與能效比。這正是AMD在本次發佈中反覆強調tokens/dollar/second的原因。蘇姿丰與Liquid AI首席執行長拉明·哈薩尼隨後登台的,是來自MIT孵化公司的Liquid AI。與前兩者不同,Liquid AI並不試圖擴大模型規模,而是試圖從根本上降低“智能的計算成本”。其首席執行長拉明·哈薩尼(Ramin Hasani)在現場發佈了Liquid Foundation Model 2.5,並預告了將於年內推出的LFM 3.0。這些模型主打高度量化、低延遲與原生智能體能力,能夠在本地裝置或企業系統中常駐運行,持續處理多語言音視訊輸入、函數呼叫和後台任務。在演示中,LFM 3.0可以代表使用者參加會議、處理日程,甚至在使用者不直接互動的情況下主動執行任務。蘇姿丰在一旁打趣道:“你確認我們會相信這個智能體?”但這句玩笑點出的,恰恰是AMD想要押注的下一階段趨勢:AI正從“生成工具”轉向“系統級參與者”。除了內容與企業軟體,蘇姿丰還明確表示,醫療是她個人最關注的AI應用領域之一,因為這裡既存在極高的算力需求,也存在對穩定性、可解釋性和長期運行能力的現實約束。當這些企業被串聯在一起時,一條清晰的邏輯逐漸浮現:從OpenAI這樣持續吞噬算力的通用模型平台,到Luma的內容生成工廠,再到Liquid AI的本地智能體,以及醫療等高可靠性場景,算力正在從集中式訓練中心,擴散為一個高頻、分佈式、長期運行的推理網路。蘇姿丰與李飛飛在這樣的背景下,“AI教母”、史丹佛大學教授李飛飛也受邀登台,分享其創辦的World Labs。World Labs的核心目標,並不是生成更精緻的圖像或視訊,而是讓AI理解現實世界的空間結構。李飛飛將其稱為“空間智能(Spatial Intelligence)”,即模型並非學習螢幕上的像素,而是學習世界本身的尺度、深度、結構與物理關係。在現場演示中,World Labs僅使用普通手機拍攝的少量照片,就生成了具有真實空間關係的3D世界模型。李飛飛指出:“過去需要幾個月的工作,現在只需要幾分鐘。模型跑得越快,世界就變得越即時。”值得注意的是,這些模型的訓練與推理同樣運行在AMD Instinct GPU與ROCm軟體棧之上。性能的提升,並不是簡單地縮短等待時間,而是在改變研究和創作的基本方式。從OpenAI的算力飢渴,到內容生成、智能體、醫療應用,再到空間智能的出現,AMD在CES 2026所呈現的,並不是一場單純的硬體發佈,而是一種判斷:當算力成本持續下降,AI 將不再只是模型能力的競爭,而是開始重塑我們理解和建構世界的方式。 (騰訊科技)