#晶片
華為清華聯手,研發28nm存內計算晶片
論文入選ISSCC 2026。芯東西2月26日消息,2月15日-19日,在被業界譽為“晶片設計國際奧林匹克會議”的國際固態電路大會(ISSCC 2026)上,清華大學、華為等大學與公司的研究人員發表論文,首次提出一款基於HYDAR框架的28nm混合存內計算(CiR)晶片的推薦系統(RecSys)加速器。這款36M RRAM CiR晶片能實現390K QPS的吞吐率與1574K QPS/W能效比。其建構的多晶片系統可實現百萬級即時端到端推薦系統(RecSys)。▲晶片顯微照片與系統概述在實際推薦系統任務中,CiR通過擴展至576M規模的多晶片系統,QPS提升了66倍,QPS/W提升181倍,精準率與CPU相當。▲晶片性能與當前頂尖設計的對比該晶片的核心優勢包括:採用DL-ADC實現非Top-K計算的早期終止;基於預測的預取調度流水線(PPSP)資料流提升不規則工作負載的吞吐量;由粗到細的檢索架構(coarse-to-fine)在保證系統召回精度的同時,可擴展至大規模應用。01. 引入CiR,實現高吞吐高能效、高精度相似向量檢索推薦系統中的核心運算單元是相似向量檢索(SVS),該方式通過計算查詢向量與大規模向量庫之間的距離,檢索出Top‑K最鄰近向量。SVS會佔據推薦系統絕大部分的計算時間與功耗,主要原因是外部儲存器訪問(EMA)開銷。其中,採用混合鍵合技術的DRAM加速器成本高昂,基於NAND TCAM的加速器存在讀取延遲高、資料與距離表示精度有限等問題。針對上述痛點,研究人員提出一種基於RRAM的數模混合存內計算加速器HYDAR,可實現高吞吐量、高能效、高精度的SVS。基於RRAM的存內計算(Compute-in-RRAM,CiR)因能最大限度減少資料移動、儲存密度高、平行度極大,已被公認為深度學習加速的極具前景的技術路線。但將CiR應用於SVS仍會帶來額外挑戰,如能耗與延遲急劇增加、降低PE利用率與吞吐量、精度降低等。▲面向高效推薦系統的、基於CiR的SVS加速器的研究動機與設計挑戰HYDAR通過CiR PE(存內計算處理單元)、混合晶片設計與多晶片系統架構協同最佳化,解決了上述挑戰:首先是帶動態延遲ADC(DL‑ADC)的CiR PE,其通過多位模擬CiR PE整合DL‑ADC,用於基於直方圖的相似向量檢索,可提前將距離與檢索閾值比較,並跳過非Top‑K向量,從而降低延遲與功耗。其次是基於預測的搶佔式調度流水線(PPSP),通過這種混合晶片機制,預測每個PE的執行階段間、中斷不平衡任務、插入短任務來平衡負載,以適應動態SVS工作流,提升利用率與吞吐量。最後是兩步由粗到精的檢索架構,其軟硬體協同設計框架,先在CiR PE上進行粗粒度檢索以保證高吞吐量,再在數字SVS引擎上進行精粒度檢索,在保證召回精度的同時最大化吞吐量。在此基礎上,基於HYDAR框架,研究人員採用28nm工藝流片實現了一款CiR原型晶片,包含36M RRAM單元,分為16個平行PE,每個PE包含一個288×4096陣列。▲HYDAR整體架構與核心特性及基於CiR的端到端檢索系統02. 採用基於DL‑ADC的SVS高效過濾機制 降低60%延時、71%功耗具體來看基於模擬存內計算單元的直方圖相似向量檢索(SVS)實現,以及支援計算提前終止的DL‑ADC設計。其通過查詢向量與基礎向量之間的距離分佈直方圖來確定Top‑K檢索的截斷閾值(CK)。在歐氏距離框架下,距離超過CK的基礎向量由雙模DL‑ADC過濾,該ADC可動態監測比較結果,實現非Top‑K向量的計算提前終止。歐氏距離計算可在288×4096的CiR陣列上完成,其中每個2T2R單元表示一個4位維度,每一列代表一個256維基礎向量及32維偏置。本設計中,CiR PE在計算過程中將直方圖存入本地直方圖儲存器,隨後同步至跨PE直方圖單元(CHU),合併分佈式結果以生成CK。該論文設計了三條定製指令來執行該流程。在DL‑ADC方面,基於逐次逼近暫存器(SAR)的結構支援提前終止模式(ET),將預生成的CK作為輸入,與每個周期生成的SAR碼一同送入按位比較器。在迭代調整IDAC以逼近ADC輸入電流的過程中,任何一位不匹配都表明計算結果與CK存在差異,觸發提前終止,停止計算並輸出2位向量掩碼(vMask)。最後,通過將DL‑ADC設定為ET模式,距離計算與過濾可同時執行。▲基於動態延遲ADC(DL‑ADC)的直方圖式SVS的CiR實現該ET機制在資料庫規模擴大時效果顯著,平均減少60%的計算時間和71%的功耗,宏單元面積開銷增加7%。03. 預測搶佔式調度,利用率提升至91% 平均查詢延遲降低30%其次是面向SVS負載提出的基於預測的搶佔式調度流水線(PPSP)。查詢在不同PE間平行計算,而每個PE參與計算的基礎向量數量通常不同,這會造成計算周期差異與PE間同步開銷,進而引發調度停頓與流水線氣泡。PPSP採用連續搶佔式調度與動態任務調度器(DTS)解決了這一問題。DTS會對各PE上查詢執行的完成時間戳進行監測與預測。該論文提出的搶佔式調度機制允許新任務搶佔那些即將完成的正在運行任務,這可以消除流水線氣泡、讓任務更早完成、PE更快釋放,以服務後續查詢。在接收到指令時,任務會佔用一個DTS槽位,並將其PE/段掩碼存入任務表,然後作為子任務路由到目標PE的兩個待處理緩衝區之一。DTS同時監控每個任務的預測關鍵結束時間(PCET),其定義為所有子任務PET的最大值。其中的仲裁器檢查PE與正在運行任務的重疊情況,如果新任務的PET可以降低且不影響正在運行任務的PCET,則切換待處理緩衝區以搶佔式調度新任務,從而提升吞吐量、降低延遲。此外,在查詢調度期間,DTS會在後端記憶體分配器中為每個查詢預分配地址空間,使得PE可以直接將結果寫入輸出緩衝區,無需PE間同步,從而實現PE快速釋放以處理新查詢。▲面向動態SVS負載的、所提出的基於預測的搶佔式調度流水線(PPSP)通過以上最佳化,PPSP將PE利用率提升至91%,平均查詢延遲降低30%,QPS吞吐量提升1.82倍。04. 由粗到細兩步檢索 實現系統級四級流水線平行最後是面向SVS、基於CiR的兩步檢索架構。為提升系統精度,該架構整合了數字精檢索引擎,在高吞吐粗檢索結果中精確篩選向量。這使得即使在模擬CiR存在噪聲與低精度處理的情況下,仍能保持高召回精度。該架構還通過多CiR晶片平行擴展了向量庫容量,並支援更廣泛的平行粗檢索,同時採用Thresh‑IVF流程與系統流水線,進一步提升吞吐量。CiR PE分為三類:質心PE(CPE)儲存聚類中心坐標,採樣PE(SPE)儲存從每個聚類中採樣的少量向量,用於表徵分佈並生成CK;全量庫PE(FPE)儲存所有基礎向量,並全程運行在高能效的DL‑ADC提前終止(ET)模式下,在整個流程中佔據92.7%的向量儲存。CiR專用的Thresh‑IVF工作流程包括查詢首先送入CPE,通過IT運算計算查詢與聚類中心的距離,識別最近的聚類;系統將查詢路由到所選聚類的SPE,通過IH在多晶片間生成直方圖,進而生成CK;CK被路由到步驟1所確定聚類的所有FPE,通過IC完成粗檢索ID生成。這種系統級基於閾值的粗檢索,最小化了每個晶片輸出的過濾結果數量,避免了在各晶片上執行相同Top‑K計算帶來的冗餘ID過濾。最後,少量候選ID被送入數字引擎,以FP16格式進行精檢索,使系統級儲存頻寬需求降低97.44%。▲兩步由粗到精檢索系統架構與工作流程該設計實現了系統級四級流水線平行;同時晶片內不同PE也可平行處理不同任務。相較於傳統基於CPU的IVF方案,這種多晶片層級流水線可將延遲降低90.17%。05. 結語:兼顧精度與效率推薦系統算力成本驟降推薦系統在連接使用者與海量內容和服務方面發揮著至關重要的作用,已廣泛部署於電商和串流媒體平台,但作為其核心運算單元相似向量檢索佔據了推薦系統絕大部分的計算時間和功耗。其中採用混合鍵合技術的DRAM加速器提升了頻寬以緩解EMA問題,但其成本高昂,且仍受限於DRAM與邏輯單元之間的資料傳輸瓶頸;基於NAND TCAM的加速器將計算整合到儲存陣列中以減少EMA,但存在讀取延遲高、資料和距離表示精度有限的問題。基於此,這篇最新研究提出了一款高效的SVS加速器,能在保證高吞吐量檢索的同時,不犧牲召回精度,進一步降低推薦系統的功耗。 (芯東西)
《飛馳人生3》最狠的角色不是張馳,是那個沒露臉的AI
不得不說,2026春節檔的《飛馳人生3》確實燃。全新的沐塵100賽道,車手的血性與執念——每一幀都像在觀眾心上踩油門。(以下內容含輕微劇透,介意的朋友可以先收藏,看完電影再來對線。)圖源:微博@電影飛馳人生3不過作為一個汽車行業的觀察者,電車通更在意影片中的一條暗線:人類車手 vs AI賽車系統。這可能是整部電影最具現實意義的其中一部分。電影中,「天梯」車隊改採用的ss8晶片以及AI賽車系統,堪稱「賽道外掛」。它能在大霧瀰漫、能見度幾乎為零的險境中,精準感知每一吋彎道;無需領航員,車輛自己就能感知環境、預判路況。不僅如此,系統還能即時調校動力輸出與底盤參數。正如片中角色「百強」所說,「比賽結果,可以在會議室裡談嘛!」這句話不僅暴露了競技異化為權力遊戲的本質,還把賽車運動變成了一場極致理性的計算。張馳,則依靠經驗、直覺與勇氣,只靠最基礎的ss1晶片的情況下,與最新的AI技術展開較量。故事的最後以張馳險勝結束,但這場對決,可不是「人類贏了」或「科技贏了」那麼簡單。AI與人類並非對立,而是「一起成長」影片沒有把AI塑造成反派,也沒有把人類車手神化,而是用一場賽道對決,強調AI在行業裡的「輔助」角色。在電車通看來,整部電影已經說清了兩個觀點。第一,AI最大的價值,是填上人類經驗裡那些「說不準」的短板。人類開車,靠的是手感、經驗、臨場反應,但這些都存在天然侷限。片中最直接的呈現是,在夜間+大霧的極低能見度下,車卻還能高速過彎。這靠的不是車手的眼力,而是AI系統在持續感知、持續決策。還有,AI可以不間斷地分析路面附著力、輪胎情況、車身姿態、坡度彎道,自動調整懸架軟硬、動力輸出、剎車力度,甚至提前預判危險並修正軌跡,為車手提供當下最合理、最安全的方案。放到現實駕駛中,AI的優勢同樣成立:人會分神、會疲勞,也可能會判斷失誤,但成熟的AI不會;人能感知的範圍有限,AI卻能同時盯著攝影機、雷達、地圖、車聯網;人憑經驗摸個大概,AI靠演算法給出最優解。圖源:長城汽車現如今,各家主流車企的輔助駕駛系統已經離不開AI,但市面上對AI、輔助駕駛的爭議依舊存在,但AI壓根不是來搶方向盤的,它是來給人兜底的。但影片同時也明確傳遞了另一個核心:人類駕駛中的有些東西,是AI無法創造出來的。張馳能夠超越對手,靠的不只是技術與策略,更是敢於做出AI意料之外的選擇。片中張馳的賽車引擎蓋突然掀開,視野幾乎完全被遮擋,正常邏輯只能停車處理。但在賽車場上,停車就等於放棄。張馳的選擇是連續三次飛坡,硬生生把引擎蓋震掉。這種操作,AI就算再算一萬遍也算不出來。事後,車機系統表示:「你的行為超出我的計算,我需要成長。」緊接著,「孫宇強」說出那句戳中人心的台詞:「那好啊,我們一起成長。」這可能就是AI和人類最理想的關係:不是誰取代誰,而是彼此成就、一起進化。圖源:微博@電影飛馳人生3反觀片中的「天梯」車隊,晶片最新、資料最全、演算法最強,擁有頂級的資源,可到了關鍵時刻,他們反而不敢突破,只會選擇AI給出的保守方案。最後沖線前,要不是張馳提醒「胎壓再大膽提高0.3Bar」,「天梯」車隊可能連第二名都拿不到。人類負責把握方向、賦予意義、享受駕駛本身;AI負責降低風險、提升效率、最佳化體驗。因此,AI越強,越能把人從那些煩瑣、危險、重複的操作裡解放出來。當你真正理解這層關係後,也就不會再陷入「AI會不會取代司機」的無謂焦慮。AI正在重構整個汽車行業電影裡的AI能輔助賽車精準過彎、即時調校參數,這份看似只屬於賽場的「外掛」,在現實中已經走進了我們的家用車,最直觀的體現,就是我們每天都在接觸的智能座艙與智能輔助駕駛。智能座艙不再是簡單的語音控空調、開導航,基於大模型的多模態互動,早已實現了真正的多模態自然互動。它能流暢聽懂連續複雜指令,精準識別各地方言,不用你一字一句說得標準清晰,甚至能感知駕駛員的狀態,主動調節氛圍燈、音樂風格與空調溫度。輔助駕駛層面的AI進步,則更為直觀、更具顛覆性。經過海量資料訓練與持續迭代的AI輔助駕駛系統,比如華為乾崘智駕、小鵬XNGP等,早已不只是簡單的跟車,而是能即時分析路況、車流、訊號燈,規劃出最安全、最高效的行駛路線,更能在不斷學習中,適配不同駕駛員的行為習慣與駕駛偏好,讓轉向力度、跟車距離、超車邏輯都越來越貼合車主的日常風格。圖源:電車通攝製但這兩個方面,只是我們普通消費者能直觀感受的AI。當智能化浪潮來襲,AI早就滲透進了造車的整個體系鏈。就拿賽力斯和吉利為例,他們對AI的應用早已超出產品本身。賽力斯旗下的問界M7、問界M8、問界M9等爆款車型,月銷量輕鬆突破萬輛。為了保證足夠高的產出效率,賽力斯超級工廠必須用智能製造實力作支撐,目前已經用AI技術實現了關鍵工序100%自動化生產、過程質量資料100%自動化採集。同時,賽力斯與寧德時代深度合作,首創電池「廠中廠」模式,通過AI打通開發、質量、生產全鏈路資料,實現協同同步,大幅提升生產效率與交付速度,讓爆款車型不再受制於產能瓶頸。吉利更是早早地擁抱AI,選擇從底層架構推進全域智能化。在CES2026期間,吉利發佈了全域AI2.0體系,底盤、車身等各子域打通,構成了一個有機的智能整體,使用者只需一句自然語音指令,就能觸發多個智能體協商協作,實現真正的「一句話控全車」,把智能體驗做到更極簡、更流暢。圖源:雷科技攝製於CES2026不難想像,在未來的汽車行業,AI的重要性還會持續顯現。寫在最後回看《飛馳人生》系列,其實也可以看作是一部濃縮的汽車產業進化史。第一部講的是純粹的熱愛與賽車精神,大家拼的是技術與勇氣;第二部開始逐步擁抱新能源,電機的重要性逐漸顯現;到了第三部,賽場內外的核心競爭力,已經清晰指向AI,演算法強弱、資料積累、智駕落地能力,直接決定了一家車企能否在激烈競爭中站穩腳跟。這可並非導演、編劇的想像,是現實本就如此,而且更重要的一點是,電影裡的AI還在學習,現實裡的AI已經跑得更遠了。賽道終會落幕,但汽車行業的「智能化飛馳」才剛剛開始。AI已經變成我們每天握著的方向盤、坐進去的座艙,甚至看不見的生產線。智能座艙不再等著你下指令,它學會了察言觀色;輔助駕駛不再生硬地按規則執行,它開始理解你的習慣。它不再是個「可選配置」,而是成為汽車行業的地基。 (電車通)
狂燒2000億!小米拼了
前段時間,雷軍正式宣佈小米將在未來五年投入至少2000億的研發資金,並在後續的民營企業座談會上直接透露:小米接下來的五年將會重點攻堅晶片、AI、作業系統等底層核心技術。晶片、AI、作業系統,說實話每一個單拎出來都不是善茬,小米卻想著“全都要”,那也怪不得要砸2000億。而且真要說的話,2000億還得花在刀刃上才能看到成果,畢竟光晶片一項,投入都是以十億計數的。圖源:微博雖然錢砸得不少,但是對於小米來說卻是物有所值,因為在2020年時,雷軍其實宣佈過一個差不多的計畫:從2020年開始,在接下來五年投入1000億進行技術研發,而截至2025年底,這項投資的總額定格在1050億。千億研髮帶來的效果是顯著的,短短5年時間小米數字系列就成為中國市場最暢銷的旗艦手機,而小米汽車則成為崛起最快的新勢力品牌,小米AIoT如今已是國內最大規模的IoT生態。但是,與2020年時不同的是,小米這次關注的是更底層、更基礎的領域,這些領域的進展體現到產品和營收上可能會慢很多,甚至明面上的效果還不如2020年的1000億,那麼小米為什麼還要做這些“吃力不討好”的事情呢?沖高端,自研是唯一道路自從去年5月份發佈首款自研3nm旗艦SoC晶片“玄戒O1”後,小米其實一直都在試圖扭轉外界對這個品牌的印象:我們已經不再是以“網際網路思維”和“供應鏈整合”為核心的企業,小米的“硬科技”才是驅動這家企業成長的核心力量。事實上,直到現在還有不少網友將小米稱為“組裝廠”,認為小米的產品技術都來源於供應商,這個觀點顯然不對,畢竟這麼多年了,也不見得有第二家“小米”出現在手機行業。不過,當我們回顧過去幾年的手機市場,你會發現多數創新都集中在系統更新、影像演算法升級等層面,其根基確實是建立在上游供應鏈的基礎上。對於一直致力於衝擊高端市場的小米來說,“組裝廠”的標籤幾乎是品牌層面的最後絆腳石,而想要搬走這個石頭,只有一個“笨辦法”——自研。圖源:小米而在自研領域裡,晶片則是毋庸置疑的“皇冠”,特別是在國內外的半導體競爭愈發激烈的當下,一顆足夠出色的自研晶片就可以轉變很多路人對一個品牌的印象。小米的自研晶片計畫其實起步很早,在2017年時就推出過一顆面向中端市場的“澎湃S1”,因為體驗不佳等問題,最終“一代而亡”。澎湃S1的繼任者直到8年後的2025年才發佈,而在這段時間裡,小米的自研晶片力量都集中在充電、影像等領域,雖然也有進展,但是終究無法像核心SoC那樣在終端性能層面帶來本質上的體驗區別。所以,小米最終還是拿出了玄戒O1,證明自己有設計頂級SoC的能力,而在許多評測裡,玄戒O1的能效甚至超過了同年的其他兩個旗艦移動平台,這就是深度整合與最佳化帶來的效果。而且自研核心晶片也是對“組裝廠”標籤的最有力回擊,當所有Android旗艦都在使用相同的處理器時,手機廠商就只能在散熱面積、外觀材質和行銷話術上內卷,這種高度同質化的產品,其實很難在高端市場說服消費者“更換門庭”。圖源:小米就拿iPhone來說,消費者除了買蘋果的設計和功能外,其核心是購買A系列晶片與iOS系統所帶來的獨一無二的體驗,所以小米想要站穩高端,單靠徠卡聯名或是首發驍龍旗艦晶片已經不夠了,必須提供一個只有小米才能給到的“差異化體驗”。當小米在發佈會上不再僅僅羅列供應商的參數,而是深入講解自家晶片的微架構設計、自研作業系統的底層最佳化機制時,它在路人的眼中自然就會變得不一樣,別管黑子們的嘴硬,至少支撐品牌價值提升、對抗蘋果與華為等頂尖對手的必要條件是有了。不過說實話,晶片領域一直是資金與技術的“黑洞”,有時候幾十億丟進去都只能聽個響,從前期的預研,到實際的研發,再到後期的流片,每一個步驟都需要花費大量的資金,僅拿流片來說,3nm製程的單次流片成本就達到數千萬美元,這是個沒錢的玩家壓根無法進場的行業。小米的2000億投資,就是在敲開這扇門後繼續走下去的保障。小米的人車家,還差什麼?而在晶片之外,對於小米使用者來說,最值得關注的還是自研系統,甚至可以說這才是小米接下來五年的最核心領域。從小米汽車發佈後,我們經常能夠看到雷軍提到一個概念:人車家,基於小米生態實現的智能互聯體驗,才是將使用者綁在產品生態上的關鍵。但是,缺乏自研底層技術的生態互聯往往是表層的,特別是不同終端系統之間的互聯,對軟體的最佳化要求極高。如果小米想讓人車家生態徹底落地並普及,死磕自研系統基本是唯一的方法,而且可以搭配自研晶片,組成一套完整的軟硬體體系。比如使用者拿著搭載玄戒晶片的小米手機靠近小米汽車時,不僅可以得到更快速、無感的開關鎖體驗,還可以讓汽車在使用過程中與手機聯動,借助手機晶片的性能處理任務。圖源:小米為什麼要讓手機與車機聯動?其實這就涉及到一個智能生態裡非常火的概念“主動式智能”,簡單來說就是AI不再是一個等待指令的工具,而是會根據使用者的習慣、日程、需求主動提供幫助的智能體。舉個例子,小雷在飯點時開車導航到附近的一個購物中心,AI會判斷你打算去就餐,然後詢問你是否需要推薦餐廳,或者是否查看常去餐廳的排隊情況。如果你想得到以上體驗,那麼就必須依賴於手機系統與車機系統的資料互通(為什麼?不妨看看你的手機app們)。如果可以將手機的隱私資料不經雲端(走UWB協議)就直接共享給車機,就可以在規避隱私洩露問題的同時為使用者提供細緻的智能體驗。更進一步地說,當小米汽車的存量達到一定等級後,它們本身也能組成一個新的邊緣計算網路,為周圍的小米手機提供算力支援,不過這就是系統生態完全統一之後的事情了。AI模型,小米生態的最後一環至於最後一個類股——AI模型,說實話現在曝光出來的資訊還不多,小米的保密目前來看做得挺好的,只不過雷軍表示模型的進展遠超預估,那麼我們就暫且認為進展順利吧。AI模型在未來智能生態中的地位有多重要,應該就不用小雷再重複敘述了,對於小米來說,AI模型將會是其打通所有裝置生態的鑰匙,基於小米自研系統的互聯,小米自研AI模型可以輕鬆解決隱私等層面的關鍵問題。而且,自研模型的最大優勢在於能夠根據需求進行蒸餾最佳化,比如將其從一個兆參數的模型濃縮成數百億規模的小模型,如此一來就可以將其從雲端模型轉成端側模型,無需擔心隱私洩露或網路延遲導致的使用問題,這對於同時在部署智能駕駛和智能助手生態的小米來說是必要的一環。從晶片到系統再到AI,其實不難發現小米的底層技術研發計畫,都是圍繞著打造一個完善的智能生態鏈的目標設計的,如果小米可以完成這個計畫,那麼也將成為少數能與蘋果、華為並駕齊驅的企業。說實話,在智能裝置高度內卷的今天,單純的模式創新已走到盡頭。這2000億,是小米換取未來十年智能生態核心牌桌席位的入場券,這條全端自研的道路註定困難,但對於小米而言,這也是一場已經沒有退路的硬仗。 (雷科技)
價值1000億美元!AMD與Meta達成6吉瓦AI晶片交易!
當地時間2月24日,人工智慧(AI)晶片大廠AMD宣佈和Meta達成了一項多年的合作協議,Meta將部署高達6吉瓦的AMD Instinct GPU為其的AI基礎設施提供動力。有分析稱,該協議價值約1000億美元。最新的合作協議拓展了雙方現有的戰略合作夥伴關係,並在晶片、系統和軟體方面協調發展路線圖,旨在為 Meta 的工作負載量身打造 AI 平台。Meta將部署MI450 GPU和Helios機架方案,今年下半年開始交付Meta部署的首批AI系統是基於AMD Instinct MI450 架構定製的GPU和代號為“Venice”的第六代AMD EPYC CPU,運行 ROCm 軟體,並基於 AMD Helios 機架級架構建構,該機架級架構由AMD 和Meta通過開放計算項目 (Open Compute Project)聯合開發,旨在實現可擴展的機架級 AI 基礎設施。預計將於2026年下半年開始發貨。(相關文章:AMD發佈Helios機架:18個2nm CPU+72個MI455,FP4算力2.9EFLOPS!)AMD董事長兼首席執行長蘇姿丰博士表示:“我們很榮幸能與Meta公司拓展戰略合作夥伴關係,助力他們以前所未有的規模突破人工智慧的界限。此次合作將持續多年,涵蓋Instinct GPU、EPYC CPU和機架式人工智慧系統,使我們的產品路線圖保持一致,從而為Meta的工作負載提供高性能、高能效的最佳化基礎設施,加速業界規模最大的人工智慧部署之一,並將AMD置於全球人工智慧建設的核心地位。”Meta創始人兼首席執行長馬克·祖克柏表示:“我們很高興與AMD建立長期合作夥伴關係,共同部署高效的推理計算能力,並提供個人超級智能。這對Meta而言是實現計算多元化的重要一步。我期待AMD在未來多年裡繼續成為我們重要的合作夥伴。”Meta將成為Venice CPU主要客戶除了在GPU領域的合作之外,AMD和Meta正在拓展雙方在AMD EPYC處理器領域的合作關係。Meta與AMD已攜手走過數代產品,在其全球基礎設施中部署了數百萬顆AMD EPYC CPU以及大量的AMD Instinct MI300和MI350系列GPU。AMD表示,隨著AI基礎設施規模和複雜性的不斷增長,CPU已成為AI計算堆疊的戰略支柱,與GPU共同實現效率、可擴展性和編排能力。基於雙方產品路線圖的深度契合,Meta將成為第六代AMD EPYC CPU(代號“Venice”)和下一代EPYC處理器“Verano”的主要客戶。“ Verano”處理器針對特定工作負載進行了最佳化,旨在提供卓越的每瓦性能。蘇姿丰表示,Meta計畫採購的這款定製CPU將經過精心調校,在提供強大性能的同時,儘可能降低能耗。該協議將涵蓋AMD的兩代CPU。“毫無疑問,馬克·祖克柏對他想要實現的目標非常有雄心壯志,我們希望利用我們技術的方方面面來真正幫助 Meta 實現這一目標,”蘇姿丰說道。Meta的多元化戰略:自研晶片繼續推進不過,Meta並不希望依賴於少數晶片供應商,而是希望多元化。祖克柏在聲明中也強調:“對於Meta而言,這是實現計算多元化的重要一步。”就在幾天之前的2月17日,Meta也與輝達(NVIDIA)宣佈建立多年、跨世代的戰略合作夥伴關係。Meta將實現輝達 CPU 和數百萬個Blackwell 和 Rubin GPU 的大規模部署,以及將輝達 Spectrum-X 乙太網路交換機整合到 Meta 的 Facebook 開放式交換系統平台中。同時,Meta也在持續推進自研晶片。Meta 的基礎設施負責人 Santosh Janardhan 在與記者的電話會議上也表示,Meta 計畫繼續從其他供應商購買晶片,同時開發自己的內部處理器。對此,蘇姿丰也表示,“Meta有很多選擇。我希望確保在他們考慮下一步需求時,我們始終擁有發言權。”Meta已承諾在未來幾年內至少投資6000億美元用於美國的資料中心和人工智慧基礎設施建設,其中包括預計2026年1350億美元的資本支出。Meta最近公佈了在印第安納州建設一座價值100億美元的燃氣資料中心園區的計畫,該園區設計計算能力為1吉瓦。Meta可認購10%的AMD股份作為協議的一部分,為了進一步協調雙方的戰略利益,AMD也將向Meta授予了一份為期5年的基於業績的認股權證,每股行權價為0.01美元,最多可認購1.6億股AMD普通股,約佔公司股份的10%。該認股權證將根據與Instinct GPU出貨量相關的特定里程碑逐步授予。首批認股權證將在Instinct GPU出貨量達到1吉瓦時授予,後續認股權證將隨著Meta的採購量增長至6吉瓦而逐步授予。此外,認股權證的授予還與AMD股價達到特定閾值掛鉤,而Meta能否行使認股權證則取決於其是否達成關鍵的技術和商業里程碑。據《華爾街日報》報導,全部股票獎勵取決於AMD的股價,股價需要達到600美元,Meta才能獲得最後一筆股票獎勵。AMD股票周一收於196.60美元。AMD執行副總裁、首席財務官兼財務主管 Jean Hu 表示:“我們預計此次合作將推動公司未來多年營收大幅增長,並提升我們的非GAAP每股收益,這標誌著我們在實現雄心勃勃的長期財務模式方面又邁出了重要一步。這種基於業績的合作模式也使AMD和Meta在執行力和長期價值創造方面緊密結合。”需要指出的是,AMD此次與Meta達成的合作協議與去年和OpenAI達成的協議基本一致。2025年10月6日,AMD與OpenAI共同宣佈,雙方達成一項6吉瓦的協議,為OpenAI的下一代AI基礎架構提供動力,該基礎架構將基於多代AMD Instinct GPU。首批1吉瓦的AMD Instinct MI450 GPU部署預計將於2026年下半年開始。同時,AMD將向OpenAI發行了至多達1.6億股AMD普通股的認股權證,如果OpenAI行使全部認股權證,將可以獲得AMD約10%的股權。受該利多消息刺激,AMD在2月24日美股盤前交易中一度大漲超15%,隨後的盤中交易也一度大漲超10%,最終收盤上漲8.77%,報收於213.84美元/股,市值3486.47億美元。 (芯智訊)
贏麻!蘇姿丰獨家!簽下Meta千億晶片“賣身契”:黃仁勳要哭了!
附加協議:。對賭繫結!Meta可按1美分買10%股份AMD CEO Lisa Su: We want to place bets on who will be AI winners going forward一、突襲暴擊!蘇姿丰截胡輝達!千億大單趕在財報前官宣!誰懂啊家人們!科技圈年度最大瓜猝不及防砸臉——2月24日,AMD掌門蘇姿丰直接放大招,官宣和Meta簽下千億級“賣身契”,未來幾年Meta要狂買最多6吉瓦的AMD AI晶片,總價值直接干超1000億美元(另有消息稱五年期600億美元,約4130億人民幣),說是蘇姿丰獨家拿下的王炸大單,一點不誇張!最絕的是官宣時間——偏偏趕在輝達發財報的前一天!這波操作堪比“在對手慶功宴前掀桌子”,明擺著就是給黃仁勳添堵,主打一個“我得意地笑”。要知道,過去幾年AI晶片圈就是輝達的一言堂,GPU市場佔比超90%,黃仁勳穩坐頭把交椅,誰能想到,蘇姿丰直接帶著AMD從他手裡搶下了Meta這塊肥肉,還是千億級的大單子,說一句逆襲爽文都不為過。更有意思的是,這已經不是蘇姿丰第一次出其不意了。幾個月前,她就帶著AMD和OpenAI簽了一模一樣的協議,同樣是6吉瓦採購量,同樣的合作模式,如今再拿下Meta,相當於AMD手裡攥著兩大巨頭的長期訂單,合計超12吉瓦,蘇姿丰這是要組團掀翻輝達的壟斷啊!二、對賭繫結!1美分買10%股份!這單交易最勁爆的瓜,根本不是千億金額,而是藏在協議裡的“暗箱操作”——蘇姿丰直接給了小扎一個“天上掉餡餅”的福利:允許Meta以每股1美分的白菜價,買入最多1.6億股AMD股票,差不多佔AMD總股本的10%!當然,天下沒有免費的午餐,這便宜不是白佔的。這些股票要分批解鎖,前提是Meta完成約定的採購量,而且AMD的股價得漲到600美元才行。要知道,公告當天AMD的收盤價才196美元,這意味著小扎要賭AMD股價翻三倍,而蘇姿丰則賭Meta會一直乖乖買AMD的晶片,說白了,就是兩大巨頭的“賭徒式繫結”,雙方都把籌碼擺上桌,賭對方能成。蘇姿丰在接受CNBC採訪時,毫不掩飾自己的野心,直言這是AMD歷史上最具變革性的交易,還放話“我們想預測AI領域的贏家是誰”。這話翻譯過來就是:我賭AMD能贏,也賭Meta能一直幫我贏,黃仁勳的時代,該變一變了!要知道,蘇姿丰可是從破產邊緣把AMD拉回來的狠角色,年薪4個億,25歲就拿到MIT博士學位,連黃仁勳都是她表舅,如今親外甥女要搶表舅的飯碗,這瓜越吃越有味道。三、META:左手輝達、右手AMD說到這裡,就不得不提小扎的“端水大師”操作了。一邊是剛和蘇姿丰簽千億大單,另一邊,一周前他才剛宣佈要買幾百萬塊輝達的最新款GPU,包括Blackwell和Rubin系列,花費也高達幾百億美元,相當於左手抱輝達,右手摟AMD,兩邊都不得罪,主打一個“雨露均霑”。小扎這麼做,說白了就是“怕被卡脖子”。畢竟過去幾年,AI晶片市場被輝達壟斷,Meta作為大客戶,要是一直只依賴輝達,萬一那天輝達斷供、漲價,Meta的AI佈局就徹底涼了。而且小扎的胃口大得嚇人,2026年光資本支出就要花1350億美元,比去年多70%以上,未來十年還要部署幾十吉瓦的算力,長期甚至要到幾百吉瓦,這麼大的需求,只靠輝達一家,根本喂不飽。更絕的是,小扎不光靠外購,還在偷偷自研晶片MTIA,主打一個“多管齊下”——用自研晶片保底,用輝達的晶片沖性能,用AMD的晶片控成本,既不被任何一家供應商綁架,又能實現利益最大化。不得不說,小扎這算盤打得,隔著螢幕都能聽到響聲,而蘇姿丰能讓小扎願意放下輝達,專門和AMD簽對賭協議,足以看出她的實力和底氣。四、格局鬆動!蘇姿丰破局,輝達慌了?這單交易一官宣,市場直接炸了鍋,AMD股價早盤直接暴漲8.77%,而輝達下跌約1%,博通下跌約2%,高下立判。這背後,是AI晶片市場的格局開始鬆動了——過去是輝達一家獨大,黃仁勳說一不二,如今蘇姿丰帶著AMD殺出來,拿下Meta和OpenAI兩大巨頭的訂單,相當於給行業撕開了一個口子,終於有第二個選項能和輝達抗衡了。當然,瓜吃歸吃,分析師們的疑慮也藏不住了。有人說,AMD之所以願意給Meta這麼大的優惠,允許1美分買股份,本質上還是自己底氣不足,只能靠頭部客戶的大單拉動需求;還有人擔心,這種“交叉持股+長期採購”的模式,會形成風險傳導,一旦其中一方翻車,另一方也會被拖累。更關鍵的是,蘇姿丰押注的推理算力市場,雖然被認為是未來的風口,規模可能遠超模型訓練裝置,但目前商業化回報還沒完全兌現,AMD投入這麼多,能不能轉化為持續的現金流,還是個未知數。而且AMD的MI450晶片,雖然配置拉滿(2奈米工藝、432GB HBM4記憶體),還是和Meta聯合設計的定製版,但能不能打過輝達的下一代產品,還得看實際表現。不過不管怎麼說,這波蘇姿丰是徹底贏麻了。從破產邊緣逆襲,到拿下千億大單,再到敢和輝達正面硬剛,這位華裔女掌門用實力書寫了爽文。至於黃仁勳會不會反擊,小扎的端水大師之路能不能走下去,AMD的股價能不能漲到600美元,這後續的瓜,咱們還得慢慢蹲! (深科技)
一年12倍晶片大牛閃崩!被做空機構精準點穴:沒資格與輝達坐一桌
周二,美國知名做空機構香櫞研究(Citron Research)在X上發帖稱,該公司正在做空SanDisk Corp.(晟碟,SNDK)的股票,並指出輝達擁有護城河,但晟碟賣的只是大宗商品。受此影響,晟碟股價一度大跌近8%,最終收跌4.2%,報638.52美元/股,總市值942億美元。不過,晟碟在過去12個月的時間內暴漲了12倍,光是在2026年就漲169%。香櫞研究在帖子中稱: “市場對晟碟的定價就像對輝達一樣。但問題是:輝達擁有護城河,而晟碟賣的是一種大宗商品。我們以前就見過這種情況:2008年、2012年、2018年。這次也不會有什麼不同。記憶體市場是一個周期,而周期總會達到頂峰。”香櫞研究指出晟碟主要經營的記憶體市場面臨周期性壓力,並補充說三星在該領域已經處於領先地位:“三星30年來一直選擇市場份額而非利潤率。三星一直以來都優先考慮市場份額而不是利潤率,等待像晟碟這樣的純快閃記憶體晶片廠商實現盈利後,再增加供應並壓低價格。”“三星在將最先進的晶片轉移到高端固態硬碟領域時,他們不會出售利潤率低於50%的產品,而且他們正將最好的晶片推向晟碟賴以生存的高端固態硬碟市場,”香櫞研究補充道。“他們不再僅僅是容量巨頭了。他們正用更便宜、更新的技術搶奪晟碟的優質客戶。”香櫞研究還指出,目前唯一造成供應緊張的瓶頸終究會過去。隨著產能翻番,這種所謂的“短缺”不過是供應海市蜃樓,可能在一次財報電話會議上就消失殆盡。香櫞研究還強調,長期投資者西部資料近期出售了其持有的部分晟碟股份,計畫用所得資金償還債務。香櫞研究表示,他們認為西部資料此次出售股份是因為該公司已經意識到儲存器市場周期正在衰退。“當電視評論員們拍桌子叫囂著讓散戶們趕緊拋售股票時,長期投資者西部資料幾天前就拋售了相當一部分持倉,跌幅達25%。想想為什麼?因為他們知道周期即將見頂,所以他們沒有坐等收盤,”香櫞研究說道,並補充說儲存器市場是有周期性的,而周期終有頂峰。香櫞研究由安德魯·萊福特(Andrew Left)於2001年創立。該機構主要通過發佈調查報告質疑上市公司,以實現做空獲利。其早期以狙擊多家中概股聞名,2011年做空東南融通致其退市,2012年做空恆大地產曾引發股價劇烈波動。2020年,該機構連續發佈報告指控跟誰學財務造假。2021年,香櫞宣佈停止發佈做空報告,轉向提供多頭交易機會。2024年,美國證監會對其提起民事欺詐訴訟。 (美股財經社)
倆月了,一個也沒賣到中國去
倆月了,任是黃仁勳多方奔走、積極遊說,輝達對華晶片銷售似乎依舊毫無起色。據彭博社等24日報導,當地時間周二,美國商務部出口執法助理部長戴維·彼得斯(David Peters)透露,在川普政府批准對華出口人工智慧(AI)晶片兩個月以來,輝達公司仍尚未向中國售出任何H200晶片。當天在眾議院外交事務委員會的聽證會上,民主黨眾議員雪梨·卡姆拉格-達夫(Sydney Kamlager-Dove)問及已有多少H200晶片獲批對華銷售時,彼得斯直言:“據我瞭解,截至目前,數量為零。”中國駐美大使館與輝達均未對此予以置評。報導指出,彼得斯做出這番證詞的時機非常微妙:投資者正等待輝達擬於周三發佈的財報,屆時該公司可能會闡述其在重返利潤豐厚的中國市場方面取得的進展。2025年4月30日,黃仁勳出席在白宮舉行的活動,與美國總統川普握手。 IC Photo據報導,彼得斯在聽證會上還重點表示,美國正加大力度打擊人工智慧領域的先進半導體走私行為,將以強硬手段查處違反出口管制規定的企業。當被問到輝達與中國人工智慧初創企業深度求索(DeepSeek)工程師的合作是否涉及違規行為時,彼得斯拒絕置評,僅表示“無論違規者是誰,都將一視同仁地執法”。但在半導體走私問題上,彼得斯聲稱,相關活動“確實存在”且“正在發生”,並將其列為商務部工業與安全域(BIS)執法工作的優先事項;為強化震懾,他還提議將相關案件訴訟時效延長至10年,處罰金額提高至所謂非法交易價值的四倍以上。無獨有偶,近日有川普政府高級官員炒作稱,DeepSeek的AI模型使用了輝達最先進的AI晶片進行訓練,此舉可能違反美國出口管制。美方妄稱DeepSeek需要將相關裝置移除。2月24日,外交部發言人毛寧在例行記者會上對此回應表示,不瞭解相關具體情況。關於美國輸華晶片問題,中方已經多次表明了原則立場。路透社報導指出,由於美方相關流程中設定的管控限制,先進AI晶片的對華出貨仍處於停滯狀態。去年12月8日,美國總統川普宣佈,將允許輝達對華出口其H200晶片。不過,他同時稱,此決定有附帶條件,包括保障美國所謂“國家安全”,且美國政府將獲得25%的分成,美商務部正在敲定協議細節。消息一出,輝達隨即要求供應鏈增產H200晶片,預判中國客戶需求旺盛。然而兩個月後,英國《金融時報》援引知情人士報導稱,美國政府仍然正在進行所謂“國家安全審查”,許可證尚未發放,H200對華銷售最終審批懸而未決。今年1月,美國商務部雖發佈新規放寬H200晶片對華出口限制,但要求國務院、國防部、能源部聯合審查所有許可證申請。有消息源透露,商務部已完成評估,但國務院堅持推動更嚴格限制,聲稱要“降低中國利用H200晶片損害美國國家安全的風險”,這一立場讓輝達方面十分沮喪,有知情人士直言“國務院把事情變得非常困難”。知情人士還透露,多重不確定性之下,中國客戶在許可條件不明朗前未向輝達下達訂單,部分供應商也已暫停生產H200晶片的關鍵元件。年初,輝達創始人兼首席執行長黃仁勳再度密集訪問中國多個城市,走訪上海、深圳和台北。黃仁勳曾密集走訪上海、深圳、台北等中國城市時也坦言,因中方仍在評估相關產品元件進口許可,公司尚未收到 H200 新訂單;他雖強調 H200 高度適配中國市場、客戶需求強烈,卻也只能表示出口許可正處於最終審批階段。期間他曾透露,由於中方仍在決定是否允許進口輝達的產品元件,因此該公司尚未收到中國客戶對於H200晶片的訂單。據黃仁勳所說,在華數日行程中,他雖與客戶、官員會面洽談,但尚未收到任何H200晶片新訂單。他一方面強調H200高度適配中國市場、客戶需求強烈,另一方面也坦言,相關出口許可仍處於最終審批階段。在1月29日的外交部例行記者會上,有法新社記者援引有關報導提問稱:“中國已批准進口首批輝達的H200人工智慧晶片。外交部能否證實?對中美關係來說,此舉釋放了什麼訊號?”對此,外交部發言人郭嘉昆回應說:“我們已多次就有關問題作出回應,具體問題建議向中方主管部門進行詢問。” (觀察者網)