#AI晶片
商湯自研車規AI晶片,發佈!
芯向智行!商湯自研車規晶片破局,領跑智能汽車AI算力新賽道在智能汽車產業全速邁向高階智駕的關鍵階段,車規級AI晶片作為核心“大腦”,成為行業競爭的核心制高點。近期,商湯憑藉多年技術深耕與全端自研實力,迎來重磅產業化突破——商湯科技自研的「STPU 3.0車規級AI晶片」正式實現規模化量產,憑藉頂尖能效比與高性價比優勢,成功打入長城、比亞迪等主流車企供應鏈,鎖定超120萬套域控製器訂單,成為商湯近期最具份量的硬核成就,也徹底打破海外晶片在國內智駕算力領域的長期壟斷,為國產智能汽車產業築牢自主算力底座。這款由商湯完全自主研發的STPU 3.0晶片,核心性能指標堪稱行業標竿,尤其在能效比層面實現跨越式突破,達到400TOPS/W,大幅領先業內主流的輝達Orin晶片,徹底解決傳統智駕晶片算力強、功耗高、成本高的行業痛點。商湯針對智能汽車場景專屬最佳化晶片架構,兼顧高階輔助駕駛、智能座艙、車內外感知等多重需求,在保證極致算力的同時,大幅降低整車能耗與硬體成本,相比海外同類晶片,商湯這款自研晶片具備近40%的成本優勢,既能滿足車企規模化量產需求,又能有效下沉至更多主流車型,讓高階AI算力普惠更多消費者。商湯STPU 3.0晶片的量產落地,並非單純的硬體突破,而是商湯科技全端式AI技術閉環的集中體現。商湯依託自身深耕多年的電腦視覺、多模態大模型與智駕演算法優勢,實現晶片、演算法、域控製器的深度協同最佳化,打破“晶片+演算法”分離的行業常規,打造出一體化智能汽車解決方案。不同於單純的晶片設計廠商,商湯從底層晶片架構到上層智駕應用全程自主把控,晶片可完美適配商湯自研的城區NOA、高速領航、自動泊車等全套智駕方案,感知精度、響應速度與系統穩定性遠超行業通用方案,這也是商湯能夠快速拿下頭部車企大額訂單的核心競爭力。產業化落地層面,商湯這款自研晶片已進入批次裝車階段,相關智能座艙與智駕域控製器產品,逐步搭載於多款熱門量產車型,上半年智能汽車業務收入同比激增213%,成為商湯業績增長的核心新引擎。截至目前,商湯視覺AI與晶片方案累計賦能車型出貨量突破100萬輛,在中國汽車座艙視覺AI軟體市場連續多年穩居份額第一,隨著STPU 3.0晶片的持續放量,商湯在智能汽車領域的市場份額將進一步提升,穩固行業頭部地位。商湯用實打實的量產成果,證明了國產AI晶片完全具備比肩國際頂尖水平的實力,更走出了一條“演算法+晶片”深度融合的差異化賽道。此次商湯自研車規晶片的成功量產,不僅是商湯自身技術實力的重大跨越,更為整個國產智能汽車產業注入強大信心。長期以來,高端車規級AI晶片市場被海外廠商壟斷,國內車企面臨供應鏈受限、成本居高不下的困境,商湯的突破直接填補了國產自主車規AI晶片的高端空白,助力國內車企擺脫海外晶片依賴,實現核心零部件自主可控。同時,商湯依託晶片量產優勢,持續完善智能汽車生態佈局,聯動上下游產業鏈夥伴,推動智駕技術快速迭代,助力中國智能汽車產業邁向全球價值鏈高端。從實驗室研發到規模化量產,從技術突破到產業賦能,商湯始終堅持長期主義與原創初心,一步步攻克核心技術難關。商湯科技此次車規晶片的重磅落地,是商湯深耕智能汽車領域多年的成果結晶,更是商湯從AI演算法廠商向全端式硬科技企業轉型的關鍵里程碑。未來,商湯將持續迭代升級車規級AI晶片,深化與主流車企的合作,拓展更多智駕場景應用,以更硬核的晶片技術、更完善的解決方案,持續領跑智能汽車AI賽道,書寫屬於商湯的硬科技高品質發展新篇章。 (芯榜)一張圖直觀展現商湯2025年度業績:創新高!商湯2025年收入超50億元,半年EBITDA轉正
誰在決定良率?揭秘AI晶片狂飆背後的“隱形控制力”
當 AI 算力以指數級速度狂飆突進,晶片製程的每一次下探,都在挑戰物理極限的邊緣。過去,晶圓廠更多是在最佳化單一工藝節點,但進入AI時代的晶圓廠,則是在運行一個高度耦合的複雜系統:先進邏輯晶片、HBM、高頻寬封裝、Chiplet架構相互疊加,使得製造流程不再是線性的,而是一個對精度、節拍與一致性都提出極致要求的動態系統。在這樣的背景下,裝置端的演進呈現出一個清晰趨勢:不僅要“更快”,更要“更穩、更準、更乾淨”。本質上,這三個維度共同指向了一個核心命題——精準控制。事實上,在先進製程節點下,越來越多影響良率的因素,並不一定來自光刻或刻蝕工藝本身,而是來自那些曾經被忽視的執行細節:一次不平穩的晶圓夾持、一次細微的機械振動、或是一滴液體是否在關鍵步驟中殘留。在3月25日-27日召開的2026 SEMICON China 大會上,我們採訪了自動化領域的深度玩家Festo(費斯托)。這家成立於1925年的德國企業,至今仍保持獨立營運,在自動化領域積累了逾百年的技術沉澱。正如費斯托電子及裝配行業銷售總監劉高亮所指出的那樣:“裝置廠往往代表著某項工藝的製程domain技術核心,但是要讓機台真正的動起來,底層的核心元件都是不可或缺的。可以說,就算裝置有再好的工藝技術研發,如果不透過這些氣動/電動元件的驅動,裝置也是無法達成它所設計的工藝創新。”AI時代,裝置控製為何如此重要?如果我們把半導體裝置拆解為多個層級,那麼最上層是工藝與設計,中間層是裝置系統,而最底層,則是負責執行所有動作的控制單元——包括氣動系統、閥門、感測器以及流體控制模組等。在過去,這一層往往被視為“輔助系統”;但在先進製程與AI算力需求的雙重驅動下,它正在發生角色躍遷,從“支援性元件”變為“決定性變數”。劉高亮在採訪中提到一個非常關鍵的變化:“隨著工藝不斷的創新,需要的製程精度不斷往上攀升到奈米等級,Fab對於以往不在意的細小元件背後所驅動的製程工藝內容越來越在意。整個行業已經從先做好這項工藝,演變成如何達成國際水平的工藝水平,在這個基礎上,過往不會要求的精度和顆粒度,都會更上一個等級。”也正是在這一背景下,像Festo這樣長期深耕自動化領域的企業,其價值開始被重新定義:它們不再只是提供元件,而是在參與定義整個製造系統的穩定邊界。守衛前道製造:Festo 的“四道防線”在2026 SEMICON China 大會期間,Festo 展示了四項核心技術方案,可以清晰地看到控制能力如何在不同前道製造工藝環節中轉化為實際的製造價值。1 微米級競賽的“穩壓器”:氣動系統進入微米級時代在半導體裝置體系中,“定位”是所有工藝的物理起點,它看似只是一個基礎動作,但在先進製程環境下,卻直接決定了工藝穩定性與良率上限。尤其是在AI算力驅動下,晶圓製造節拍持續提升,裝置需要在更高速度下完成更高精度的動作控制。從具體工藝環節來看,這類能力幾乎貫穿多個前道製造流程,例如,在塗布與光刻環節中,晶圓需要精準定位以保證圖形轉移的一致性;在顯影與蝕刻過程中,工裝與晶圓的相對位置誤差會被直接放大為結構偏差;而在CMP與量測環節,任何細微的定位誤差,都可能影響最終的平整度與檢測結果。這類應用的本質,並不在於“移動本身”,而在於“如何停得準、停得穩”。在高速運行的裝置中,既要保證節拍,又要避免衝擊帶來的振動與顆粒風險,同時還要在目標位置實現微米級精度的穩定停留,這對控制系統提出了極高要求。長期以來,氣動定位控制系統被視為高性價比但精度有限的方案。然而,隨著裝置內部空間日益受限,這一傳統認知正在被 Festo 打破。針對這一類典型場景,Festo提出了整套受控氣動解決方案,通過控制演算法、比例閥島(VTEP)與運動控製器(CPX-E)的協同,實現對氣動執行器的閉環控制,並結合高精度壓力調節,使氣動系統具備可預測、可調節的動態響應能力。在這一體系下,即便是標準氣動執行器,在經過系統級最佳化設計後,能夠實現微米級定位性能,從而滿足前道各關鍵工藝段對精度與穩定性的嚴苛要求。據劉高亮的介紹,因為空間或使用方式的原因,無法使用電機來控制相關位置,這個時候就可以通過微米等級的氣動定位方案來達成最後一里路。這樣的好處不只空間節省,不需要大範圍修改機械結構,精度也可以達到電機控制的精度,甚至更高。2 翹曲晶圓:先進製程下的新挑戰隨著先進封裝技術的普及,晶圓翹曲問題變得越來越普遍,並成為影響鍵合良率的關鍵因素。劉高亮指出:“目前的晶圓製造已經不同於以往簡單的前道與後道二分法,先進封裝中,當單一晶圓完成後,需要與其他晶圓進行Die to Wafer或Wafer to Wafer的鍵合,這就要求晶圓必須在平整狀態下完成封裝,否則良率無法提升。”傳統的夾持方式,在面對翹曲晶圓時,要麼無法穩定夾持,要麼容易在過程中引入微裂紋。而Festo提出的“非接觸式”晶圓翹曲解決方案,通過標準氣動閥實現成本效益最大化,並結合獨有的壓電(Piezo)技術推出標準化產品,可精準控制壓力與真空,適配翹曲晶圓的夾持與釋放。針對同一晶圓翹曲分佈不均的問題,Festo 支援多區獨立控制,將晶圓劃成多個壓力區域,獨立調節各區的壓力/真空等級,從而實現整體均勻、穩定的夾持效果。3 一個門閥動作,也決定晶片良率在先進製程中,潔淨度要求的近乎苛刻,使得顆粒污染成為良率控制的核心博弈點。然而,一個極易被行業忽視的污染源,正隱藏在晶圓出入工藝腔的必經之路——門閥的開關動作中。作為隔離工藝環境的關鍵部件,門閥或閘閥(TV/SV)的每一次機械啟閉,都在考驗著腔室的真空度與潔淨度。當前,多數閥門仍沿用傳統的“開/關”式粗放控制,缺乏過程調節。這種“硬著陸”式的運動會導致閥門在末端產生劇烈衝擊與高頻振動,瞬間剝離的微小顆粒若落在晶圓表面,將直接導致電路失效。針對這一問題,Festo基於高精度智能氣動控制,提出了一套Transfer Valve 門閥開關控制方案。其核心在於通過比例壓力控制技術,對閥門氣缸運動進行連續調節,使原本“剛性開關”的動作,轉變為可程式設計、可調節的動態過程;在閥門接近開啟或閉合終點時,通過軟啟動與軟停止策略,有效削弱衝擊力,顯著降低振動水平,從而在不犧牲節拍的前提下,減少顆粒產生並提升整體潔淨度。劉高亮給出了一個非常直觀的結果:“我們在很多終端廠的驗證中確認,可以降低90%的震動,以及降低至少50%的顆粒產生,這個技術實際上已經把整個製程window改變到另外一個等級。”同時,這種更平滑的運動控制方式,也有助於延長閥門密封件的使用壽命,提升裝置長期運行的穩定性。4 “零滴落”:把不可控的液體變數,變成可程式設計能力在半導體前道製造中,從清洗、塗布到光刻、顯影乃至蝕刻與CMP,大量關鍵工藝都依賴於液體的精準控制。無論是光刻膠、蝕刻液還是清洗劑,這些液體不僅參與工藝過程,更直接影響晶圓表面質量與最終良率。從原理上看,點膠是通過施加壓力,將液體從特定開口擠出並實現均勻分佈的過程,難點並不在“如何出膠”,而在“如何結束出膠”。尤其是在光刻等關鍵環節中,液體價格昂貴且對潔淨度極為敏感,一旦在出膠結束後產生殘液滴落,就可能在晶圓表面形成污染,進而影響後續工藝甚至導致良率損失。因此,點膠系統必須具備“回吸”能力,在關斷瞬間切斷液流並回收殘液,實現無滴漏、無污染。然而在傳統方案中,這一過程往往依賴人工經驗調節,回吸量與時機缺乏精確控制,液體控制長期處於“可調但不可控”的狀態。針對這一問題,Festo基於壓電技術建構了智能氣動控制方案,通過高精度壓力調節與動態響應控制,將回吸過程轉化為可數位化、可程式設計的控制動作,在出膠結束時實現精準回吸,從而真正做到“零滴落、零污染”。綜上可以看出,Festo展示的四項核心技術方案,從“運動、夾持、開關、流體”四個維度,完整勾勒出一套貫穿前道製造的底層控制體系。從微米級定位,到翹曲晶圓夾持,再到門閥控制與液體回吸,Festo所展示的這四類看似分散的技術,實際上指向同一個方向——將製造過程中的不確定性逐步收斂,並轉化為可控制、可復現的系統能力。深耕本土,建構中國半導體的E2E支撐如果說技術能力決定了產品的上限,那麼在中國市場,決定企業能否站穩腳跟的,往往是另一件事——響應速度。面對中國半導體 OEM 廠商對響應速度和定製化能力的近乎苛刻的要求,Festo 給出的答案是全方位的本土化戰略。據劉高亮介紹,Festo 在中國已投入超過 400 位的技術人員,涵蓋了從產品設計、客制化開發到現場驗證的完整技術供應鏈。這種 End-to-End (E2E) 的支援模式,確保了本土客戶在快速迭代中能夠獲得比肩國際一流水準的技術服務。2024年在上海成立的半導體創新中心,更是成為了 Festo 響應中國特殊需求的“前哨站”。通過建立完全獨立的質量與交貨體系,Festo 正在助力中國半導體裝置實現從“能做”到“做精”的質變。結語在 AI 算力的大航海時代,如果說製程突破是衝鋒陷陣的帆,那麼 Festo 所做的,就是那套保障航向精準、船身平穩的底層控制系統。隨著 SEMICON China 2026 的深入開展,我們看到的不僅是技術的迭代,更是製造文明的進化。真正的核心競爭力,已不再侷限於某一項工藝的突破,而在於誰能實現對製造全流程最幽微處的“精準掌控”。唯有守住底層的“微米級”防線,方能成就算力時代的“萬里宏圖”。 (半導體行業觀察)
華為昇騰950發佈:中國AI晶片終於追上輝達
單卡算力是H20的2.87倍,華為這波真的"硬"了。2026年3月20日,華為在中國合作夥伴大會上扔了一顆重磅炸彈。昇騰950PR處理器正式發佈。搭載這顆晶片的Atlas 350加速卡,在多個關鍵指標上實現了對輝達H20的反超。這不是"追趕",這是"超越"。一、昇騰950到底強在哪?核心參數單卡算力是H20的2.87倍。這不是參數黨自我感動,這是實打實的性能碾壓。技術突破1️⃣ 國內唯一支援FP4低精度的推理產品FP4是什麼?簡單說,就是把模型壓縮到原來的1/8,性能幾乎不損失。輝達H100不支援,H20不支援。現在昇騰950支援了。2️⃣ 自研HBM技術HBM(高頻寬記憶體)一直是韓國廠商的天下。華為這次首發自研HBM,打破了國外壟斷。3️⃣ 記憶體訪問顆粒度最佳化從512位元組減少到128位元組。這意味著什麼?小算子訪存效率提升4倍。大模型推理中,小算子佔比超過60%,這個最佳化帶來的提升是實打實的。4️⃣ 叢集能力支援百萬卡叢集,單叢集算力達數百EFLOPS(FP16)。這是什麼概念?相當於把全國Top10超算的算力塞進一個機房。二、為什麼這次不一樣?過去的昇騰:能用,但不夠強昇騰910時代,華為的姿態是"備胎"。能用,但性能、生態、穩定性都和輝達有差距。客戶選擇昇騰,更多是出於"不得不選"。現在的昇騰950:可以正面對剛這一次,華為不是在做"替代品",而是在做"超越者"。單卡算力:超越H20記憶體頻寬:超越H20FP4支援:H20沒有,950有國產生態:完全國產化客戶選擇昇騰950,不再是"無奈之舉",而是"最優解"。三、昇騰950系列規劃華為這次還公佈了完整的晶片路線圖:這是什麼意思?950PR:適合推理階段的第一步——快速生成第一個token。950DT:適合推理階段的第二步——高速解碼後續token。兩顆晶片配合,實現端到端推理加速。四、對產業鏈的影響硬體廠商的機會7家核心夥伴同步發佈基於Atlas 350的整機產品:這些廠商,將成為昇騰生態的"基建商"。投資者關注昇騰產業鏈核心標的:五、對普通人的意義你可能會說:我又不買AI晶片,這跟我有什麼關係?關係很大。1. AI服務成本下降算力成本是AI服務成本的核心。國產晶片性能提升、成本下降,意味著AI服務會更便宜。你用的ChatGPT、文心一言、Kimi,底層都可能跑在昇騰上。2. 資料安全更有保障國產晶片意味著資料不需要出境。政務、金融、醫療等敏感領域,可以放心使用AI。3. 科技自主權昇騰的突破,意味著中國在AI晶片領域不再被"卡脖子"。這是國家層面的戰略安全。昇騰950的發佈,不是技術迭代,是戰略突圍。從"能用"到"好用",從"替代"到"超越",華為走了整整7年。中國國產AI晶片的春天,真的來了。 (碼農看AI)
美國再拒輝達AI晶片對華銷售!
美國政府再次收緊對華AI晶片出口的“天花板”。據The Information報導,美國政府已通知聯邦機構,將不允許輝達向中國銷售其最新開發的“降級版”AI晶片B30A。該晶片基於輝達Blackwell架構,性能據稱超過此前的H20型號,公司此前已向部分中國客戶提供樣品。面對這一否決,輝達正著手修改晶片設計,希望美國政府重新考慮立場。但這一努力能否改變結果,仍是未知數。輝達在中國市場的處境已發生根本性轉變。公司發言人表示,輝達在中國“高度競爭的資料中心計算市場中份額為零”,未將其納入公司業績指引。這一數字與2022年時95%的市場主導地位形成鮮明對比。與此同時,中國政府正積極推動本地企業採購國產AI晶片,近期更出台政策要求使用國家資金的新建資料中心項目必須採用國產AI晶片,華為昇騰等本土廠商正加速填補市場空白。輝達首席執行長黃仁勳在台灣地區一家電視台的直播中明確表示,目前“沒有計畫向中國發貨任何產品”。他將市場重新開放的決定權指向中方:“這取決於中國何時希望輝達產品回歸以服務中國市場,我期待他們改變政策。”目前,輝達正面臨中美雙方政策紅線的雙重擠壓:一方面是美國政府持續收緊對華先進晶片出口許可,另一方面是中國政府加速推進自主算力替代。B30A的修改能否獲得美國批准、中國客戶是否會接納,仍有待觀察。 (晶片行業)
摩根士丹利:AI晶片價值鏈-中國vs美國
一、產業鏈環節“Farmer-Egg-Chicken-Hen house”比喻來拆解AI晶片價值鏈:- Farmer(農戶):對應CSP/AIDC環節,即雲服務/AI資料中心,是AI算力的需求方與應用端,直接承載大模型、AI應用。- Egg(雞蛋):對應AI chip designers環節,即AI晶片設計公司,是算力的核心“種子”,負責晶片架構與功能設計。- Chicken(雞):對應Foundry/OSAT環節,即晶圓代工/封測企業,是晶片的製造與封裝環節,負責將設計圖紙變為實體晶片。- Hen house(雞舍):對應WFE/EDA環節,即半導體裝置/EDA工具,是晶片產業的底層基礎設施,是製造與設計的“生產工具”。二、中美AI晶片價值鏈代表企業1. 中國側(自主供應鏈)- Farmer(應用端):以字節跳動、騰訊、百度、阿里為代表,還包括MINIMAX、智譜AI、深度求索等國內主流雲服務與大模型公司。- Egg(晶片設計):海思、摩爾線程、寒武紀、中科海光、崑崙芯、平頭哥、燧原科技等國產AI晶片設計廠商。- Chicken(製造封測):中芯國際、上海華力、通富微電、長電科技等國內晶圓代工與封測企業。- Hen house(裝置/EDA):北方華創、中微公司、拓荊科技、華大九天等國產半導體裝置與EDA工具企業。2. 美國側(全球主導鏈)- Farmer(應用端):Google、OpenAI、Anthropic、Meta、亞馬遜、甲骨文等全球頂尖雲服務與AI公司。- Egg(晶片設計):NVIDIA、AMD、博通、聯發科等全球AI晶片設計龍頭,其中NVIDIA是絕對核心。- Chicken(製造封測):台積電、三星、日月光等全球頂級晶圓代工與封測企業,台積電主導先進製程。- Hen house(裝置/EDA):ASML、應用材料、KLA、新思科技、楷登電子等全球半導體裝置與EDA的核心供應商,ASML的EUV光刻機是關鍵瓶頸。三、“脫鉤”趨勢的核心體現1. 中國側:從底層裝置(Hen house)→製造(Chicken)→設計(Egg)→應用(Farmer),逐步建構自主可控的AI算力供應鏈,減少對西方技術的依賴。2. 美國側:強化自身生態閉環,同時限制對中國的高端技術輸出,推動算力供應鏈的區域化分割,保持在高端環節的絕對主導。3. 本質:中美在AI算力這一核心生產力上的產業鏈競爭與自主化,全球AI晶片供應鏈正從“全球化分工”走向“雙循環、區域化”的格局。(海外君)
【GTC 2026】傳輝達Groq LPU將對華出口!
3月18日消息,據路透社報導,兩位知情人士透露,人工智慧(AI)晶片大廠輝達正準備推出一款可向中國市場出口和銷售的Groq語言處理單元(LPU)版本,預計將於今年5月上市。在近日的GTC 2026大會上,輝達高調發佈了基於Groq技術的Groq 3語言處理單元(LPU),將其定位為Vera Rubin GPU的“推理協處理器”,引發了市場的極大關注。與大多數依賴HBM(高頻寬記憶體)作為工作記憶體層的AI加速器不同,每個Groq 3 LPU晶片整合了500MB的片上SRAM(靜態隨機存取儲存器)。雖然其容量遠低於Rubin GPU上的288GB的HBM4,但是其可提供高達150TB/s的頻寬,對於頻寬極度敏感的AI解碼操作,Groq 3 LPU的頻寬是傳統HBM的近7倍。輝達超大規模計算副總裁Ian Buck表示,對於需要極致低延遲的token生成任務,LPU的頻寬優勢無可替代。”那麼,輝達最新推出的這款LPU是否能夠對華出口呢?2026年1月,美國為了讓輝達老的AI晶片能夠對華出口,放寬了相關出口管制的硬體參數限制,已經修改為:TPP(總處理性能)低於21000(3A090.a和3A090.b中所定義)且“總DRAM頻寬”低於6500 GB/s(如第748部分補充2第(dd)(1)段註釋中所定義的)的高級計算商品。美國的AI晶片出口管制的核心紅線是算力密度(TPP)和互聯頻寬。但LPU的架構與AI GPU完全不同:它不擅長高平行浮點運算(訓練任務),而是專攻低延遲推理。雖然其片上SRAM頻寬極高,但容量極小(單晶片僅500MB),無法獨立運行兆參數級大模型。如果看FP8精度下的理論峰值算力,可能遠低於H100/B200等晶片。這意味著,Groq LPU的算力密度可能並不觸及現行美國針對AI晶片出口管制的性能閾值。路透社的報導也指出,輝達正在為中國市場準備的Groq LPU晶片並非降級版本,也不是專門為中國市場打造的“特供版”。但是,在輝達的規劃中,Groq LPU是作為Rubin GPU的“協處理器”存在的。黃仁勳給出的配比建議是:約25%部署Groq LPU,其餘75%部署Vera Rubin。LPU負責解碼階段的低延遲生成,Rubin GPU負責預填充階段的海量計算。這意味著,即使LPU本身可以進入中國,它也無法與Vera Rubin組成完整的混合推理系統——這將顯著影響其在中國市場的實用價值。不過,消息人士稱,輝達計畫對華出口的LPU新版本可以適配其他GPU系統——這意味著它可能在介面、互聯協議或系統整合層面進行了調整,以適應中國市場的伺服器生態。另一種可能是,輝達將Groq LPU以板卡或系統的形式出口,通過整體系統的性能參數來滿足管制要求。消息人士稱“新版本可以適配其他系統”,也暗示了其可能在系統整合層面進行了調整。雖然目前輝達在AI訓練晶片市場依然佔據著主導地位,但是由於美國出口管制政策的限制,使得其在中國AI晶片市場的份額已持續降低至冰點。同時,在中國的AI推理晶片市場,輝達更是面臨著寒武紀、HW、阿里平頭哥、百度崑崙芯等眾多本土廠商的激烈競爭。如果輝達無法將Groq LPU帶入中國,可能將這部分市場份額拱手讓人。這種商業壓力也促使輝達尋找合適的產品及合規的出口路徑,重新回到中國AI晶片市場。 (芯智訊)
【GTC 2026】輝達黃仁勳:預計2027年AI晶片將帶來兆美元營收
當地時間3月16日,輝達CEO黃仁勳在2026年GTC技術大會的主題演講中,拋出了一系列重磅消息。他不僅一口氣發佈了包括全新Vera處理器在內的多款新硬體,還大幅上調了公司AI晶片的銷售預期,預測Blackwell和Rubin系列產品將帶來至少1兆美元的收入,進一步鞏固公司在AI計算領域的領先地位。黃仁勳在演講中表示,未來幾個月,Blackwell和Rubin晶片的銷售將成為公司巨大的收入來源。“我看到(AI 晶片銷售)到2027年至少有一兆美元。”這一數字直接令現場觀眾驚嘆連連。在此之前,輝達曾預測到2026年底,其資料中心裝置將帶來5000億美元的銷售額。黃仁勳將此次收入預期的飆升歸因於計算需求的爆炸式增長。他表示,AI已經從“感知”進化到“生成”,再到“推理”,現在已經可以執行極其高效的實際工作。“推理拐點”已經到來。“我相信,在過去的兩年裡,計算需求增長了一百萬倍,”黃仁勳表示,“這是我們所有人的感受,也是每一家創業公司的感受。”黃仁勳指出,如今的輝達系統已經證明了自己是全球“成本最低的基礎設施”。據介紹,輝達目前的業務中,60%來自頂級雲服務商,不僅支援其內部AI消費(如推薦系統、搜尋向大模型的遷移),更通過輝達的生態系統加速每一家AI實驗室;另外40%則遍佈區域雲、主權雲、企業級伺服器及工業自動化。黃仁勳認為,未來的資料中心不再是儲存檔案的倉庫,而是生產Token(AI生成的基本單位)的“AI工廠”。由於資料中心收到電力限制,對於企業而言,在固定的功率下,誰的每瓦Token吞吐量最高,誰的生產成本就最低。這也意味著,企業必須確保在其AI工廠裡運行最強的電腦系統,才能獲得最大化的收益。為了延續這一增長勢頭,黃仁勳展示或發佈了一系列重大產品,包括由7款全新晶片和5個機架組成的Vera Rubin超級AI平台,涵蓋計算、網路和儲存三大功能。輝達聲稱,Vera Rubin平台在推理token成本上較Blackwell降低10倍,訓練混合專家(MoE)模型所需GPU數量減少75%。這其中最引人注目的是一款全新的Vera CPU,計畫於2026年下半年面市。輝達稱,這款CPU是專為AI智能體“量身打造”的,與傳統CPU相比,其能效翻倍,速度提升50%,並擁有目前業內最高的單線程性能和每核心頻寬。此外,輝達還發佈了一款全新的伺服器機架,整合了256個液冷式Vera CPU。這套系統足以支援超過22500個並行CPU環境,每個環境都能獨立全速運行。這是輝達推動建構“AI工廠”戰略的關鍵一環,旨在為從量子計算到機器人技術等一系列應用場景提供算力支援。據悉,Vera Rubin超級AI平台目前已全面投產,並得到了包括Anthropic、OpenAI、Meta和Mistral AI以及主要雲提供商在內的眾多客戶的鼎力支援。黃仁勳表示,隨著AI模型規模和推理需求持續增長,未來的資料中心將越來越像一台完整的超級電腦。而像Vera Rubin這樣的系統,正是為下一代AI工作負載——尤其是智能體系統——設計的核心計算基礎設施。輝達的AI計算版圖還在向太空延伸。黃仁勳表示,公司此前已經在衛星領域部署計算系統,並計畫與合作夥伴開發新的太空計算平台Vera Rubin Space One,用於在軌道上建設資料中心。對於最近爆火的OpenClaw,黃仁勳也給出了高度評價。他表示,OpenClaw的增長速度甚至超過了Linux在過去幾十年的傳播速度,其影響力“極其深遠”。輝達也宣佈將正式支援這一項目。黃仁勳認為,OpenClaw之於AI的意義,堪比Windows之於個人計算的變革。“當今全球每一家企業都必須制定OpenClaw戰略,制定智能體系統戰略,”黃仁勳表示,“這是新的電腦形態。”在大會上,輝達宣佈推出其基於OpenClaw的定製版本,名為NemoClaw,該版本允許使用者為其AI智能體加入隱私和安全控制功能。“它擁有網路護欄和隱私路由器,因此,我們能夠保護並防止這些智能體在我們公司內部隨意執行任務,從而安全地使用它們。”黃仁勳表示。 (i商周)