#晶片算力
AI晶片:兩種賭注,一個棋局
算力棋局的落子聲,正穿透 2025 年 AI 產業的喧囂。近日,兩大晶片巨頭相繼與頭部 AI 企業敲定億級算力訂單,一個以技術霸權搶佔增量賽道,一個憑股權繫結撕開突破缺口,兩種截然不同的賭注,正將全球 AI 晶片的核心棋局,下得愈發清晰且激烈。01AI晶片龍頭,兩種賭注9月,輝達與OpenAI宣佈雙方達成一項戰略合作夥伴關係:OpenAI將部署至少10GW(10吉瓦,即1000萬千瓦)的輝達系統,包含數百萬顆GPU,而輝達將在這些算力逐步上線時,向OpenAI持續投資,投資總額最高達1000億美元(約合人民幣7114.7億元)。值得注意的是,10吉瓦算力相當於400-500萬塊GPU,相當於吃掉輝達 2025 年全年 AI 晶片產能,並且是輝達去年出貨量的兩倍。同時,雙方也宣佈將於2026年下半年,部署首個基於輝達Vera Rubin平台的GW等級資料中心。這場合作對於輝達與OpenAI來說均至關重要。黃仁勳直接將上述合作稱為“史上最大算力項目”和“史上最大AI基礎設施項目”。Sam Altman則表示,沒有它,OpenAI無法向使用者交付他們想要的服務,也無法持續打造更好的模型。這些基礎設施就是推動OpenAI改進模型、增加營收的“燃料”。10月初,OpenAI與AMD再度達成重磅協議。OpenAI將在未來數年部署高達6GW(千兆瓦)的AMD Instinct GPU。根據協議,首批1GW裝置將於2026年投入使用。核心產品是AMD Instinct MI450系列,將延伸至MI350X及後續代際。根據協議,首批1GW裝置將於2026年投入使用。AMD已向OpenAI發行最高1.6億股認股權證,行權條件與晶片部署進度及股價里程碑掛鉤。如果OpenAI全額行權,基於AMD當前流通股總數計算,它可能獲得AMD約10%的股權。股權繫結也使 OpenAI 與AMD成為“利益共同體”。那麼與OpenAI的合作,給輝達和AMD各自帶來那些影響呢?02輝達和AMD,各自帶來那些影響?首先,最直觀的就是給上述兩者帶來的直接收益。黃仁勳曾在財報電話中透露,建設1GW算力的成本大約為500-600億美元,而輝達的晶片與系統佔其中約350億美元。據此推算,最新的10GW資料中心建設項目投資規模大約為5000-6000億美元——與此前公佈的星際之門項目規模基本一致,而輝達在其中能收穫大約3500億美元的營收。AMD首席執行官蘇姿丰則預計,該協議將在未來四年為公司帶來每年數百億美元的新增營收,並帶動其他客戶跟進,使AMD整體新增收入突破千億美元。除直接收益外,OpenAI 與這兩家頭部 AI 晶片公司的合作,也為整個 AI 市場帶來諸多潛在影響。有業內人士表示:首先在價格層面,輝達的議價能力或許會受到稀釋。OpenAI 通過 AMD 合作獲得比價權,可能迫使輝達在後續訂單中降低溢價。其次在技術層面,後續OpenAI將直接參與AMD從Instinct MI300X到MI450、MI350X等多代產品的設計反饋階段。OpenAI與AMD的合作已不止於供需交換,而是建立了軟硬體聯合研發的框架。雙方將共享產品路線圖,共同最佳化GPU架構、記憶體頻寬、AI加速器,以及AMD的ROCm軟體生態。如此一來或許會直接削弱輝達“硬體 - 軟體” 協同優勢。最後在市場方面,來自OpenAI每年數百億美元新增營收的核心價值在於“客戶背書槓桿”,目前已有戴爾、聯想等 OEM 廠商加速量產 MI300X 系統,微軟、Oracle 等雲廠商跟進採購,OpenAI的加入印證“龍頭客戶帶動效應”。蘇姿丰近日表示,AI 的繁榮預計將持續十年,今年才是這一浪潮的第二年。面對未來八年集中的算力需求,AMD 與 OpenAI 的緊密合作恰恰換取了關鍵的市場切入點。03市場地震:誰在狂歡?在晶片設計與計算方面,OpenAI與博通的定製晶片項目可能因此受到影響,但博通的交換晶片業務仍可能受益於AI資料中心建設。不過,這場賭注早已超出晶片設計領域。在晶片製造與封裝方面,AMD和輝達均由台積電代工並採用CoWoS等先進封裝。此次大單將持續推高對台積電先進製程和先進封裝產能的需求。此外,日月光、安靠等封測公司也將因AI晶片需求高漲而受益。據悉,日月光作為全球最大的獨立 OSAT(外包封測)廠商,正加快在高雄的先進封裝佈局,全面提升 CoWoS、SoIC、FOPLP 等高階產能。還有這樣一家公司,或許不是最耀眼的明星,但卻是AMD等巨頭背後不可或缺的“幕後英雄”。即:通富微電。據悉,通富微電已與AMD形成合資+合作的聯合模式,建立緊密戰略合作夥伴關係,簽訂長期業務協議,提供AMD AI PC晶片及工作訓練推理用AI加速器封測服務,現為AMD最大封裝測試供應商,AMD也成為通富微電大客戶。此外,AMD均持有通富微電檳城及蘇州廠15%的股份,通富微電每年來自AMD的訂單收入佔比超過六成(2025年上半年佔比64%)。OpenAI與AMD宣佈合作,通富微電將直接受益。在儲存(HBM)方面,SK海力士、美光、三星均是HBM的主要參與者,而HBM又是輝達和AMD GPU不可或缺的重要部件,因此該系列公司將一同受益於行業高景氣度。值得注意的是,近日市場消息稱,輝達已基本確認旗下最新 AI 加速晶片 GB300 將採用三星的第五代高頻寬 HBM3E 技術,意味著三星在歷經多次波折後,終於能進入輝達供應鏈。目前雙方正就供貨數量、價格及交付時間等小細節進行最後協調。在伺服器與資料中心方面,戴爾、超微等伺服器廠商需要提供整機解決方案,合作將拉動這些廠商的訂單。資料中心內部的高速網路需求隨之增長,Arista Networks等網路裝置商將受益於AI資料中心向400/800G乙太網路的升級。在供電、散熱等方面,1GW等級的算力叢集對電力和製冷提出極致要求。這將直接利多供配電、液冷散熱等資料中心基礎設施供應商,比如Vertiv、施耐德電氣 (Schneider Electric)、伊頓 (Eaton)等。04OpenAI,第三條路在選擇與國際 GPU 晶片龍頭公司合作的同時,OpenAI 亦在謀求第三條路,即自研晶片。OpenAI 去年就已開始與博通(Broadcom)合作開發其首款定製 AI 推理晶片,旨在處理其大規模的 AI 工作負載,特別是推理任務。據悉,博通將會幫助 OpenAI 進行晶片設計,並確保由台積電進行製造,預計 2026 年開始生產。台積電作為全球最大的晶片製造商,擁有先進的製造技術和大規模生產能力。根據此前資訊,OpenAI開發的晶片將陸續利用台積電3nm與後續1.6nm製程投片生產。為了實現晶片供應的多元化,OpenAI 此前還計畫建立晶片製作代工廠。但由於成本高昂,並且建構代工廠網路需要大量時間,OpenAI 已經擱置了這一計畫,轉而專注於內部晶片設計。OpenAI自研晶片的策略主要有兩方面意義:其一,OpenAI 是輝達GPU的最大買家之一,並且此前幾乎完全依賴輝達GPU 進行訓練。2020 年以來,OpenAI 在微軟建造的大型超級電腦上開發了其生成式人工智慧技術,這台電腦使用了超過10000 個輝達GPU。但由於晶片短缺和供應延遲,以及訓練成本高昂的問題,OpenAI 不得不開始探索替代方案。早在2024年,OpenAI CEO薩姆·奧爾特曼曾在社交媒體上表達出輝達GPU供應不足的問題,導致其AI開發處理程序受到制約。這一次自研晶片的決定,正是希望通過內部的技術迭代,逐步擺脫對單一供應商的依賴,從而獲得更高的自主性。其二,不止是OpenAI,如今的AI市場已經迎來諸多競爭者包括Meta和微軟,值得注意的是,這些企業均有自研高性能AI晶片產品推出,比如Meta的MTIA系列及微軟的Azure Maia 100等。據悉,亞馬遜自研Trainium系列晶片,性價比目前其他GPU(圖形處理器,如輝達)供應商高出30%-40%。不過,無論是自研 AI 晶片,還是 AMD 加速推進,短期內都難以衝擊輝達的市場份額。根據行業分析師Susquehanna的最新報告顯示,當輝達在AI顯示卡領域的佔有率已接近80%,這一資料充分體現了其在技術創新和產品佈局上的顯著競爭力。儘管未來市場競爭將更加激烈,但Susquehanna預測,到2030年輝達仍將佔據67%的市場份額。這一比例雖然較當前有所下降,但依然遠超其他競爭對手,顯示出其難以撼動的行業地位。該資料顯示,在輝達主導的市場格局下,其他廠商也在積極尋求突破。AMD作為第二大受益者,預計到2030年將獲得約4%的市場份額。雖然這一比例相對較低,但其年營收有望從目前的63億美元增長至200億美元,顯示出強勁的增長潛力。與此同時,博通公司通過專注於定製ASIC晶片的開發,開闢了新的市場空間。分析師預測,到2030年博通將拿下14%的市場份額,營收規模可達600億美元,較今年的145億美元實現顯著增長。 (半導體產業縱橫)
輝達“下一代晶片”算力爆表,中國車企為何說“渣渣”?
伴隨著AI大模型的快速上車,作為汽車大腦的晶片,也迎來了新一輪全面升級。在輔助駕駛晶片領域,輝達Thor正式上車,今年5月起,第一批搭載輝達Thor U的新車開啟交付,包括理想L8、領克900等。雖然這款晶片並非“頂配版”Thor,屬於其衍生版中的中低配,但單顆算力仍高達700TOPS,是目前主流的輝達Orin X算力(254TOPS)兩倍還多。座艙晶片領域,當前的“天花板”高通8295(最大AI算力為60TOPS),也將很快淪為“上一代”產品。據悉,高通第五代座艙晶片明年量產,AI算力高達360TOPS,且將更好適配大模型。根據摩爾定律,處理器的性能大約每兩年翻一倍,同時價格下降為之前的一半。以此判斷,車規級AI晶片算力即將全面進入千級時代。然而,經歷過前些年盲目卷硬體的階段,很多人都已經意識到了,算力其實“啥也不是”。相比算力翻了多少倍,真正能對汽車智能化水平起到重大作用的,是晶片換代帶來的架構革新,企業的軟硬體適配能力,以及國產晶片的快速追趕。1. 智能汽車開啟One Brain時代:“一顆大腦統管一切”拼算力,輝達無疑“遙遙領先”,其2022年發佈的Thor晶片最高算力可達2000TOPS。目前,業內主流的輔助駕駛演算法正在從“端到端+VLM”向VLA進階,Orin X的算力難以支撐結構更複雜,參數成倍增加的VLA模型,因此Thor等千級算力晶片,被視為實現高等級自動駕駛和車內AI功能的關鍵。而強大算力背後更值得關注的是,輝達引入了最新一代GPU架構和Transformer加速單元,能夠將過去汽車中分散的多個電子控制單元(ECU)功能整合在一起,例如,高級駕駛輔助系統(ADAS)、泊車、駕駛員監控、數字儀表盤和座艙娛樂等。做個簡單的比喻,汽車可以和人一樣,由一顆“中央計算大腦”統管全身所有功能,即我們之前分析汽車電子電氣架構發展趨勢時提到的“One Brain”。由此帶來的好處是,集中算力支援更複雜的汽車軟體和功能,同時減少線束,實現更高效的通訊,降低功耗和製造成本,提升車輛性能和智能化體驗。不過,在Thor為汽車插上智慧的翅膀前,車企必須先跨過幾條“深溝”。業內專家指出,採用新GPU架構和Transformer引擎的Thor晶片,在計算單元和指令集上都有變化。這意味著此前基於Orin開發的演算法和中介軟體,都要跟著重構和最佳化。雖然輝達也會提供對應的工具,但整車廠的軟體工程師仍需重新調校參數、適配驅動,才能發揮Thor的全部性能。此外,如上所述,實現One Brain不只是為汽車裝上一個聰明的大腦這麼簡單,車企必須打造出真正的中央集中式電子電氣架構,相當於是對全身的神經系統進行徹底改造。這對車企的軟體架構設計、即時性保障、故障隔離等都提出了更高要求。如果適配不當,可能出現系統調度混亂或安全隱患。與此同時,輝達自己的問題也困擾著車企。一方面是Thor晶片技術上的複雜性,導致其研發和生產都遇到巨大挑戰。有消息稱,Thor此前多次“跳票”,可能就是因為遇到了功耗控制、發熱管理、可靠性驗證等技術瓶頸。這直接影響了車企的新車計畫。多個品牌曾向水滴汽車表示:“原本旗艦車型研發時計畫直接使用Thor晶片,但因為延期,最終選擇了雙Orin-X配置”。理想汽車也表示,這款晶片對於i8的性能和智能化水平至關重要,因此新車的發佈時間不得不從一季度推遲到今年7月。另一方面,輝達等美國晶片巨頭,一直被美國政府的對華政策束縛,動不動就要限製出口。這顆嚴重威脅供應鏈安全的“不定時”炸彈,讓包括主機廠在內的中國企業,不得不未雨綢繆,減少對美國先進晶片的依賴。雖然尋找替代的道路充滿艱辛,卻是必須要吃的苦。2. 兼顧成本、效率和體驗才是先進技術消費者往往會被帳面參數“蠱惑”,前兩年汽車圈盛行卷硬體,晶片算力和雷射雷達數量是車企重點宣傳的產品點,實際不過是“差生文具多”,技術不夠硬體湊。如今,科技平權,AI技術到了拼量產上車的時候,當年的迴旋鏢卻正中眉心,車企不得不推翻自己一手設計的“唯算力論”,為使用者樹立新的智能化技術標準。多位汽車智能工程師都對筆者表達了相似的觀點,算力只是衡量晶片能力的一個指標,還有很多其他因素甚至比它還重要。首先,晶片根據定位和使用場景的不同,考量標準本身就不一樣。比如輔助駕駛晶片,就側重異構計算與即時性,算力分佈以NPU(神經網路處理單元)/TPU(張量處理單元)為核心,時延、可靠性等都是關鍵指標。智艙晶片則側重通用計算與多媒體,CPU(中央處理器)/GPU(圖形處理器)是核心,關鍵指標為多工處理能力、圖形渲染影格率、介面相容性等。老話說“好鋼用在刀刃上”,對於晶片亦是如此,算力有沒有用在正地兒上,直接影響著實際能力。其次,系統頻寬、性能功耗等指標也非常關鍵。芯馳科技CTO孫鳴樂表示,算力再高,系統頻寬跟不上,計算單元就無法充分發揮性能。他指出,許多現有座艙平台源自手機晶片設計,記憶體頻寬通常為64位,總頻寬約六七十GB/s,不足以支援大模型運行。不久前,芯馳科技發佈了自研智艙晶片X10,CPU 200k DMIPS,NPU算力40TOPS,系統頻寬高達154GB/s。在多工平行時,高頻寬如同多車道的高速路,具備更靈活的調度機制,可有效利用算力。一般情況下,算力越大功耗越高,這讓高算力的輔助駕駛晶片成了一把鋒利的雙刃劍。雖然技術進步會提升晶片的性能功耗比,但像Thor這樣的“艙駕一體”晶片,一定會對功耗控制提出更大挑戰。有媒體估算,擁有千級算力的Thor晶片,總功耗可能高達數百瓦等級,需要更好的散熱條件。理想汽車曾提到,他們將採用更先進的冷卻方案,以適應更高算力的晶片。最後,也是最重要的,千級算力能不能得到有效利用。對於車企來說,選擇一種晶片不僅取決於算力高低,還取決於它能否無縫融入自己的技術路線圖。僅從Thor來看,企業要做的磨合工作不輕,需要相當長的整合測試周期,去匹配軟體生態。如今市場內卷嚴重,產品迭代速度堪比電子產品,企業有沒有足夠的時間和能力,讓Thor自上車起就發揮出應有的實力,答案其實大家都心知肚明。典型案例便是2021年1月發佈的蔚來ET7,其搭載了四Orin平台,智駕算力高達1016TOPS,這一數字至今無人超越,然而功耗超過300瓦的智駕系統,最終只給使用者帶來了一個“耗電大戶”,以及二流的輔助駕駛體驗。這再次提醒我們:晶片再強大,若沒有配套的軟體與支援體系,也是渣渣。事實上在工程師眼中,不存在高參數的先進技術,有的只是兼顧成本、效率和實際體驗的更優技術。站在使用者需求的角度,要是你需要的只是自動泊車等L2功能,10TOPS其實就夠了,高速NOA最好有100TOPS,到了城市NOA,再要求500TOPS以上。按需選擇,沒必要花大價錢交智商稅。3. 中國國產晶片快速追擊,只買對的不買貴的在內部與外部多重因素的共同作用下,這兩年中國國產晶片如雨後春筍般蓬勃發展,整車廠與上游供應鏈企業,都在集體發力,並且已經拿出許多極具競爭力的產品。諸如小鵬汽車加快了自研圖靈晶片的步伐,將於第二季度上車,算力達到700TOPS,不輸Thor U。廠家介紹,圖靈晶片的計算能力較當前主流的輝達Orin X晶片組合方案提升3.2倍,功耗降低40%。更關鍵的是,其具備大模型承載能力,可支援本地運行300億參數神經網路。蔚來甚至更早推出了自研的神璣NX9031晶片,並且已經隨著ET9實現量產,性能對標輝達旗艦晶片。去年底放話要轉型AI公司的理想,也加入了這場競爭。最新消息稱,理想自主研發的5nm製程輔助駕駛晶片,已開始流片。企業還在積極招聘晶片和訓練叢集方面的人才,並在香港籌建專門的晶片研發辦公室。造車新勢力成果初現,傳統主機廠和供應鏈企業更是你追我趕。吉利、比亞迪、奇瑞、長城等頭部大廠均已深度佈局車規級晶片賽道。華為自研的昇騰晶片能力碾壓同級,已是得到市場驗證的事實;跑在前面的地平線J6P,今年三季度量產上車;芯擎星辰一號、芯馳X10等一眾國產輔助駕駛晶片和智能座艙晶片,量產節點鎖定明年。筆者粗略觀察,國產輔助駕駛晶片的算力最高已在500~700TOPS,由於很多是專為AI大模型設計的,與企業的自研演算法適配性更高,因此在車端的實際表現上,不輸國際巨頭。相似性能,更低成本,是中國企業百試不爽的競爭策略,在晶片領域同樣適用。輝達晶片採購成本在整車成本裡佔比5%~8%,而車企自研晶片能讓成本降低30%~50%。如今,我們在人工智慧演算法上已經走在了世界前列,L3自動駕駛和AI大模型上車也是勢不可擋。在巨大的應用前景面前,國產晶片必然能借勢而起。隨著消費者認知的不斷成熟,以及國產晶片口碑的逐漸累積,消費者的認知和信任也將快速建立起來,“只買對的不買貴的”。筆者相信,國產晶片大範圍替代的那天或許不會太遠了。 (水滴汽車)