#GoogleTPU
GoogleTPU市場策略與2025至2026年展望分析
引言Google的張量處理單元(Tensor Processing Units)已從專用內部硬體發展為主要營收驅動力,逐步挑戰輝達在AI計算基礎設施領域的主導地位。TPU業務現已成為Google戰略上最重要的業務之一,預計到2026年將持續增長。本文基於業界洞察,分析GoogleTPU生態系統的現狀與未來發展軌跡[1]。2025年市場格局Google2025年的TPU出貨目標顯示了其在AI基礎設施領域的雄心。公司預計全年總出貨量為250萬片,截至第三季度末已取得顯著進展。到2025年第三季度結束時,累計出貨量達到180萬片,佔全年目標的72%,顯示出強勁的執行能力。各季度的出貨量呈現加速增長態勢。第一季度建立基礎,出貨約50萬片,隨後第二季度溫和增長至約55萬片。第三季度出現顯著加速,出貨量在70萬至75萬片之間,這與下半年資料中心部署活動加強的典型模式相吻合。為達成年度目標,第四季度需交付70萬至80萬片,保持第三季度建立的增長勢頭。2025年的產品組合反映了代際過渡期的特徵。TPU V5系列(包括V5E和V5P兩個版本)作為當前主力產品線,預計出貨量為190萬片,佔總量的76%。在該系列中,V5E約佔120萬片,V5P貢獻約70萬片,形成大約二比一的比例。這種分佈模式表明市場對中端V5E的需求更強,主要因其性能與成本之間的平衡特性以及適合大多數部署場景的競爭性價格結構。圖1:Google2025年TPU產品線的定位與價格結構,顯示V5和V6系列型號的分佈情況。下一代V6系列(包括V6E和V6P)預計出貨60萬片,佔年度總量的24%。目前僅V6E已實現商業化,負責處理該產品代的初期市場匯入。V6P計畫於第四季度推出,初期產量預計相對溫和,在10萬至20萬片之間,受限於產能爬坡約束,後續產能擴張將取決於市場反饋和需求模式。營收預測與季節性規律根據出貨量和平均售價,Google2025年TPU相關營收預計達到112.5億美元,按250萬片乘以4500美元的整體平均售價計算。這一營收規模表明TPU業務已發展成為Google的重要收入來源,可與其一些成熟業務類股相媲美。專家來源指出,由於多種限制因素,包括客戶合同保密性、不同產品版本的季度出貨時間差異以及內部財務報告複雜性,無法提供按個別客戶或特定型號的精確季度營收明細。然而,基於上半年40%、下半年60%的出貨分佈,估計上半年營收約45億美元,下半年營收約67.5億美元。上半年與下半年出貨量的40-60分佈反映了企業技術採購的明顯季節性特徵。上半年合併出貨量約為105萬片,由第一季度的50萬片加上第二季度的55萬片計算得出。同時,下半年出貨量在145萬至155萬片之間,相比上半年增加40萬至50萬片。這種季節性模式主要源於資料中心部署周期,因為大多數企業和機構將資料中心建設與升級活動集中在下半年,以滿足年底IT基礎設施投資目標。這種周期性行為直接驅動對TPU等核心計算晶片的需求增加,導致GoogleTPU在下半年的出貨量顯著提高。跨產品層級的定價策略GoogleTPU定價根據性能規格和技術複雜度因型號而異,定價策略與產品定位緊密結合。面向主流應用的高性價比V5E平均價格約3000美元,在需要平衡性能與成本控制的場景中具有強大競爭力。這一價格使得組織在實施AI能力時無需頂級性能即可負擔。提供增強性能的高端V5P平均價格約6000美元,恰好是V5E價格的兩倍。該型號主要面向中型資料中心和需要更高計算能力的AI訓練工作負載,通過提升吞吐量和效率來證明其溢價的合理性。作為首個上市的V6系列產品,V6E提供介於V5E和V5P之間的性能,平均價格為4000美元。這一定價在性能提升與成本控制之間取得平衡,為V5E客戶提供升級路徑,無需投入V6P的全部成本。計畫於第四季度推出的V6P代表當前高端產品,預期價格約8000美元。這一定價反映了先進製造工藝、更高計算密度以及針對最苛刻工作負載設計的增強功能集。這些價格可能會根據台積電製造成本調整而出現小幅波動,但整體變化預計有限,以維持市場價格穩定性和客戶規劃確定性。2025年GoogleTPU的整體平均售價維持在4500美元左右,代表V5和V6系列型號基於各自出貨量和單價的加權平均值。V5系列貢獻高出貨量但單價較低,而V6系列價格更高但出貨量較低,形成這一平衡的平均值,反映產品線的過渡性質。展望2026年2026年展望顯示GoogleTPU策略在價格穩定性和產品過渡方面的持續演變。整體平均售價預計保持在4500至5000美元之間,不會有顯著增長。這種穩定性反映了兩個相互抵消的因素:雖然新的TPU V7系列產品可能因增強能力而提昇平均售價,但V6E等現有產品隨著產能擴大和開發成本完全攤銷可能會降價。此外,從競爭和客戶需求角度看,過度提價可能對購買決策產生負面影響,促使Google採取價格穩定策略。總體而言,2026年平均售價增幅預計控制在10%左右,保持相對穩定的價格趨勢,支援客戶預算規劃。圖2:2026年預計出貨量與價格,顯示向V6和V7系列主導地位的過渡。2026年出貨格局將呈現清晰的代際過渡模式,舊產品逐步退出,新技術獲得市場接受。V5E出貨量不會超過30萬片,因其性能日益落後於市場需求,部署主要限於第一、二季度的傳統伺服器升級,隨後逐步淘汰。V5系列總出貨量(V5E和V5P合計)預計為80萬片。V5P將維持約50萬片,因其在中型資料中心訓練需求中的持續相關性,在這些場景中經過驗證的性能優於新技術帶來的好處。V6系列預計成為出貨量領導者,2026年總出貨量約160萬片,標誌著產品組合的顯著轉變。V6E將受益於2025年推出後建立的市場地位,在生產環境中證明了可靠性和性能。同時,V6P在2025年第四季度推出後進入全產能生產,服務需要更高端訓練能力的客戶。對於先進的V7系列,V7E出貨量可能接近50萬片,作為該系列旗艦產品面向高性能推理應用。這一可觀的初始出貨量反映了對下一代推理能力的潛在需求。如按計畫於2026年第四季度推出,V7P在初期供貨期間可能達到10萬片。然而,由於開發時間表、產能爬坡挑戰或客戶驗證周期等原因可能導致延遲,V7P推出可能推遲至2027年,這反映了將尖端AI加速器推向市場的複雜性。V7系列定價遵循典型的半導體生命周期模式,特徵是初期高定價隨時間逐步降低。V7E將以4500至5000美元推出,包含非經常性工程成本回收,通常在前10萬片中攤銷,以快速收回開發投資。隨著初始出貨量交付和產能擴大,開發成本完全攤銷後,V7E價格預計下降至3000至4000美元。這一軌跡與之前V6E和V5E的價格演變保持一致,反映了製造工藝成熟時行業標準的規模經濟效益。規格更高的V7P,由於開發成本顯著更高和技術複雜性(包括先進製造工藝、更高計算能力以及對複雜AI訓練任務的支援),價格將接近1萬美元。這一高端定位也在早期生產單元中包含非經常性工程成本回收。雖然V7P價格可能根據市場競爭、客戶反饋以及推出時的產能約束進行小幅調整,但高端定位將繼續牢牢面向高端資料中心和需要最高性能處理最苛刻工作負載的大型AI企業客戶。這一對GoogleTPU策略的全面分析顯示,該組織正通過精心的產品規劃、競爭性定價以及顯示長期市場承諾的大量出貨承諾,系統性地建構輝達AI計算主導地位的可靠替代方案。 (梓豪談芯)
或許CUDA不再是唯一:詳解輝達的兆帝國與GoogleTPU的十年暗戰
最近美股金融市場風雲變化,疊加DIY市場儲存晶片大幅漲價,所以我們暫時拋開開源和閉源模型不談,聊聊美國最大的AI鏟子售賣商-輝達和Google的角色關係01. 歷史復盤:一場持續17年的“豪賭”很多非技術出身的投資者認為輝達的爆發是運氣,正好趕上了ChatGPT的風口。但其實這是一場長達17年的蓄謀已久的策劃。故事的轉折點不在1993年的創立,而在2006年。那一年,輝達推出了CUDA(Compute Unified Device Architecture)。在當時,這被視為一個瘋狂的決定——在每一塊GPU上增加專門的邏輯電路,允許程式設計師呼叫顯示卡進行通用計算(GPGPU)。這意味著輝達在硬體成本上升的同時,還要投入巨資去維護一套當時沒人用的軟體生態。華爾街當時對此嗤之以鼻,認為黃仁勳瘋了。但正是CUDA,將GPU從單純的“圖形渲染器”變成了“數學加速器”。2012年的伏筆: AlexNet在兩塊GTX 580顯示卡上訓練了6天,碾壓了傳統演算法。深度學習(Deep Learning)的大門被踹開,科學家們驚訝地發現:原來GPU這種幾千個核心平行計算的架構,天生就是為了跑神經網路而生的。從那以後,輝達就不再是一家遊戲硬體公司,它變成了一家AI計算平台公司。當2017年Transformer架構提出,2022年ChatGPT爆發時,輝達是全場唯一一個準備好了全套“軟硬一體”方案的玩家。02. 護城河:不僅是晶片,是“全端”現在的輝達,強在那裡?如果你只盯著它的主營業務——資料中心(Data Center),你會看到驚人的財務資料。在最新的財報中,資料中心業務營收佔比已超八成,毛利率一度突破75%。這在硬體行業是違反常識的。之所以能做到這一點,是因為輝達賣的從來不是裸片(Silicon)。它賣的是DGX系統,是NVLink(讓成千上萬塊顯示卡像一塊顯示卡那樣工作的高速互連技術),更是NVIDIA AI Enterprise軟體套件。在AI開發者的世界裡,CUDA構成了最深的護城河。所有的主流框架(PyTorch, TensorFlow)、所有的開源模型(Llama, Mistral),默認的第一適配對像永遠是輝達。這種“開發者習慣”的粘性,比硬體本身的性能差距更難被踰越。03. 房間裡的巨象:GoogleTPU與CSP的起義然而,盛世之下,危機四伏。輝達的統治力並非牢不可破。 而撕開這道口子的,正是它最大的客戶之一—Google。早在2015年,Google就敏銳地意識到:如果不自研晶片,未來將被輝達卡死。 於是,TPU(Tensor Processing Unit) 誕生了。這就引出了輝達目前面臨的最大困境:通用GPU vs 專用ASIC的路線之爭。GPU(輝達)的邏輯: 我是通用的,我什麼都能算,從天氣預報到大模型訓練,靈活性無敵。但代價是功耗高、價格貴。ASIC(如GoogleTPU)的邏輯: 我專門為矩陣乘法設計,專門為TensorFlow/JAX框架最佳化。我不做圖形渲染,我就跑AI。因此,我在特定場景下能效比更高,成本更低。GoogleTPU的威脅有多大?如果你看DeepMind的Gemini、阿法狗(AlphaGo),甚至蘋果最新的Apple Intelligence伺服器端訓練,它們很多並沒有依賴輝達,而是建構在Google的TPU叢集之上。不僅是Google,這是一場“CSP(雲服務提供商)的起義”。亞馬遜 AWS 有 Trainium 和 Inferentia;微軟 Azure 推出了 Maia 100;Meta 也在推自研 MTIA 晶片。這些科技巨頭每年向輝達採購數百億美元的晶片,但他們內心極度渴望擺脫這種“被收稅”的狀態。這種客戶即對手的博弈,將是未來3-5年AI硬體領域的主旋律。04. 未來的困境:推理(Inference)市場的變數其實對於輝達來說,另一個隱憂在於AI工作流的重心轉移。過去幾年是訓練(Training)的時代,大家都在拚命燒錢練大模型,這時候必須用輝達,因為只有它能提供萬卡叢集的穩定性。但未來5年,我們將進入推理(Inference)時代。也就是模型練好了,大家開始大規模呼叫API,開始在手機、PC、邊緣裝置上運行模型。在推理市場上,輝達的優勢會被削弱。成本敏感: 推理不需要訓練那麼大的算力,企業更看重性價比。專用的推理晶片(如Groq、各大廠自研晶片)可能會比昂貴的H100/B200更具吸引力。軟體解耦: 隨著PyTorch 2.0和OpenAI Triton等編譯器的發展,開發者正在試圖打破CUDA的壟斷。如果有一天,程式碼可以無痛地遷移到AMD或自研晶片上,輝達的高溢價還能維持嗎?05. 結語目前的輝達,依然是當之無愧的王者。Blackwell架構的推出,再次拉大了它與競爭對手的代差。在“訓練超大模型”這個塔尖領域,它依然沒有替代品。但從產業演進的角度看,任何單一公司的壟斷都是暫時的。金融市場上,巴菲特管理的‌波克夏公司斥資43億美元首次建倉Google母公司‌Alphabet,使其成為第十大重倉股,這再次證明了,Google在AI發展路徑走在了更符合投資者期待的路徑上,足夠的落地應用轉化,才是AI最終的歸宿。AI產業正在從“輝達一家獨大”走向“一超多強、專用晶片遍地開花”的戰國時代。GoogleTPU已經證明了ASIC路線的可行性,而開源社區正在努力填平軟體鴻溝。或許對於輝達而言,未來的敵人不是AMD,而是那些正在試圖用更高效、更廉價的算力架構,去重構整個AI成本模型的“前戰友”們。 (Diffusion Atlas擴散圖譜)
大摩大幅上調GoogleTPU產量預測:2027年達500萬塊,每50萬塊“外銷”或增收130億美元
大摩預計,GoogleTPU產量在2027年和2028年將分別達到500萬和700萬塊,較此前預期分別增長67%、120%。而這一產量激增可能預示著Google將開啟TPU晶片的直接對外銷售。更具衝擊力的是,報告測算每50萬片TPU外銷,便有望為Google帶來130億美元的額外收入和0.40美元的每股收益。在AI晶片的激烈競賽中,Google的自研TPU正顯露出挑戰現有市場格局的巨大潛力。據追風交易台消息,摩根士丹利12月1日發佈的最新研報顯示,Google自研AI晶片——TPU(Tensor Processing Unit)供應鏈的不確定性正在消退,未來兩年產量預期呈爆炸式增長,這或許是Google準備向第三方大規模銷售TPU晶片的早期訊號。該行基於供應鏈端的最新排查,將GoogleTPU在2027年和2028年的產量預測大幅上調。2027年的預測從約300萬塊上調至約500萬塊,增幅約67%。GoogleTPU若開啟“外銷”模式,將為其開闢新的巨大收入來源。報告測算,每銷售50萬塊TPU晶片,就有可能在2027年為Google增加約130億美元的收入和0.40美元的每股收益(EPS)。01供應鏈訊號2027-2028年產量預期翻倍根據大摩亞洲半導體分析師Charlie Chan的監測,供應鏈端傳出了明確的TPU訂單增加訊號。基於此,大摩對未來的TPU供應量進行了修正:2027年TPU產量預測:從此前的約300萬塊,大幅上調至約500萬塊,增幅高達約67%。2028年TPU產量預測:從此前的約320萬塊,飆升至約700萬塊,增幅更是達到了驚人的120%。報告指出,這意味著僅在2027至2028兩年間,Google就將獲得1200萬塊TPU的供應,而相比之下,過去4年的總量僅為790萬塊。兩年內的產量激增,預示著Google在AI硬體上的投入和佈局正在以前所未有的速度擴張。02供應瓶頸或將打破GoogleTPU外銷策略初露端倪?此前,市場對於Google是否會對外銷售TPU的一大疑慮在於其供應能力。摩根士丹利在報告中也曾將“供應不確定性”列為一個關鍵的制約因素。然而,最新的產量預測資料可能意味著這一“瓶頸或將不再是問題”。報告分析認為,儘管大部分新增的TPU產量仍可能用於Google的自有業務和Google雲平台(GCP)的客戶,但如此龐大的規模——兩年1200萬塊——“揭示了Google通過GCP銷售更多TPU以及將其作為獨立產品進行銷售的潛力”。這被解讀為Google可能正在醞釀一個重要的戰略轉變:從TPU的“自產自用”模式,轉向直接與市場上的AI晶片巨頭進行競爭。1200萬塊TPU在兩年內的產量(相比之下,此前4年為790萬塊)表明,Google有潛力通過GCP銷售更多TPU,並將其作為第一方獨立產品(1P separate offering)提供。如果這一戰略得以實施,Google將從一個AI晶片的“消費者”和“服務提供商”,轉變為一個直接的硬體“銷售商”,從而進入由少數巨頭主導的高利潤AI晶片市場。03“印鈔機”潛力每50萬片外銷PTU或增收130億美元對於市場而言,最核心的問題是:如果Google真的開始對外銷售TPU,這將為公司帶來多大的財務回報?摩根士丹利在報告中給出了一個極為誘人的量化測算。報告明確指出,這一潛在策略對Google的財務影響不容小覷:“每50萬片TPU晶片的銷售,可能在2027年為Google增加約130億美元的收入和0.40美元的每股收益(EPS)。”這一資料為投資者提供了一個清晰的估算模型。如果Google的TPU外銷策略得以實施並取得成功,那怕只是銷售其中一小部分產量,都將為公司貢獻可觀的收入和利潤增長,從而可能重塑市場對Google的估值邏輯,並對現有AI晶片市場的競爭格局產生深遠影響。 (硬AI)
全球晶片業巨震!GoogleTPU晶片橫空殺出,與Meta“密謀”大事!輝達市值蒸發4兆元,“護城河”被攻破?黃仁勳坐不住了
2025年11月,Google市值漲約5300億美元,輝達跌去6200億美元。這一增一減背後,是Meta或“倒戈”採購GoogleTPU晶片,衝擊輝達GPU的主導地位。TPU與GPU技術路線不同,引發華爾街對輝達地位的爭論,“共贏派”認為市場足夠大,“威脅派”則擔憂Google生態威脅。2025年11月,超5000億美元市值在輝達和Google之間發生“大挪移”:Google母公司Alphabet市值增長約5300億美元,劍指4兆美元;而AI晶片“霸主”市值卻蒸發6200億美元(約合人民幣4.39兆元)。這一增一減背後,是一則可能重塑行業格局的行業傳聞:Meta正與Google密談,計畫2027年斥資數十億美元採購GoogleTPU(張量處理單元)晶片。作為輝達的核心客戶,Meta的算力需求曾高度依賴其GPU晶片,“倒戈”將直接衝擊輝達佔據的近85%市場份額。這並非簡單的客戶流失,而是一場技術路線的博弈。Google“十年磨一劍”的TPU晶片,憑2~3倍於GPU的能效比撕開缺口,第七代產品Ironwood性能更是較前代飆升4倍。輝達的CUDA生態護城河是否牢不可破?兆美元AI晶片賽道將迎來何種變局?圖片來源:每經記者 鄭雨航 攝TPU突襲:Google市值漲約5300億美元輝達跌去6200億美元2025年11月,全球AI晶片領域兩大巨頭Google與輝達的股價呈現顯著分化。Google母公司Alphabet本月股價累漲13.87%,年內漲幅擴至69%;而輝達股價同期下跌近12.59%,年內漲幅縮小至27.96%。本月,Google市值累計增長約5300億美元,市值逼近4兆美元;而輝達市值則蒸發6200億美元。這一差異的核心,是市場對AI晶片競爭格局生變的敏感反應。股價分化的引爆點源於11月24日的市場傳聞:Meta正與Google深度磋商,計畫2027年斥資數十億美元採購GoogleTPU晶片部署於自有資料中心,並可能從2026年起租用Google雲TPU算力。作為輝達的核心客戶,Meta若“倒戈”Google,將直接衝擊輝達的市場主導地位。消息迅速引發產業鏈連鎖反應:GoogleTPU聯合製造商博通(負責晶片設計與供應鏈管理,台積電承擔製造)本周股價漲超16%,其他Google產業鏈公司同步走強;而輝達則承壓明顯——即便最新財報業績遠超華爾街預期,股價仍在財報次日逆勢下跌,本周累跌逾2%。疊加“AI泡沫”論調和圍繞OpenAI等明星公司的“循環融資”爭議,輝達股價雪上加霜。研究機構Melius Research分析師本•雷茨(Ben Reitzes)指出,Google是“垂直整合度最高的超大規模廠商”,擁有自研的TPU晶片和定製化的網路裝置,這使其長期來看可能減少對輝達、AMD和Arista Networks等外部供應商的依賴。在本•雷茨看來,Google已實現在AI領域的強勢回歸,其最新升級版GeminiAI模型和自主研發的TPU,讓部分投資者認為Google將提前贏得這場AI戰爭。TPU與GPU的技術分野:“專長生”對決“全能王”AI專用晶片(TPU,張量處理單元)與通用處理器(GPU,圖形處理單元)的技術路線之間的差異,決定了各自的市場定位與競爭力。GoogleTPU的演進之路,是一部歷經七代、長達近十年的技術迭代史。每代TPU都在計算加速、能效和可擴展性上持續精進,鞏固了其作為AI工作負載專用晶片的領先地位,尤其在Google雲生態的大規模模型訓練和推理場景中。第七代產品也是首次外售的TPU產品,此前Google僅提供出租算力的服務。摩根士丹利Brian Nowa團隊在最新報告中指出,到2027年,Google對外出貨TPU或達50萬~100萬片,正式切入全球算力市場。作為應用專用積體電路(ASIC),TPU以“脈動陣列”為核心結構,專為加速神經網路張量運算設計,在AI工作負載下能效比較同期GPU高2~3倍,尤其適合大語言模型(LLM)等需長期訓練的複雜深度學習任務,GoogleGemini、AlphaFold等均依賴其支撐。GPU則以“通用靈活”立足,其數千個平行微型核心本為圖形處理設計。2006年輝達的CUDA平台推出後實現通用計算突破,憑藉可程式設計性與PyTorch、TensorFlow等成熟生態,滲透AI研究、圖形渲染、科學模擬等多領域。對需自訂操作或跨框架切換的開發者而言,GPU的靈活性仍是剛需。簡而言之,GPU是“通用全能選手”,以生態優勢佔據市場主導;TPU則是“AI專業特長生”,憑極致效率在細分領域撕開缺口。華爾街激辯:輝達“護城河”是否穩固?GoogleTPU的強勢突圍,引發華爾街對輝達市場地位的激烈爭論,形成“共贏派”與“威脅派”兩大陣營。“共贏派”普遍認為,市場對GoogleTPU的反應過度,陷入了“零和博弈的謬論”。研究機構Futurum Group的分析師丹尼爾•紐曼(Daniel Newman)認為,AI基礎設施是一個未來規模將達到數兆美元的龐大市場,足以容納Google、輝達、AMD等多家巨頭共存共贏。美國銀行分析師維韋克•阿亞(Vivek Arya)則預測,到本十年末,AI資料中心的市場總規模將從今年的2420億美元增長至1.2兆美元。屆時,雖然輝達市場份額可能從目前的約85%降至75%,但仍將是市場的主導者。投行Wedbush的分析師丹•艾弗斯(Dan Ives)在發給《每日經濟新聞》記者的報告中,將輝達比作“AI革命中無可爭議的洛奇•巴爾博亞(電影《洛奇》的主角,意指冠軍)”。他認為,AI革命的起點和終點都在輝達,這種情況在未來幾年內不會改變。圖片來源:每日經濟新聞 譚玉涵 攝他強調,未來數兆美元的AI支出將使眾多科技巨頭受益,但這不應被誤解為輝達的冠軍地位會動搖。從另一個角度看,GoogleTPU取得進展,就像AMD近期取得成功一樣,是AI晶片市場健康的表現,未來還會有更多巨頭加入這場“AI軍備競賽”。然而,“威脅派”認為,Google是唯一具備從底層晶片、定製網路、編譯器到上層AI模型和應用的全端垂直整合能力的公司。這種能力使其有可能建構一個封閉但高效的生態系統,從而對輝達構成實質性威脅。本•雷茨警告稱,如果Google在AI戰爭中勝出,將衝擊輝達、AMD等硬體供應商以及微軟、亞馬遜等雲服務商。爭議的焦點集中於輝達的核心“護城河”——CUDA軟體平台。瑞穗證券分析師維傑•拉凱什(Vijay Rakesh)指出,CUDA十餘年積累的龐大開發者社群與工具庫,構成極高准入門檻。Google雖然推出了JAX等程式語言,並試圖通過TPU command center等軟體降低使用門檻,但要撼動CUDA的“標準”地位依然任重道遠。交銀國際分析師王大衛也認為,AI模型仍然處於不斷演進過程中,ASIC雖有能耗、效率等優勢,但前期投入以及與演算法結合的技術門檻較高,而有能力/銷售規模自研ASIC晶片的公司數量有限。ASIC短期市佔率提高不影響輝達行業領先地位。不過,市場裂痕已現:Google此前宣佈向AI初創公司Anthropic供應多達100萬塊TPU晶片,這一舉動被視為對輝達主導地位的長期挑戰。此次與Meta的潛在合作,更是可能推動TPU成為輝達晶片在超大規模客戶中的一個重要替代選項。資管公司Future Fund的加里•布萊克(Gary Black)認為,雖然目前輝達晶片仍是算力的黃金標準,但Google與Meta的合作傳聞,標誌著替代方案的崛起。對此,輝達正積極應對:CEO黃仁勳密切追蹤TPU進展,通過投資繫結OpenAI、Anthropic等潛在客戶,並強調其平台“領先行業一代”“支援全場景AI計算”,以反擊TPU的專用性侷限。 (每經頭條)
GoogleTPU - 最好的輝達替代方案?
Tensor Processing Unit(TPU)張量處理單元,是Google為機器學習和高性能計算任務量身定製的專用晶片系列。TPU首發於2016年,並率先應用於AlphaGo,到如今已是第七代Ironwood,10年間,早已成為AI算力領域不可忽視的力量,是Google資料中心頂層構架的強有力支撐。TPU並非通用處理器,而是專門為AI計算中大量的矩陣和張量運算最佳化的專用積體電路Application-Specific Integrated Circuit(ASIC)。簡單來說,ASIC晶片是為了特定應用而客制化的晶片,至於輝達的GPU,則是一種通用型的處理器,適用於更多元功能。ASIC晶片在執行這些特定任務時,相比CPU甚至GPU往往能提供更高的效率和更低的功耗。在TPU的設計上,Google主導整體架構與功能定義,博通Broadcom參與了部分晶片的中後端設計工作,目前,Google TPU主要由台積電(TSMC)代工生產。Marvell預計,到2028年全球AI ASIC市場規模將達到554億美元,而Google正引領這一市場,當前佔據絕大多數的市場份額。隨著大語言模型進入兆參數時代,AI計算任務從探索性的“訓練”大規模走向商業化的“推理”。GPU作為通用算力單元,其高昂的成本(輝達H100單卡市價超2萬美元)和功耗成為AI應用普及的瓶頸。TPU作為專為張量運算(AI核心計算任務)設計的ASIC晶片,展現出極致的性價比優勢。據悉,GoogleTPU算力成本僅為OpenAI使用GPU成本的1/5,性能功耗比更是優於同代GPU。蘋果、OpenAI、Anthropic等頭部AI玩家目前已開始租用GoogleTPU進行模型訓練與推理,標誌著市場需求正從對GPU的單一依賴轉向“GPU+TPU”的多元化格局。而未來,Google也在計畫在自有設施以外的外部資料中心部署TPU。據悉,Google近期已經開始接觸了相當數量的中小型雲端運算公司,並提議引入TPU。2025年Google TPU的全年出貨量預計為250萬⽚。TPU   V5系列總出貨量預計為190萬⽚,其中V5E佔⽐約120萬⽚,V5P佔⽐約70萬⽚,TPU V6系列(包括V6E和即將推出的V6P)預計總出貨量為60萬⽚,⽬前僅V6E在市場上銷售,⽽V6P將在第四季度上市,約10-20萬⽚左右。預計到2026年,總體TPU銷量將超過300萬片。據悉,Google第七代TPU Ironwood性能接近B200。FP8算力達4614 TFLOPS,配192GB HBM3e視訊記憶體與7.3TB/s頻寬,支援9216顆晶片互聯, Google TPU已成為一股不可小視的力量。分析師Gil Luria在最新報告中直言,Google TPU如今已成為“最好的輝達替代方案”。上周北美市場Google大漲,GoogleTPU的受關注度正在逐漸升溫,分析師與前沿AI實驗室的研究人員和工程師交流後發現,業內普遍看好GoogleTPU。分析師甚至認為,若Google將TPU業務與DeepMind部門合併並將它們分拆上市,估值或將高達9000億美元(作為參考,Google最新市值約2.8兆美元),“這將是Alphabet最具價值的資產之一”,而今年1月,其給這部分業務的估值是7170億美元。筆者認為,Google TPU是否是輝達GPU最好的替代方案,還需綜合考量,但Google TPU的最大威力,不是今天搶了多少片GPU的份額,而是把AI算力從“稀缺的高溢價商品”變成“可按需調度的基礎設施”,這是其最大的意義。現如今,GoogleTPU在AI推理和大規模訓練場景中表現出色,但其專用性決定了其適用範圍相對較窄。對於追求極致性能和成本效益的AI項目,TPU是有力選擇;而對於需要通用計算能力或依賴成熟生態的場景,GPU仍是主流。但無論如何,以博通和Google的勢力為代表的AISC陣營,正在逐漸開始走向AI世界的中心。 (AI領投)