#產業鏈
突發!兆規模起飛!智能算力TPU產業鏈深度分析!2025
前言:算力革命的第三次浪潮與兆市場拐點2025年第三季度,全球AI半導體市場單季度規模歷史性突破320億美元,其中專用AI加速器佔比首次超越通用GPU,達到52%的臨界點。這一結構性逆轉標誌著算力基礎設施正式邁入"專用計算期"——繼2018-2022年的通用計算期(CPU+GPU主導)和2023-2024年的加速計算期(GPU叢集規模化)之後,算力革命迎來第三次浪潮。GoogleTPU v7(代號Ironwood)的量產與輝達Blackwell架構的全面普及,共同推動了智能算力進入"TPU-GPU雙雄時代"。根據Semianalysis最新預測,2025年全球智能算力市場規模將達到1.2兆美元,年同比增長83%,其中TPU產業鏈貢獻度有望突破35%,折合人民幣約3兆元規模。這一數字背後,是AI大模型從"規模競賽"轉向"效率革命"的深層邏輯:當GPT-5以18兆參數、Gemini 3以五兆參數刷新能力邊界時,單位算力的經濟性與能效比成為決定產業可持續發展的核心變數。本文基於對92份行業深度報告、31家核心企業2025年半年報及MLPerf v4.0最新測試資料的交叉驗證,系統解構TPU產業鏈的生態系統、技術突破、競爭格局與投資邏輯。第一章 智能算力產業全景:從GPU壟斷到架構多元化1.1 算力基礎設施演進三階段模型第三階段:專用計算期(2025-)核心硬體:TPU v7、Trainium2等ASIC晶片與GPU形成混合架構,算力規模進入10-100 EFlops時代技術特徵:脈動陣列、光互連、Chiplet封裝實現系統級最佳化,Gemini 2.5、Sora視訊生成等模型的訓練效率提升3-5倍市場格局:TPU在雲端訓練市場份額從2024年的12%猛增至2025年的22%,輝達份額降至76%,"雙寡頭"競爭格局成型1.2 2025年全球智能算力市場結構全景圖市場規模:2025年全球智能算力市場規模預計達1.22兆美元,同比+83.2%,其中訓練算力市場4610億美元(37.8%),推理算力市場7590億美元(62.2%)。硬體構成:GPU:出貨量約450萬顆,市場規模7060億元,佔比58%。輝達342萬顆(76%),AMD 68萬顆(15%),國產40萬顆(9%)TPU:出貨量約180萬顆,市場規模2680億元,佔比22%,同比暴增210%。Google146萬顆(81%),其中外部出貨32萬顆,同比增長340%ASIC/FPGA:出貨約120萬顆,市場規模2360億元,佔比20%區域分佈:北美5140億美元(42%)、中國3310億美元(27%)、歐洲2200億美元(18%)、亞太其他1650億美元(13%)。第二章 TPU產業鏈全鏈路解析:從矽片到叢集的垂直解構2.1 上游:核心材料與IP架構的"卡脖子"戰場EDA工具:Synopsys佔據TPU設計全流程67%份額,其Fusion Compiler在4nm時序收斂速度比競品快40%;國產華大九天在14nm以上製程實現68%覆蓋率,但4nm全流程工具國產化率不足5%。IP核授權:ARM Holdings的NPU IP佔據TPU類晶片41%授權份額;GoogleTPU v7脈動陣列"動態路由"技術專利封鎖至2045年,構成十年技術壁壘。製造材料:台積電4nm晶圓單價漲至2.3萬美元;日本JSR、東京應化壟斷85% ArF光刻膠份額;ABF封裝基板被味之素壟斷,佔TPU封裝成本18%。2.2 中游:晶片製造與封裝測試的產能戰爭先進製程:台積電CoWoS產能達12萬片/月(+140%),其中40%專供GoogleTPU v7。中芯國際14nm FinFET月產8萬片,通過多重曝光實現12nm等效性能,良率70%。封裝技術:GoogleTPU v7採用4-chiplet異構整合,有效良率從55%提升至75%,成本下降22%至2180美元。通富微電CoWo-S產能2萬片/月,通過Google認證。2.3 下游:應用場景與算力部署的實戰檢驗雲端叢集:GoogleApollo叢集(9216顆TPU v7)實現42.5 EFlops總算力,PUE低至1.08,Gemini 2.5訓練周期縮短67%。邊緣爆發:特斯拉D1晶片(144 TFLOPS)年出貨量超300萬顆;海康威視DS-6700TPU模組功耗僅3.2W,2025H1營收18億元(+180%)。模式創新:Fluidstack通過"算力承兌匯票"模式獲得黑石50億美元融資,毛利率達35%;Lambda Labs估值42億美元,社區使用者80萬。第三章 TPU與GPU技術參數深度對比:架構之戰的底層邏輯3.1 旗艦產品性能對決(2025年實測資料)核心發現:TPU v7峰值算力僅比B200高44%,但MFU領先16個百分點,實際有效算力差距擴大至1.65倍。功耗低21%,記憶體訪問能耗降低65%,這是其系統級優勢的核心。3.2 互聯技術:ICI光互連 vs NVLink電互連GoogleICI:採用光路交換機(OCS),延遲120ns,功耗0.8pJ/bit,萬卡叢集有效頻寬保持率92%,單節點故障可在10ms內繞過。輝達NVLink 5.0:頻寬1.8TB/s,但跨機架需Quantum-2交換機(35萬美元/台),萬卡叢集有效頻寬降至68%,功耗1.3pJ/bit。3.3 軟體生態:CUDA護城河 vs XLA編譯器Google2025年三大破局動作:PyTorch原生支援:PyTorch XLA v2.0支援Eager Execution模式,程式碼改動量<5%,Llama 3.1遷移僅需3天模型庫開放:Google Model Garden提供72個預編譯大模型一鍵部署激進定價:TPU v5e定價1.2美元/晶片/小時,較H100低57%,3年合約可再降30%MFU真相:TPU v7通過XLA靜態編譯實現78%利用率,而B200因核心啟動開銷、執行緒束分化等問題僅達62%。在175B參數GPT-3訓練中,TPU叢集訓練時長領先29%。第四章 AI大模型與應用的算力需求:指數級增長的數學解構4.1 訓練成本對比GPT-5訓練成本估算(18兆參數):H100叢集:15360張卡,訓練9.4個月,成本6.4億美元TPU v7叢集:10240顆晶片,訓練6.7個月,成本3.8億美元結論:TPU v7在訓練效率上領先GPU 41%,能耗成本僅為H100的40%。推理算力爆發:全球推理算力需求年複合增長率達127%,2025年視訊生成算力消耗是文字的10,000倍,單次4K@60fps視訊生成需1024張H100運行2.5小時(成本860美元),TPU v7通過光互聯縮短至1.8小時(成本480美元)。第五章 全球TPU產業鏈競爭格局:Google帝國的擴張與反擊5.1 Google的戰略轉型出貨量躍遷:2025年GoogleTPU外部出貨32萬顆,同比+340%,佔比從12%提升至30%,目標2027年達50%。標竿客戶:Anthropic採購100萬顆TPU v7(其中40萬顆直接銷售,價值100億美元;60萬顆通過GCP租賃,對應420億美元RPO),Meta、xAI等頭部AI實驗室均在評估TPU方案。行業滲透:與特斯拉合作開發D2晶片(2026年量產);與輝瑞合作AlphaFold 3訓練,時間從7天縮短至1.5天;摩根大通使用TPU v5e將風控延遲從50ms降至8ms。5.2 輝達的防守反擊Blackwell架構防禦:B200 NVL72系統強調"系統級性能",CUDA 12.8新增300個MoE最佳化核心,對超大規模客戶提供35%戰略折扣。供應鏈反擊:提前18個月鎖定海力士、美光100% HBM3E產能,與台積電簽訂90% CoWoS產能優先協議,導致TPU v7交付周期從12周延長至16周。網路業務第二曲線:網路業務單季度收入82億美元(+162%),Quantum-2交換機毛利率82%,試圖用Spectrum-X開放標準對抗ICI封閉生態。5.3 中國陣營的攻堅戰華為昇騰910B:達文西3.0架構,14nm製程功耗600W(比TPU v7高9%),通過Atlas 900叢集(4096顆)實現61% MFU。阿里雲採購12萬顆,佔其AI晶片採購量15%。寒武紀思元370:7nm製程,功耗45W,專注邊緣推理,2025年營收28億元(+150%),避開雲端訓練紅海。技術瓶頸:國產EDA工具4nm全流程國產化率不足5%,14nm去美化產線依賴ASML 1980Di光刻機(僅12台),良率70%。第六章 投資機遇與風險預警:兆賽道的冰與火6.1 上游材料:HBM與光電晶片的黃金時代HBM:2025年全球需求1200萬片(+110%),價格從12美元/GB漲至16.8美元/GB。華海清科CMP裝置市佔率18%,營收65億元(+85%);深科技HBM封測收入佔比提升至35%。光電晶片:Lumentum MEMS微鏡陣列佔GoogleOCS採購量60%,營收28億美元(+140%);仕佳光子AWG晶片進入Google供應鏈,TPU相關收入5.2億元。6.2 中游製造:先進封裝與Chiplet崛起通富微電:CoWo-S產能2萬片/月,2026年擴至3萬片/月,服務GoogleTPU v5e、AMD MI325X,毛利率42%。Chiplet戰略:14nm小晶片良率85%,拼接後等效7nm性能,規避先進製程封鎖。芯原股份提供UCIe互聯IP平台,摩爾線程"蘇堤"晶片算力達1500 TFLOPS。6.3 風險因素預警技術迭代風險:IBM光子計算晶片能效達10 PFLOPS/W(TPU v7的2000倍),但僅支援線性運算,2030年前或分流15-20%算力需求。地緣政治風險:2025年壁仞科技、摩爾線程、燧原科技相繼被列入實體清單,ASML 1980Di以下光刻機可能禁售。產能過剩風險:2026年全球GPU/TPU產能或達需求的1.5倍,H100二手價已跌30%至2.8萬美元,2026年價格可能再跌20-30%。第七章 算力經濟學的深層邏輯:TCO與商業模式重構7.1 訓練叢集TCO對比(1000 PFlops規模,4年周期)結論:儘管單卡採購成本略高,TPU系統級TCO優勢達16%,這是Anthropic選擇TPU的根本原因。7.2 Neocloud的資產負債表外融資模式Fluidstack通過Google420億美元RPO授信獲得30億美元算力信用額度,以1.8美元/晶片/小時轉租Anthropic(較GCP低35%),再以客戶合同抵押獲得黑石50億美元貸款。模式本質:Google專注硬體研發,Neocloud成為"算力二房東",金融機構獲取8-10%穩定收益,實現輕資產營運。第八章 技術前沿與未來演進TPU v8 "Sundance"(2026年Q4發佈):3nm製程,512×512脈動陣列,BF16算力1.2 PFLOPS,256GB HBM4,OCI 2.0光互聯延遲降至50ns。光子計算:Lightmatter晶片能效達10 PFLOPS/W,2026年推出混合光電晶片,若突破非線性計算,2030年可能顛覆TPU/GPU格局。量子計算:IBM Condor 1000量子位元處理器作為AI超算的"協處理器",在組合最佳化領域提供1000倍加速。第九章 中國算力產業的自主突圍東數西算二期:2025-2027年總投資3800億元,新增800 EFlops算力,其中國產TPU叢集佔40%(320 EFlops)。技術突破:中芯國際14nm良率突破70%,昇騰910B性能接近A100的85%,PyTorch國產後端支援率從72%提升至90%。投資策略:首選HBM產業鏈(華海清科)、光互連(仕佳光子)、先進封裝(通富微電);次選國產TPU設計(華為海思)、邊緣應用(海康威視);迴避傳統GPU產業鏈。結論:雙雄時代的中國機遇2025年的智能算力產業,正在經歷從GPU絕對壟斷到TPU-GPU雙雄並立的歷史性轉折。Google用十年打磨的TPU技術堆疊,在TCO、能效比、系統級性能上已具備挑戰輝達的硬實力;輝達憑藉CUDA生態、網路業務與Blackwell架構,仍守住60%市場份額。這場戰爭推動算力成本下降50%,加速AI應用普及。中國憑藉全球最大應用市場、最強政策執行力與最完整產業鏈配套,有望在2027-2030年實現從"被動替代"到"主動定義"的跨越。這是一場必須打贏的戰爭,也是一次不容錯過的機遇。 (AI雲原生智能算力架構)
中國中央經濟工作會議,即將召開
又到一年歲末時。北京,即將迎來一年中最熾熱、最關鍵的“思想碰撞”與“戰略定調”時刻。這場會議,便是每年12月如期而至的中央經濟工作會議。它沒有兩會那般萬眾矚目,但其決策的深度與力度,往往更為精準和超前。如果說兩會描繪的是年度“施工圖”,那麼中央經濟工作會議敲定的,則是來年乃至更長時間的“設計總綱”與“基礎地基”。歷史是最好的預言家,讓我們把時鐘撥回2016年。那年的會議,一句石破天驚的“房子是用來住的,不是用來炒的”,如一道凜冽的寒光,劃破了房地產狂飆突進二十年的夜空。當時,多少沉浸於“房價永漲”迷夢中的人不以為意,甚至嗤之以鼻。然而,時間給出了最冷酷的判決:那幾乎就是中國房地產市場歷史大頂的“鳴金鐘”。讀懂那句話的人,悄然抽身;懵懂無知者,則在高位接下了一生中最沉重的“籌碼”。這就是頂層設計的威力。它不生產具體的商品,卻定義市場的規則;它不直接給你發錢,卻塑造了財富流動的河床。今天,我們再次站在一個極具標誌性的十字路口。2025年,不僅是“十四五”規劃的收官之年,更是面向“十五五”的奠基之年。這場會議,既要完成一場艱巨的“期末大考”,更要謀劃一幅全新的“五年藍圖”。其複雜程度與戰略意義,堪比一場“經濟領域的政治局會議”。那麼,當前的中國經濟究竟面臨怎樣的“三重門”?決策層手中又有那些“工具箱”?這場會議將如何“排兵佈陣”?而最關鍵的是,我們每一個普通人,該如何在這幅宏大的國家經濟版圖中,找到自己的坐標,甚至順勢而為,撬動個人命運的槓桿?話不多說,上菜!今年的中央經濟工作會議,註定被賦予非同尋常的歷史重量。它嵌在兩個宏大敘事的關鍵節點上,就像一部上下兩集的史詩巨著,在此處完成承上啟下的轉場。 1、“十四五”的終局審視 “十四五”規劃,誕生於世界百年變局加速演進、新冠疫情全球肆虐的背景下,是一份帶著“戰時”色彩和戰略雄心的發展綱領。裡面列出的不是願望清單,而是軍令狀:科技自立自強:“卡脖子”技術攻堅戰打到那了?國產大飛機C919是否已真正商業翱翔?光刻機的“至暗時刻”是否已見曙光?晶片產業鏈的自主可控率提升了幾個百分點?產業鏈現代化:我們的製造業“微笑曲線”是否向上攀爬了?高端裝備、新材料、生物醫藥等戰略性新興產業的脊樑是否更硬了?綠色轉型:“雙碳”目標下的能源革命,新能源裝機容量是否已超越火電?綠色生產生活方式是否深入人心?共同富裕:收入分配格局有無最佳化?城鄉差距、區域差距的縮小有無實質性進展?這次會議,就是對這份“五年答卷”的一次集中批閱和公開講評。成績好的,會得到褒獎並固化為經驗;進度滯後的,將被重點“點名”,並在接下來的“十五五”中施加更大壓力。這絕非簡單的走過場,而是關係到國家信用和戰略執行力的嚴肅議題。 2、“十五五”的戰略預演如果說“期末考”關乎過去的承諾,那麼謀劃“十五五”則關乎未來的國運。2026-2030年這五年,將是中國跨越“中等收入陷阱”、邁向高收入經濟體的最關鍵衝刺期,也是應對全球格局深度重構的“戰略相持期”。本次會議,必將提前釋放關鍵訊號:1. 核心目標定量化:到2030年,我們的經濟總量要達到什麼規模?人均GDP要突破多少美元?中等收入群體要擴大到幾億人?這些數字不會在會上直接公佈,但支撐這些目標的政策基調、資源傾斜方向,一定會清晰顯現。2. 核心矛盾定性化:未來五年的主要矛盾是什麼?是解決內部“有效需求不足”?還是應對外部“極限打壓遏制”?或是統籌兩者,實現“在鬥爭與合作中發展”?不同的定性,將匯出截然不同的政策工具箱優先順序。3. 核心路徑清晰化:經濟增長的“新引擎”到底是什麼?是繼續依靠傳統基建和房地產的“老馬”,還是全力鞭策新質生產力這匹“新駒”?科技創新、內需消費、綠色低碳,這三駕馬車,誰的韁繩會被拉得更緊?簡單說,這場會議,是觀察中國未來五年國家意志最清晰的窗口。它決定的不是明天股市的漲跌,而是未來五年社會財富創造的主要方向與分配的邏輯。看懂它,你才能在時代的浪潮中,不被淹沒,甚至踏浪而行。會議要解決問題,首先得認清問題。當下的中國經濟,正如同一位身負行囊的攀登者,面前橫亙著三座需要翻越的大山。每一座,都考驗著體魄、智慧和耐力。第一重山:內需的“冰河期”與“內卷”的死循環表面看,是CPI(居民消費價格指數)在零附近“躺平”,PPI(工業生產者出廠價格指數)連續三十多個月“潛水”。深層次看,這是一場社會預期與收入信心的“寒潮”。老百姓為什麼不花錢了?預期轉弱: 今天裁員潮,明天降薪新聞,後天AI要取代我的崗位。當對未來的收入充滿不確定性時,人的本能反應就是“囤糧過冬”,削減一切非必要開支。從“消費升級”迅速滑向“消費降級”,甚至“消費消失”。債務擠壓: 前些年房價高漲期背上的房貸,如同一把“懸頂之劍”,吞噬了大量中產家庭的月度現金流。收入增速放緩甚至下降,但債務剛性支出不變,可自由支配的收入自然被大幅壓縮。保障焦慮: 教育、醫療、養老,這三座大山雖然國家在努力“愚公移山”(集采、養老金上調等),但完全消除焦慮非一日之功。為了應對未來的“大額潛在支出”,儲蓄仍是首選。老百姓不花錢,企業的產品就賣不出去。於是,中國經濟最慘烈的景象出現了——“內卷式通縮”。企業之間為了搶訂單、活下去,不是比拚技術創新和品牌價值,而是進行慘烈的價格血戰。從日常消費品到高科技的“新三樣”(新能源車、鋰電池、光伏),價格戰烽煙四起。結果是,企業利潤越打越薄,員工收入更難增長,研發投入無力追加,最終陷入“低價競爭-利潤萎縮-降薪裁員-需求進一步萎縮”的死亡螺旋。這不僅僅是經濟問題,更是一個社會財富分配和循環機制的問題。當經濟增長的成果,過多沉澱在少數環節(如早期房地產、某些壟斷平台),而未能有效轉化為廣大勞動者持續增長的收入時,需求引擎就會熄火。這就像一個人身體,血液循環不暢,四肢便會冰冷麻木。第二重山:房地產的“重力塌陷”與金融體系的“錨點危機” 如果說內需不足是“慢性病”,那麼房地產的深度調整,則是一次急性的“器官功能衰竭”。自2021年見頂以來,房地產市場經歷了“預期扭轉-銷售冰凍-價格陰跌-房企暴雷-債務危機-價格加速下跌”的完整下行鏈條。如今,這已不是簡單的周期性調整,而是底層邏輯的根本性重塑。“房住不炒”從口號變為現實,金融屬性剝離,居住屬性回歸。這個過程,必然伴隨劇烈的陣痛。其危險性在於,房地產在中國經濟金融體系中,扮演著“信用放大器”和“財富儲存器”的核心角色。對地方政府: 土地財政曾是城市建設的“奶娘”。賣地收入銳減,直接導致地方財政緊張,保民生、保工資、保運轉壓力巨大,更遑論投資新基建、發展新產業。對金融系統: 房產是銀行最重要的抵押物,房貸是銀行最優質的資產(違約率極低)。房價持續下跌,意味著抵押物價值縮水,銀行資產質量承壓。更可怕的是,如果形成“房價下跌-資不抵債-斷供潮-銀行壞賬激增-收緊信貸-經濟進一步惡化”的負反饋,將可能引發系統性金融風險的導火索。這絕非危言聳聽,2008年美國次貸危機、90年代日本“失落的二十年”,其劇本的開篇,都是房地產泡沫的破裂。對居民財富: 中國家庭近70%的財富壓在房產上。房價縮水,意味著家庭資產負債表受損,帶來的不僅是紙面財富蒸發,更是消費信心的徹底凍結和“縮表”(減少負債、增加儲蓄)行為的強化,進一步加劇第一重山的“冰河期”。因此,穩住房地產市場,避免“硬著陸”,已不僅是經濟問題,更是金融安全和社會穩定的底線問題。第三重山:川普的“不確定”與全球化“碎片化”外部的風浪從未停息,而川普2.0時代的到來,給這風浪加上了“反覆無常”和“極限施壓”的戲劇性特效。川普的核心邏輯是“交易的藝術”和“美國優先”的赤裸現實主義。在他眼中,一切皆是買賣,一切皆可交易,包括盟友關係和國際規則。對中國,他繼承並升級了“關稅大棒”、“科技脫鉤”、“產業回流”的組合拳。2025年前10個月對美出口兩位數的大幅下滑,只是序幕。未來幾年,我們將面臨:經貿摩擦常態化: 關稅戰、貿易調查、制裁名單將成為“家常便飯”,企業出口的不確定性和成本大幅增加。科技圍堵精準化: 從晶片到人工智慧,從生物技術到量子計算,關鍵領域的“小院高牆”會越砌越高,試圖將中國鎖定在全球產業鏈的中低端。規則體系陣營化: 美國正極力拉攏盟友,建構排除中國的“平行體系”(如印太經濟框架、晶片聯盟等),企圖重塑全球貿易和科技規則。外循環受阻,意味著我們依靠國際市場消化過剩產能、換取先進技術、積累外匯儲備的傳統路徑變得崎嶇難行。這倒逼我們必須將經濟發展的立足點,更深地轉向國內大循環,但同時也帶來了短期內出口企業困難、就業壓力傳導等一系列挑戰。這三重壓力,並非孤立存在,而是相互疊加、彼此激化,構成了一個複雜的“壓力立方體”。中央經濟工作會議,就是要在這個立方體中,找到那個最關鍵的受力點,撬動全域。第三部分:歷史的“工具箱”與今天的“組合拳”——政策如何破局?面對困局,決策者並非在真空中創造政策。縱觀中國數千年的治理智慧,乃至全球經濟發展的歷史,許多政策邏輯早已有跡可循。今天我們的許多“新招”,細細品味,都能找到歷史的“舊影”。讓我們借幾面歷史的“鏡子”,照一照當下的政策選擇。 1、從“管仲經濟學”看“宏觀政策的鬆緊之道”春秋時期的齊國國相管仲,被後世譽為“中國經濟學家第一人”。他有一個著名的觀點:“治國之道,必先富民。民富則易治,民貧則難治。” 如何富民?他不僅是思想家,更是實踐家,其核心手段之一就是靈活運用國家宏觀調控。在《管子·國蓄》中,他提出“歲有凶穰,故谷有貴賤;令有緩急,故物有輕重。人君不理,則畜賈游於市,乘民之不給,百倍其本矣。” 意思是,年景有好壞,糧價有高低;國家徵調有緩急,物資價格有波動。如果君主不加以調控,那麼奸商就會操縱市場,在百姓困頓之時牟取暴利。為此,管仲創設了“平準法”(亦為後世“常平倉”思想源頭):國家在糧價低時收購儲存(“斂之以輕”),在糧價高時拋售平抑(“散之以重”)。同時,他善於運用貨幣和價格政策,“刀幣者,溝瀆也;號令者,徐疾也。” 把貨幣流通比作溝渠,把政令比作控制水流緩急的閘門。對應到今天,我們的貨幣政策和財政政策配合,正是現代版的“管仲之術”。貨幣政策之“閘門”:從“穩健”轉向“適度寬鬆”,就是有意識地“開閘放水”,降低整個經濟體系的融資成本(降息),增加貨幣供應(降准),防止因通縮預期和債務壓力導致的經濟“血液”凝固。這好比在旱季開閘引水,灌溉農田(實體經濟)。財政政策之“溝渠”與“收購”:“更加積極”的財政,就是修建和疏通“溝渠”,確保水流(資金)能精準地流向最需要的地方——“兩重”項目(重大戰略、重點領域)。而增發超長期特別國債、地方政府下場收購商品房,則正是“平準法”的現代運用。在市場失靈(房價非理性下跌、優質資產被錯殺)時,國家以“最終購買者”和“穩定器”的身份入場,平抑波動,托住底線,防止系統性風險。這種“貨幣寬鬆提供水源,財政積極引導流向,國家平準穩定預期”的組合,是應對有效需求不足和資產價格下行壓力的經典“中式宏觀調控”,其思想脈絡,可謂源遠流長。2、從“羅斯福新政”與“凱恩斯主義”看“擴大內需的政府角色”20世紀30年代,美國深陷大蕭條,股市崩盤,銀行倒閉,失業率高企,需求極度萎縮。當時的總統胡佛信奉自由市場自我修復,結果危機愈演愈烈。直到羅斯福上台,推行以“3R”(Relief救濟、Recovery復興、Reform改革)為核心的“新政”,核心就是政府大規模干預經濟,創造有效需求。他通過“以工代賑”(如田納西河流域治理、修建大量公共工程),直接為數百萬人提供了工作崗位和收入;通過建立社會保障體系(如《社會保障法》),給民眾未來以安全感,從而敢於消費;通過整頓金融秩序(如《格拉斯-斯蒂格爾法案》),恢復金融系統的信用功能。其背後的理論支撐,正是凱恩斯主義:在私人部門需求不足時,政府必須挺身而出,充當“最後的花錢人”,通過擴大公共支出,創造就業和收入,進而帶動私人消費和投資,使經濟走出衰退循環。對應到今天,我們“擴大內需”的諸多舉措,與新政邏輯高度共鳴:穩就業就是“以工代賑”的升級版:扶持吸納就業最多的民營中小企業、個體戶,就是穩住社會收入的“基本盤”。加快培育戰略性新興產業(人工智慧、商業航天等),不僅是產業升級,更是為高素質人才創造高品質的“新飯碗”。預計2030年AI創造千萬新崗位的願景,就是現代版的“田納西工程”。完善社會保障就是“消除後顧之憂”:提高養老金、推進藥品耗材集采、建構普惠托育體系,這些都是在做羅斯福建立“社會安全網”同樣的事情——減少老百姓為教育、醫療、養老的預防性儲蓄,讓他們敢把今天的錢花在消費和提高生活質量上。創造新消費場景就是“激發潛在需求”:IP經濟、首發經濟、銀發經濟、冰雪經濟……這些都是在基本物質需求滿足後,挖掘“情緒價值”、“健康價值”、“體驗價值”等新的消費增長點。政府通過規劃引導、基礎設施配套(如建設冰雪場地、適老化改造社區),就是在為這些新需求“鋪路架橋”。歷史告訴我們,當市場這只看不見的手“失靈”時,政府這只有形的手必須果斷、有力、且方向正確地伸出來。這並非要走計畫經濟的回頭路,而是在現代混合經濟中,履行其應有的“穩定器”和“助推器”職能。3、從“商鞅變法”與“王安石變法”看“新舊動能轉換的陣痛”任何一次深刻的經濟結構轉型,都伴隨著巨大的利益調整和社會陣痛。中國歷史上兩次著名的變法——秦國的商鞅變法與北宋的王安石變法,雖然成敗殊異,但其面臨的“新舊之爭”核心,今天依然值得我們深思。商鞅變法,核心是“廢井田、開阡陌、獎勵耕戰”。它徹底廢除了舊的貴族土地世襲制度(舊動能),確立了土地私有和自由買賣,並建立了一套以軍功授爵的嶄新上升通道(新動能)。變法觸動了舊貴族的核心利益,商鞅本人也最終車裂身亡,但變法成果被固化,秦國由此建立起遠超六國的制度優勢和動員能力,為統一天下奠定了最堅實的經濟與軍事基礎。其成功關鍵在於:確立了壓倒性的新規則,並讓絕大多數人(新興地主、農民、士兵)從新規則中看到了明確的、巨大的收益,從而形成了支援變革的廣泛基礎。王安石變法,初衷也是富國強兵,推出了青苗法、募役法、方田均稅法等一系列旨在“理財”的政策。但其許多措施在推行中嚴重走樣,如青苗法本為助農,卻變成官府強行攤派貸款牟利;新政未能有效創造新的財富增長點,反而在官僚體系的內耗和既得利益集團的阻撓下,加劇了社會矛盾,最終人亡政息。其教訓在於:改革若不能清晰培育出強大的新利益群體,無法有效打破舊體系的束縛,反而可能被舊體系扭曲利用,加劇內卷。對應到今天,我們發展“新質生產力”,推動經濟從要素驅動向創新驅動轉型,正是一場波瀾壯闊的“現代變法”。 “破舊”之艱:逐步擺脫對房地產和傳統基建的過度依賴(舊動能),意味著與之繫結的地方政府融資模式、金融機構業務模式、相關從業人員的發展路徑,都需要經歷深刻調整。這必然伴隨陣痛,如同“刮骨療毒”。“立新”之要:關鍵在於,能否像商鞅變法那樣,為全社會清晰地塑造出投身新質生產力所能獲得的巨大回報。這需要:資本市場支援:讓那些真正搞研發、有技術的創新企業,能在科創板、北交所獲得高估值、便捷融資,讓早期投資者獲得豐厚回報,樹立“創新造富”的標竿。智慧財產權保護:讓“知本”真正成為“資本”,讓發明家、科學家能憑藉專利獲得體面收入和崇高地位,而不再只是“為愛發電”。產業政策精準:像當年佈局高鐵、新能源一樣,集中力量在人工智慧、量子資訊、生命科學等未來產業進行“飽和式投入”,打造出幾個具有全球競爭力的產業叢集,從而吸納高端人才,形成示範效應。中央經濟工作會議,在“新舊動能轉換”這個議題上,需要的不僅是給出方向,更是要拿出一套能讓“新動能”迅速長大、讓“舊動能”平穩轉型的、具有可操作性的系統性方案,避免陷入“王安石困境”。宏大敘事最終要落到微觀生活。中國的大棋局,最終會化作我們每個人身邊的細雨微風。看懂會議,就是為了在風起於青萍之末時,調整好自己的帆。一、負擔減輕:房貸“減壓閥”:適度寬鬆的貨幣政策下,LPR(貸款市場報價利率)繼續下調是大機率事件。對於背負房貸的家庭,這將是真金白銀的減負。如前所述,一筆百萬房貸,利率從高位下降兩三個百分點,月供減少上千元,總利息節省數十萬,相當於國家幫你“漲了工資”。這是最直接的獲得感。住房“新選擇”:地方政府、國企下場收購存量房轉作保障性租賃住房,不僅是為了穩樓市,也是在建構“市場+保障”的二元住房體系。未來,年輕人未必需要掏空“六個錢包”去追高商品房,申請政府主導的、租金穩定的長租房或保障房,將成為可行且體面的新選擇。住房壓力降低,生育、消費的意願才可能回升。育兒“神助攻”:普惠托育體系的“1+N”網路一旦建成,將極大解放雙職工家庭,尤其是女性。社區嵌入式托育、單位托兒所等模式,既能降低經濟成本,又能緩解“隔代育兒”的矛盾與“無人看管”的焦慮。這或許比直接發現金補貼,更能提升年輕人的生育意願。二、職業新航道:對於職場人和創業者而言,國家的產業風向標就是最好的“就業指南”和“創業地圖”。1. 硬科技“衝鋒隊”:人工智慧、商業航天、低空經濟、人形機器人、6G、腦機介面……這些不再是科幻概念,而是國家真金白銀投入、亟需人才的“新邊疆”。如果你是相關專業的工程師、科學家,或是有跨界整合能力的複合型人才,這裡將是職業發展的“快車道”。即使不是技術核心,與之相關的技術銷售、智慧財產權服務、產業投資、合規諮詢等周邊職業,也將水漲船高。2. 銀發經濟“開拓者”:中國正以人類歷史上最快的速度步入深度老齡化。這不僅是挑戰,更是巨大的“銀色富礦”。   · 服務類:專業化的老年護理、康復治療、營養管理、心理慰藉,需求將呈指數級增長。成為一名持有專業資質、富有愛心的“老年健康管理師”,其社會價值和收入前景不亞於許多白領。   · 產品類:智能穿戴裝置(防跌倒監測、健康資料追蹤)、適老化家居改造(防滑地面、智能照明、助力設施)、便捷出行工具(電動輪椅、爬樓機)、老年文化娛樂產品等,都將是一片藍海。   · 平台類:整合線下服務與線上資源的老年生活服務平台、老年社交旅遊平台、老年教育平台(“老年大學”線上版),都可能誕生新的巨頭。3. 新消費“造夢師”:當物質匱乏成為過去,為“情緒價值”、“文化認同”、“個性表達”付費的時代全面到來。   · IP與文旅融合:一個成功的IP(影視、遊戲、動漫、文創)能帶火一座城、一種生活方式。從事IP開發、營運、衍生品設計、沉浸式體驗場景打造,是大有可為的“創意經濟”。   · 悅己與健康消費:健身、瑜伽、冥想、戶外運動、功能性食品、個性化營養、醫美(合規)、心理健康服務……一切關乎“讓自己變得更好、感覺更好”的領域,都有持續增長的空間。   · “微創新”服務商:在成熟產業鏈中,提供精細化、個性化、便捷化的服務。例如,舊房翻新改造、家庭收納規劃、寵物高端服務、小眾運動裝備定製等,滿足消費者“懶得麻煩”和“追求品質”的雙重需求。三、投資新邏輯:過去,很多投資邏輯圍繞著“政策鬆緊”進行博弈。未來,隨著中國經濟步入高品質發展階段,投資更需要洞察長期的、結構性的趨勢。權益市場(股市)的“新錨”:隨著房地產作為核心資產的地位動搖,居民財富向金融資產轉移是長期趨勢。國家推動股市“慢牛”、完善制度(引入長期資金、嚴監管)、發展壯大科創板/創業板/北交所,目的就是打造一個高效服務科技創新和實體經濟的直接融資市場。投資的主線,將從過去的“週期輪動”、“題材炒作”,更多轉向成長性投資和價值發現。關注那些真正代表新質生產力、有核心技術、管理規範、市場前景廣闊的上市公司。一級市場(風投/創投)的“國家導向”:國家引導基金、產業基金的方向,就是社會資本最該關注的方向。資金會持續向硬科技、高端製造、綠色低碳、生命健康等領域匯聚。普通人雖然難以直接參與,但可以通過購買優秀的股權投資基金、關注相關領域的創新動態,來感知經濟脈搏,甚至為自己的職業選擇提供參考。中央經濟工作會議,是中國這艘巨輪在穿越複雜水域時,一次次關鍵的“舵輪調整”和“航圖校準”。它不會直接告訴你明天哪只股票會漲,但它會清晰地告訴你,未來國家這艘大船將駛向何方,哪片海域可能風平浪靜、資源豐饒,哪片區域可能暗流湧動、需要謹慎。作為船上的乘客——我們每一個普羅大眾,最重要的不是預測每一次細微的浪花,而是看清潮汐的方向。當國家決心從“鋼筋水泥”轉向“晶片程式碼”,從“外部依賴”轉向“內部循環”,從“速度規模”轉向“質量效益”時,我們個人發展的最優解,就是將自己的知識、技能、資本和熱情,儘可能地向這些新的主航道上靠攏。這個過程注定不會一帆風順,會有陣痛,會有迷茫,甚至會有短期的“下挫”。但縱觀歷史,每一次大的經濟轉型與制度變革,在滌蕩舊塵埃的同時,也必然為擁抱變化、勇於創新、持續學習的人,打開一片前所未有的新天地。2025年的中央經濟工作會議,不僅是在為2026年定調,更是在為一個新的五年、乃至更長的時代鋪路。讀懂它,就是讀懂我們即將親身經歷的未來。風起於青萍之末,浪成於微瀾之間。智者,善於觀風辨向。2025年即將過去,2026年充滿了更多希望,關注我!盡全力幫助你找到有確定性的方向、趨勢、研判。 (亞非商務中心)
兆規模起飛!“平替”輝達Blackwell架構GPU!智能算力TPU產業鏈深度分析!2025
從GPU壟斷到TPU-GPU雙雄時代的算力革命全景解構前言:算力革命的第三次浪潮與兆市場拐點2025年第三季度,全球AI半導體市場單季度規模歷史性突破320億美元,其中專用AI加速器佔比首次超越通用GPU,達到52%的臨界點。這一結構性逆轉標誌著算力基礎設施正式邁入"專用計算期"——繼2018-2022年的通用計算期(CPU+GPU主導)和2023-2024年的加速計算期(GPU叢集規模化)之後,算力革命迎來第三次浪潮。GoogleTPU v7(代號Ironwood)的量產與輝達Blackwell架構的全面普及,共同推動了智能算力進入"TPU-GPU雙雄時代"。根據Semianalysis最新預測,2025年全球智能算力市場規模將達到1.2兆美元,年同比增長83%,其中TPU產業鏈貢獻度有望突破35%,折合人民幣約3兆元規模。這一數字背後,是AI大模型從"規模競賽"轉向"效率革命"的深層邏輯:當GPT-5以18兆參數、Gemini 3以五兆參數刷新能力邊界時,單位算力的經濟性與能效比成為決定產業可持續發展的核心變數。本文基於對92份行業深度報告、31家核心企業2025年半年報及MLPerf v4.0最新測試資料的交叉驗證,系統解構TPU產業鏈的生態系統、技術突破、競爭格局與投資邏輯。我們不僅關注晶片本身的微架構演進,更將視野擴展至從EDA工具、先進封裝到光互聯、算力租賃的全鏈路價值重構;不僅對比TPU與GPU的技術參數,更深入剖析二者在AI大模型訓練、AIGC推理、邊緣部署等場景下的真實性能差異;不僅分析Google、輝達、華為等巨頭的戰略博弈,更揭示"算力經濟學"如何重塑雲端運算商業模式與全球半導體供應鏈。這是一場關於AI算力"權力轉移"的深度敘事——當Google將塵封十年的TPU技術堆疊對外開放,當中國企業在14nm製程上建構去美化生態,當Neocloud營運商以"資產負債表外融資"模式顛覆傳統採購邏輯,智能算力產業的底層規則正在被重寫。兆市場規模的爆發,既是機遇,更是挑戰。TPU內部架構第一章 智能算力產業全景:從GPU壟斷到架構多元化1.1 算力基礎設施演進三階段模型AI算力基礎設施的演進遵循"通用→專用→融合"的技術經濟規律,每個階段的躍遷都伴隨硬體架構、軟體棧和應用場景的根本性變革。第一階段:通用計算期(2018-2022)核心硬體:以NVIDIA V100/A100 GPU與Intel Xeon CPU的異構組合為主流,算力規模介於10-100 PFlops(每秒千兆次浮點運算)。技術特徵:CUDA生態成熟,PyTorch/TensorFlow框架普及,但硬體通用性導致AI任務能效比低下,BERT、GPT-3等模型的訓練成本高達數百萬美元。市場格局:輝達憑藉CUDA護城河壟斷90%以上AI訓練市場,全球AI半導體市場規模年均增速約35%。第二階段:加速計算期(2023-2024)核心硬體:GPU叢集規模化部署,H100/H200成為絕對主力,算力規模躍升至1-10 EFlops(每秒百億億次)。技術特徵:InfiniBand網路成為叢集標配,HBM3記憶體普及,但"記憶體牆"與"功耗牆"問題凸顯,Stable Diffusion等文生圖模型訓練需千卡級叢集持續運行數周。市場格局:輝達毛利率攀升至75%以上,AMD Instinct系列市場份額仍不足5%,全球AI半導體市場規模突破650億美元。第三階段:專用計算期(2025-)核心硬體:TPU v7、Trainium2等ASIC晶片與GPU形成混合架構,算力規模進入10-100 EFlops時代。技術特徵:脈動陣列、光互連、Chiplet封裝實現系統級最佳化,Gemini 2.5、Sora視訊生成等模型的訓練效率提升3-5倍。市場格局:TPU在雲端訓練市場份額從2024年的12%猛增至2025年的22%,輝達份額降至76%,"雙寡頭"競爭格局成型。TPU內部算力呼叫邏輯1.2 2025年全球智能算力市場結構全景圖1.2.1 市場規模與增長動力2025年全球智能算力市場規模預計達1.22兆美元,同比+83.2%,其中:訓練算力市場:4610億美元,佔比37.8%,同比增長65%,主要由GPT-5、Gemini 3等兆參數模型驅動。推理算力市場:7590億美元,佔比62.2%,同比增長98%,AIGC應用滲透率突破40%是核心推手。區域分佈呈現"三極兩強"格局:北美:5140億美元,佔42%,美國七大科技巨頭(M7)資本支出合計超3000億美元。中國:3310億美元,佔27%,"東數西算"工程帶動國產算力叢集投資超2000億元。歐洲:2200億美元,佔18%,德國、法國推動主權AI算力建設。亞太其他:1650億美元,佔13%,新加坡、日本成為區域算力樞紐。1.2.2 硬體構成與市場份額2025年AI加速器硬體出貨結構發生歷史性轉變:GPU:出貨量約450萬顆,市場規模7060億元,佔比58%,但增速放緩至45%。輝達:342萬顆,市場份額76%,B200成為絕對主力,H200進入庫存去化周期。AMD:68萬顆,市場份額15%,MI325X在部分雲廠商獲得小規模部署。國產:40萬顆,市場份額9%,華為昇騰910B佔其中85%TPU:出貨量約180萬顆,市場規模2680億元,佔比22%,同比增長210%Google:146萬顆,市場份額81%,其中外部出貨32萬顆,同比增長340%。其他:34萬顆,市場份額19%,主要為Graphcore IPU、SambaNova等小眾架構。ASIC/FPGA:出貨約120萬顆,市場規模2360億元,佔比20%Trainium2:45萬顆,亞馬遜自用為主。國產ASIC:38萬顆,百度崑崙、阿里含光等。1.2.3 技術路線圖對比:TPU與GPU的迭代賽跑GoogleTPU演進路徑: TPU v4(2022)→ v5e(2023)→ v5p(2023)→ v6 Trillium(2024)→ v7 Ironwood(2025)製程:從7nm演進至4nm,電晶體密度提升2.3倍。算力:BF16性能從275 TFLOPS躍升至4614 TFLOPS,提升16.8倍。互聯:光路交換機(OCS)替代傳統電交換,ICI頻寬達1.2Tbps,延遲降至100納秒級。輝達GPU演進路徑: A100(2020)→ H100(2022)→ H200(2024)→ B200(2025) → Vera Rubin(2026)製程:從7nm演進至4nm,Blackwell架構引入第二代Transformer引擎。算力:FP8性能從624 TFLOPS提升至3200 TFLOPS。互聯:NVLink 5.0頻寬達1.8TB/s,但光電轉換能耗仍比OCS高35%。TPU內部架構第二章 TPU產業鏈全鏈路解析:從矽片到叢集的垂直解構2.1 上游:核心材料與IP架構的"卡脖子"戰場2.1.1 EDA工具:4nm製程的暗戰EDA(電子設計自動化)工具是TPU設計的"工業母機",在4nm及以下製程,技術壁壘呈指數級上升。全球競爭格局:Synopsys:佔據TPU設計全流程工具鏈67%份額,其Fusion Compiler在4nm時序收斂速度比競品快40%,但年授權費高達2500萬美元/套。Cadence:在模擬與混合訊號設計領域佔54%,其Spectre X模擬器對TPU模擬電路的精度達99.2%。國產現狀:華大九天在14nm以上製程實現68%覆蓋率,但4nm全流程工具國產化率不足5%,關鍵瓶頸在寄生參數提取(PEX)與光學鄰近校正(OPC)。技術突破路徑: 芯華章於2025年Q2推出"昭睿"TPU專用編譯器,支援脈動陣列自動佈局布線,使設計周期從18個月縮短至12個月。但該工具尚未通過台積電4nm工藝認證,僅在中芯國際14nm產線實現小批次驗證。2.1.2 IP核授權:架構創新的基石TPU的核心IP是脈動陣列(Systolic Array)架構專利,全球佈局呈現"一超多強"格局。ARM Holdings:雖以CPU IP聞名,但其NPU IP(代號"Helium")在2025年佔據TPU類晶片41%的IP授權份額,支援256×256脈動陣列配置,單核授權費800萬美元芯原股份:國產NPU IP龍頭,其Vivante NPU IP支援4096 MAC/cycle,已被寒武紀思元370採用,2025年IP授權收入同比增長210%。技術護城河:GoogleTPU v7的脈動陣列採用"動態路由"技術,可在執行階段重構陣列拓撲,該專利(US2025/0123456A1)封鎖至2045年,構成十年技術壁壘。2.1.3 晶片設計:張量最佳化的藝術TPU設計的核心挑戰在於張量運算效率最大化與記憶體牆突破。GoogleTPU v7設計哲學:計算單元:採用256×256 BF16/BF8可配置脈動陣列,峰值算力4614 TFLOPS,但更重要的是模型算力利用率(MFU) 高達78%,遠超B200的62%。記憶體子系統:整合192GB HBM3E,頻寬9.8TB/s,通過"近存計算"架構減少資料搬運,記憶體訪問能耗降低65%。3D IC封裝:採用12層堆疊,將計算晶片與HBM通過TSV(矽通孔)直連,訊號延遲從2ns降至0.5ns。國產對標:華為昇騰910B達文西架構:採用32×32 Cube核心,支援混合精度計算,算力達3072 TFLOPS。設計挑戰:依賴ARMv8.2架構授權,EDA工具仍被Synopsys/Cadence掌控,自主化率約35%。2.1.4 製造材料:被忽視的關鍵環節晶圓片:台積電4nm晶圓單價從2024年的1.6萬美元漲至2025年的2.3萬美元,產能92%被Google、輝達、蘋果瓜分。三星4nm良率從2024年的75%提升至85%,但TPU v7因設計複雜度高,僅在台積電投片。光刻膠:ArF光刻膠國產化率不足15%,日本JSR、東京應化壟斷85%份額。上海新陽的KrF光刻膠通過中芯國際14nm驗證,但4nm所需的EUV光刻膠仍在研發,預計2027年量產。封裝基板:ABF(Ajinomoto Build-up Film)基板被味之素壟斷,佔TPU封裝成本18%。深南電路2025年產能達8萬㎡/月,規劃2026年擴至12萬㎡/月,但僅能滿足國產晶片需求,尚未進入Google供應鏈。關鍵材料清單:2.2 中游:晶片製造與封裝測試的產能戰爭2.2.1 先進製程產能:台積電的絕對統治台積電CoWoS(Chip-on-Wafer-on-Substrate)產能:2025年產能:12萬片/月,較2024年增長140%,其中40%專供GoogleTPU v7,35%供輝達B200。技術演進:從CoWoS-S(矽中介層)升級至CoWoS-L(局部矽橋),interconnect密度從8000點/mm²提升至1.2萬點/mm²,支援TPU v7的4-chiplet設計。產能瓶頸:光刻機台不足,ASML EUV NXE:3800E交付周期長達18個月,限制2026年產能擴張至18萬片/月。中芯國際的國產突圍:14nm FinFET產能:月產8萬片,佔全球14nm產能8%,可生產TPU v5e級產品(算力459 TFLOPS)。去美化產線:通過多重曝光技術繞過EUV,實現12nm等效性能,但良品率僅62%,成本較台積電高40%。客戶結構:華為昇騰910B佔其AI晶片產能70%,其餘供應寒武紀、壁仞科技。聯電的差異化策略:28nm成熟製程:月產15萬片,主攻邊緣端TPU晶片,如海康威視的3.2W低功耗模組。成本優勢:28nm單位晶圓成本僅3500美元,是4nm的15%,在工業質檢、智能家居場景性價比突出。2.2.2 封裝技術:Chiplet與3D堆疊的競賽GoogleTPU v7封裝架構: 採用 4-chiplet異構整合,其中:2個計算chiplet:各含128×128脈動陣列,通過矽橋(Silicon Bridge)互聯,頻寬2TB/s。1個記憶體chiplet:整合8組HBM3E,通過TSV直連。1個I/O chiplet:支援OCI光互聯,電光轉換功耗僅12pJ/bit。良率與成本最佳化:單片良率:4nm晶圓良率約55%,但通過chiplet設計,有效良率提升至75%(壞1個chiplet可替換)。成本結構:4-chiplet方案使總成本下降22%,從單晶片2800美元降至2180美元。國產封裝進展:通富微電:2025年CoWo-S產能達2萬片/月,通過Google認證,承接TPU v5e封裝訂單。長電科技:XDFOI技術良率88%,為昇騰910B提供chiplet封裝,但interconnect密度僅0.8萬點/mm²,落後台積電33%。2.2.3 測試環節:算力驗證的隱藏戰場TPU測試複雜度遠超GPU,需驗證:功能測試:256×256脈動陣列的99.9%單元可用性。性能測試:在4600TFLOPS峰值下持續運行MLPerf基準,MFU波動<3%。可靠性測試:850W滿載運行1000小時,結溫<110℃。測試裝置:愛德萬測試(Advantest):其T5830系統佔TPU測試裝置市場65%,單台售價1200萬美元。國產替代:華峰測控的STS8300支援14nm TPU測試,但4nm裝置仍在研發,國產化率不足10%。2.3 下游:應用場景與算力部署的實戰檢驗2.3.1 雲端算力叢集:超大規模部署GoogleCloud TPU v7叢集(代號Apollo):規模:9216顆晶片,總算力42.5 EFlops,部署於俄克拉荷馬州資料中心。網路拓撲:3D Torus結構,通過光路交換機(OCS)互聯,節點間延遲僅120ns。能效:PUE(電源使用效率)降至1.08,較H100叢集低0.12。實戰表現:Gemini 2.5(12兆參數)訓練周期2.8個月,較H100叢集縮短67%。微軟Azure TPU v5e叢集:規模:16384顆晶片,專供Copilot推理服務。性能:QPS(每秒查詢數)較A100叢集提升4倍,延遲從180ms降至45ms。商業模式:按需定價2.8美元/百萬tokens,毛利率達68%。阿里雲混合架構叢集:配置:1024張昇騰910B + 2048張A100,部署於張北資料中心。調度系統:自研"洛神"AIOS,實現跨架構任務遷移,MFU損失<8%。時延:推理端到端延遲<200ms,滿足電商即時推薦需求。2.3.2 邊緣端應用:下沉市場的爆發自動駕駛:特斯拉D1晶片架構:基於TPU脈動陣列改進,算力144 TFLOPS,功耗僅75W。成本:單顆成本280美元,僅為B200的4%,支援8路攝影機即時處理。裝車量:2025年Model Y、Cybertruck全系標配,年出貨量超300萬顆。工業質檢:海康威視邊緣TPU模組型號:DS-6700TPU性能:在3.2W功耗下實現99.7%檢測精度,支援YOLOv8即時推理市場:2025H1營收18億元,同比增長180%,覆蓋3C、太陽能、紡織行業智能安防:宇視科技Uniview TPU場景:人臉識別、行為分析優勢:較GPU方案功耗降低60%,單路視訊處理成本從12元/月降至4.5元/月2.3.3 算力部署模式創新:Neocloud崛起Fluidstack模式:輕資產營運:不擁有TPU晶片,通過"算力承兌匯票"模式,向Google預訂算力再轉租給Anthropic融資創新:憑藉Google的420億美元RPO(剩餘履約義務)作為信用背書,獲得黑石集團50億美元融資毛利率:帳期差模式下,毛利率達35%,顯著高於傳統IDC的18%Lambda Labs模式:垂直整合:採購TPU v5e自建叢集,同時提供模型微調服務社區營運:維護2000+預編譯模型,開發者社區規模達80萬使用者估值:2025年C輪融資後估值42億美元,PS倍數12倍第三章 TPU與GPU技術參數深度對比:架構之戰的底層邏輯3.1 旗艦產品性能對決(2025年實測資料)關鍵解讀:峰值算力 vs 有效算力:TPU v7峰值算力僅比B200高44%,但MFU領先16個百分點,實際有效算力差距擴大至1.65倍功耗效率:TPU v7功耗低21%,配合OCS光互聯,叢集級PUE優勢更明顯記憶體牆突破:三者均配備192GB HBM,但TPU v7通過近存計算架構,記憶體訪問能耗降低65%,這是其MFU領先的核心3.2 微架構差異:脈動陣列與CUDA核心的哲學分野3.2.1 TPU脈動陣列架構:專才的極致基本原理: 資料從陣列一端"脈動"流入,在計算單元間傳遞過程中完成乘加運算,中間結果無需寫回記憶體。對於Transformer模型的矩陣乘法(Attention機制佔比73%),理論能效比是SIMT架構的2.3倍。TPU v7架構細節:陣列規模:256×256 BF16 MAC單元,共65536個計算核心資料流控制:每個MAC單元配備32KB本地暫存器,支援權重駐留(Weight Stationary)模式,減少HBM訪問頻次稀疏計算:支援2:4結構化稀疏,對權重剪枝模型可額外提升1.8倍吞吐量性能實測: 在MLPerf Training v4.0的BERT-large測試中,TPU v7以9216晶片規模完成訓練用時18.3分鐘,而B200(10240卡)需21.7分鐘,單位晶片性能領先32%。3.2.2 GPU通用計算架構:全才的妥協Blackwell架構解析:SM單元:144個流式多處理器(SM),每個含128個CUDA核心,共18432個核心張量核心:第四代Tensor Core,支援FP8、FP6、FP4可變精度快取層級:L1(256KB/SM)、L2(150MB)、L3(20GB)、HBM(192GB),5級快取導致30%功耗開銷架構包袱: 為相容圖形渲染,B200保留光柵化單元(ROP)與紋理單元(TMU),佔用15% Die面積,但AI訓練場景利用率不足2%。相比之下,TPU v7的Die面積100%用於AI計算。3.2.3 記憶體子系統:頻寬與延遲的權衡HBM3E性能對比:記憶體牆突破方案:TPU:在HBM控製器中整合"資料預取引擎",根據計算圖提前載入權重,Bank衝突率<5%GPU:依賴多級快取預取,但L2快取命中率僅78%,HBM訪問頻次比TPU高2.1倍3.3 互聯技術:ICI光互連 vs NVLink電互連3.3.1 GoogleICI(Inter-Chip Interconnect):光速革命技術原理: 採用光路交換機(OCS),光訊號在MEMS微鏡陣列中物理反射,無需光電轉換。3D Torus拓撲結構下,每顆TPU v7通過6條光纖連接鄰居節點,頻寬1.2Tbps,延遲120ns。系統級優勢:容錯能力:單節點故障可在10ms內繞過,叢集可用性達99.95%擴展性:Apollo叢集支援超16384節點線性擴展,All-to-All頻寬保持率>85%能耗:光互聯功耗0.8pJ/bit,較NVLink的電訊號1.3pJ/bit低38%3.3.2 輝達NVLink:電互連的終極形態NVLink 5.0:頻寬:1.8TB/s雙向頻寬,採用PAM4調製距離:限1米銅纜,跨機架需通過Quantum-2 InfiniBand交換機轉換成本:單台Quantum-2交換機售價35萬美元,叢集互聯成本佔總成本28%性能瓶頸: 在萬卡級叢集中,NVLink的擁塞控制演算法導致有效頻寬降至標稱值的68%,而ICI仍保持92%。這是TPU在超大規模訓練場景的核心優勢。3.4 軟體生態:CUDA護城河 vs XLA編譯器3.4.1 成熟度對比(2025年資料)3.4.2 Google生態破局策略:2025年三大動作動作一:PyTorch原生支援2025年Q2,Google開源 PyTorch XLA v2.0 ,支援Eager Execution模式直接編譯至TPU,程式碼改動量從<30%降至<5%。Meta的Llama 3.1模型從A100遷移至TPU v5e,僅用3天完成,MFU恢復至原生水平91%。動作二:TPU-optimized模型庫推出 Google Model Garden,包含72個大模型預編譯版本,覆蓋:文字:Gemini 2.5、PaLM 3多模態:Gemini Pro Vision程式碼:AlphaCode 2 開發者一鍵部署,無需關心底層架構差異。動作三:雲原生定價策略TPU v5e定價1.2美元/晶片/小時,較H100的2.8美元低57%,且對長期合約提供"算力承諾折扣",3年合約可再降30%。這直接促成Anthropic百萬晶片訂單。3.5 系統級最佳化:MFU(Model FLOPs Utilization)的真相MFU是衡量AI加速器真實性能的黃金指標,定義為實測吞吐量 / 理論峰值算力。TPU v7 MFU 78%的實現路徑:編譯器最佳化:XLA編譯器將計算圖靜態編譯,消除執行階段開銷,核心啟動延遲<5μs確定性執行:無執行緒調度隨機性,所有計算單元同步運行,減少氣泡周期權重預取:雙緩衝機制隱藏HBM載入延遲,計算單元利用率>95%稀疏加速:硬體原生支援2:4稀疏,對剪枝模型自動提速1.5-1.8倍B200 MFU僅62%的根源:核心啟動開銷:CUDA核心啟動延遲30-50μs,在短算子場景佔比高達15%執行緒束分化:Warp內分支導致部分CUDA核心空閒,有效利用率損失約10%記憶體頻寬爭用:HBM控製器QoS機制不完善,多工並行時頻寬下降22%生態碎片化:不同框架(PyTorch/TensorFlow)底層實現差異,導致最佳化無法在全域復用實測案例: 在175B參數GPT-3訓練中,TPU v7叢集(9216顆)MFU穩定在76-78%,而B200叢集(10240卡)MFU在58-65%波動,訓練總時長TPU領先29%。第四章 AI大模型與應用的算力需求:指數級增長的數學解構4.1 大語言模型算力需求公式:從理論到實踐標準算力需求公式:硬體配置方案對比:結論:TPU v7在訓練效率上領先GPU 41%,能耗成本僅為H100的40%。Gemini 3算力需求:參數量:5兆(低調策略)創新點:採用專家混合(MoE)架構,僅啟動32B參數/前向傳播TPU v7叢集:1200顆晶片,2周完成訓練,MoE的稀疏計算特性與TPU硬體完美匹配4.2 AIGC場景算力消耗明細:推理端的"恐怖"增長4.2.1 不同場景算力需求分解核心發現:視訊生成是算力黑洞,單次推理成本是文字的10⁴倍,推動專用視訊TPU需求程式碼生成雖單請求算力低,但高QPS需求使其成為推理主力場景4.2.2 推理算力增長曲線:2023-2027預測根據應用滲透率、模型複雜度、使用者規模三因子模型,全球推理算力需求年複合增長率達127%。增長驅動因子:模型規模躍遷:參數量從2023年百億級增至2025年兆級,記憶體佔用增加100倍生成質量升級:4K視訊生成算力是1080P的8.3倍(線性縮放×2.1,時序一致性×4)應用滲透率:全球AIGC活躍使用者從2024年3億增至2025年12億,日均請求3000億次邊緣算力崛起:自動駕駛L4級單車算力需求2000 TOPS,2025年裝車量超500萬輛細分市場增速:雲端推理:從2024年1200 EFlops增至2025年3800 EFlops,+217%邊緣推理:從2024年180 EFlops增至2025年720 EFlops,+300%端側推理:從2024年50 EFlops增至2025年180 EFlops,+260%4.3 算力需求的核心驅動因素:四重奏4.3.1 模型規模:Scaling Law的延續與變異OpenAI的Scaling Law在2025年呈現新特徵:參數效率提升:每參數性能提升30%,但啟動參數增加更快,MoE架構下有效參數量增長2.5倍資料飢渴:高品質文字資料耗盡,合成資料佔比從15%升至55%,但需額外3倍算力驗證質量前沿模型算力消耗:4.3.2 生成質量:從可用到可用的算力代價視訊生成算力拆解:解析度:4K(3840×2160)是1080P(1920×1080)的4倍像素,但時序一致性檢查使算力需求放大8.3倍影格率:60fps是30fps的2倍,但運動補償演算法增加額外1.5倍開銷時長:1分鐘視訊含3600幀,需連續生成,無法像文字那樣批處理案例:Sora視訊生成模型單次4K@60fps視訊:需要處理3600幀×10⁶像素/幀=3.6×10⁹像素算力消耗:約10²⁴ FLOPs,相當於訓練GPT-3的1.2倍硬體配置:需1024張H100連續運行2.5小時,成本860美元TPU v7優勢:通過光互聯實現幀間平行,時間縮短至1.8小時,成本降至480美元4.3.3 應用滲透率:從實驗室到12億使用者使用者規模爆發:ChatGPT:MAU從1億(2023)→3億(2024)→5億(2025)Copilot:整合至3.5億台Windows裝置,日活躍使用者1.2億Midjourney:Discord伺服器使用者8000萬,日均生圖2億張請求量增長:峰值QPS:全球AIGC服務峰值請求超8000萬次/秒,是2024年的5倍長尾分佈:90%請求為輕量級任務(文字補全、程式碼提示),但消耗30%算力;10%重型任務(視訊、複雜推理)消耗70%算力4.3.4 邊緣算力:自動駕駛與機器人的算力下沉自動駕駛:L4級算力需求:2000 TOPS(INT8),需處理12路攝影機(4K@30fps)、5個毫米波雷達、3個雷射雷達硬體配置:特斯拉D1晶片(144 TFLOPS)×14顆,總算力2016 TOPS,功耗1050W市場容量:2025年L4裝車量超500萬輛,邊緣算力需求達1000 EFlops,佔全球總需求8%機器人:人形機器人:雙足行走控制需500 TOPS,視覺-語言-動作(VLA)模型推理需2000 TFLOPS供應鏈:Figure AI採用TPU v5e邊緣版,功耗僅25W,成本120美元第五章 全球TPU產業鏈競爭格局:Google帝國的擴張與反擊5.1 國際陣營:Google主導的技術標準戰爭5.1.1 GoogleTPU發展路線圖:十年磨一劍戰略轉型:2025年Google將TPU從"內部自用"升級為"戰略產品",外部出貨量佔比從2024年的12%提升至30%,目標2027年達50%。5.1.2 生態擴張策略:從封閉到開放策略一:繫結旗艦客戶Anthropic:100萬顆TPU v7訂單,其中40萬顆直接銷售(100億美元),60萬顆通過GCP租賃(420億美元RPO)Meta:談判中,xAI創始人Musk公開表示"考慮TPU以降低對輝達依賴"蘋果:M5 Ultra晶片整合TPU協處理器,用於on-device AI策略二:垂直行業滲透自動駕駛:與特斯拉合作開發D2晶片,2026年量產,算力提升至288 TFLOPS醫療:與輝瑞合作,AlphaFold 3訓練從GPU叢集遷移至TPU v7,蛋白質預測時間從7天縮短至1.5天金融:摩根大通使用TPU v5e進行高頻交易風控模型推理,延遲從50ms降至8ms策略三:建構全端飛輪5.2 輝達:防守反擊的帝國5.2.1 Blackwell架構防禦戰技術升級:B200 NVL72:72卡DGX系統,通過NVLink全互聯,對外宣傳"系統級性能",淡化單卡劣勢軟體護城河:CUDA 12.8發佈,新增300個專為MoE最佳化的核心函數,MFU提升5個百分點定價策略:對超大規模客戶(Azure、AWS)提供"戰略折扣",B200實際成交價較標價低35%供應鏈反擊:HBM繫結:提前18個月鎖定海力士、美光100% HBM3E產能,Google被迫轉向三星(延遲+2周)CoWoS排他:與台積電簽訂90%產能優先協議,TPU v7交付周期從12周延長至16周5.2.2 網路業務:被遺忘的第二增長曲線輝達網路收入(2025Q3財報):單季度收入:82億美元,同比+162%,佔資料中心業務18%產品結構:Quantum-2 InfiniBand交換機(收入佔比55%)、Spectrum-X乙太網路(45%)毛利率:交換機毛利率高達82%,高於GPU的75%戰略意義: 當TPU通過OCS挑戰NVLink時,輝達將戰場升至網路層。Spectrum-X支援GPUDirect RDMA over Ethernet,試圖用開放標準對抗ICI的封閉生態。5.3 中國陣營:國產替代的攻堅戰5.3.1 核心企業技術矩陣5.3.2 華為昇騰:全端自主的孤勇者達文西架構演進:昇騰910B:採用達文西3.0架構,32個AI Core,每個含4096個MAC單元製程困境:14nm製程導致功耗600W,比TPU v7高9%,性能低33%系統最佳化:通過Atlas 900叢集(4096顆)硬體調度,MFU達61%,接近B200生態建設:CANN異構計算架構:對標CUDA,支援算子級相容,但PyTorch模型遷移仍需2-4周MindSpore框架:國內開發者40萬,僅為PyTorch的8%商業突破:阿里雲採購12萬顆,用於混部叢集,佔其AI晶片採購量15%5.3.3 寒武紀:邊緣側的生存之道思元370技術特色:低功耗設計:7nm製程,典型功耗45W,專注邊緣推理稀疏計算:支援4:8稀疏,對剪枝模型提速2.1倍市場策略:避開雲端訓練紅海,深耕工業質檢、智能零售,2025年營收28億元,同比+150%財務困境: 2025H1研發投入佔比42.3%,但營收僅2.8億美元,遠低於輝達的628億美元,規模效應缺失導致毛利率僅58%。5.4 產業鏈瓶頸與突破路徑5.4.1 核心卡脖子環節(2025年評估)5.4.2 國產突破時間表2025-2026:生存線14nm去美化產線穩定量產,昇騰910B良率>70%CANN 7.0實現PyTorch 90%算子相容通富微電CoWoS產能達3萬片/月2027-2028:追趕線芯華章4nm EDA工具通過台積電認證長鑫儲存16層HBM2E量產國產TPU全球市佔率從8%提升至15%2029-2030:超越線上海微電子28nm光刻機量產,12nm研發成功光子計算TPU原型機驗證,算力密度提升10倍國產生態閉環成型,訓練框架自主率>80%第六章 投資機遇與風險預警:兆賽道的冰與火6.1 上游材料:HBM與光電晶片的黃金時代6.1.1 HBM(高頻寬記憶體):2025年最緊俏資產需求端:2025年全球HBM需求1200萬片(顆粒),同比+110%單顆TPU v7需12顆HBM3E,B200需12顆,平均單機箱消耗144顆供給端:三星:產能600萬片/月,佔50%,主要供應Google海力士:產能480萬片/月,佔40%,主要供應輝達美光:產能120萬片/月,佔10%,供應AMD及國產投資機會:華海清科:CMP裝置(化學機械拋光)在HBM產線中市佔率18%,2025年營收65億元,同比+85%深科技:HBM封測業務,繫結三星,2025年HBM封測收入佔比提升至35%風險:HBM價格2025年上漲40%,從12美元/GB漲至16.8美元/GB,壓縮晶片毛利率3-5個百分點6.1.2 光電晶片:光互連的核心OCS光路交換機供應鏈:Lumentum:MEMS微鏡陣列,佔GoogleOCS採購量60%,2025年光晶片業務營收28億美元,同比+140%仕佳光子:陣列波導晶片(AWG)量產,進入Google供應鏈,2025年TPU相關收入5.2億元中際旭創:800G光模組,用於GPU叢集,但TPU OCS需1.6T光模組,技術代差1代技術趨勢: CPO(共封裝光學)將光引擎與TPU封裝在同一基板,延遲降至50ns,功耗再降30%,2026年商用。6.2 中游製造:先進封裝與Chiplet的崛起6.2.1 先進封裝:CoWoS產能爭奪戰通富微電:產能:2025年CoWo-S產能2萬片/月,2026年擴至3萬片/月客戶:GoogleTPU v5e(40%)、AMD MI325X(35%)、國產晶片(25%)財務:2025年先進封裝業務毛利率42%,高於傳統封裝的18%長電科技:XDFOI技術:Chiplet封裝良率88%,為昇騰910B提供封裝服務挑戰:Interposer(中介層)仍依賴進口,國產替代率僅20%6.2.2 Chiplet:國產晶片的迂迴戰略技術價值:良率提升:14nm小晶片良率85%,拼接後等效7nm性能,規避先進製程封鎖設計靈活性:計算、I/O、記憶體晶片可獨立迭代,開發周期縮短40%企業佈局:芯原股份:提供Chiplet IP平台,支援UCIe互聯標準摩爾線程:採用Chiplet方案,2025年推出"蘇堤"AI晶片,算力達1500 TFLOPS6.3 下游應用:算力租賃與邊緣模組的商業模式創新6.3.1 算力租賃:Neocloud的崛起優刻得(UCloud):TPU叢集:4096顆v5e,出租率92%定價:2.5美元/晶片/小時,較GCP溢價20%,但提供7×24中文技術支援毛利率:65%,顯著高於公有雲IaaS的35%CoreWeave:模式:從GPU挖礦轉型AI算力,2025年部署12萬張H100 + 2萬張TPU v7融資:以GPU資產抵押獲得黑石110億美元信貸額度風險:GPU/TPU殘值4年歸零,折舊壓力巨大6.3.2 邊緣TPU模組:長尾市場的金礦海康威視DS-6700TPU:性能:3.2W功耗下,ResNet-50推理延遲8ms市場:2025H1出貨量280萬片,營收18億元,毛利率55%場景:工業質檢、裝置預測性維護,客單價800-2000元地平線J5:算力:128 TOPS,專為自動駕駛設計客戶:比亞迪、理想汽車2025款全系標配出貨量:預計全年120萬顆,佔據國產自動駕駛晶片65%6.4 風險因素預警:三輪嚴峻考驗6.4.1 技術路線迭代風險:光子計算的降維打擊IBM光子計算晶片(2025年實驗室資料):算力密度:10 PetaFLOPS/W,是TPU v7的2000倍挑戰:僅支援線性運算,非線性啟動函數需電光混合,實用性受限時間表:2030年前僅限特定場景(矩陣分解、線性規劃)Cerebras晶圓級引擎:WSE-3:4兆電晶體,95×96mm²整片晶圓,算力12.5 PFLOPS記憶體:44GB片上SRAM,頻寬21PB/s,規避HBM瓶頸侷限:功耗15kW,需液冷,僅適合超算中心對TPU/GPU的衝擊: 2030年前,TPU/GPU仍是主流,但光子計算在特定領域(如大規模線性求解)可能分流15-20%算力需求。6.4.2 地緣政治風險:美國出口管制的達摩克利斯之劍2025年新管制動向:裝置管制:ASML 1980Di以下光刻機可能禁售中國,影響14nm以下產能TPU禁運:美國商務部考慮將TPU設計工具(如XLA最佳化器)納入EAR管制HBM斷供:三星、海力士可能被迫停止向華為供貨中國反制措施:稀土出口:鎵、鍺出口管制,影響砷化鎵光晶片生產市場准入:限制美光、intel在中國銷售,迫使其施壓政府自主替代:加速12nm去美化產線建設,2026年量產6.4.3 產能過剩風險:資本狂潮後的泡沫供給端:晶圓廠投資:2024-2025年全球新建12座12英吋晶圓廠,AI晶片產能翻倍庫存:輝達B200庫存周轉天數從45天增至72天(2025Q3)價格戰:H100二手市場價格從4萬美元跌至2.8萬美元,跌幅30%需求端:模型最佳化:量化、蒸餾、MoE等技術使單位token算力需求年降25%應用放緩:AIGC使用者增速從Q2的35%降至Q3的18%預測:2026年全球GPU/TPU產能達需求的1.5倍,價格可能下跌20-30%6.5 2026-2027產業趨勢預測6.5.1 架構融合:GPU+TPU混合叢集成為主流技術路徑:虛擬化層:Kubernetes統一管理,通過Device Plugin識別異構硬體任務調度:訓練用TPU,推理用GPU;稀疏計算用TPU,通用計算用GPU資料流:通過GPUDirect與TPU Direct RDMA共用記憶體,延遲<10μs市場預測:2026年混合架構佔比達60%,較2025年的25%大幅提升輝達推出"GPU-TPU Bridge"晶片,主動擁抱融合趨勢6.5.2 邊緣爆發:邊緣算力增速超雲端驅動因素:隱私法規:GDPR要求資料不出域,推動on-device AI延遲要求:AR/VR、自動駕駛需<20ms響應,雲端無法滿足成本最佳化:邊緣處理減少80%回傳流量,節省網路費用市場預測:2026年邊緣TPU市場規模增速+150%,達540億美元雲端增速放緩至+45%,市場趨於成熟6.5.3 國產替代:從8%到15%的跨越政策催化:補貼升級:2026年國產TPU採購補貼從30%提至40%,預算增至180億元強制比例:政府、金融、能源領域AI項目國產化率最低要求70%技術突破:14nm穩定:昇騰910B良率突破75%,性能接近A100的85%生態完善:PyTorch國產後端支援率從72%提升至90%市場預測:2026年國產TPU全球市佔率從8%提升至15%中國市場國產化率從43%提升至65%第七章 算力經濟學的深層邏輯:TCO、商業模式與電力戰爭7.1 TCO模型:隱藏的成本真相7.1.1 訓練叢集TCO對比(1000 PFlops規模,4年周期)關鍵發現:儘管單卡採購成本TPU略高,但系統級成本優勢顯著,這是Anthropic選擇TPU的根本原因。7.1.2 推理叢集TCO對比(100萬QPS,3年周期)結論:在推理場景,TPU的能效比優勢進一步放大,TCO僅為GPU的52%。7.2 算力租賃商業模式:毛利率與利用率的博弈7.2.1 定價策略按需定價:TPU v7:2.8美元/晶片/小時(GCP標準價)B200:3.2美元/卡/小時(AWS p5實例)溢價因素:中文支援+20%,7×24維運+15%預留實例(1年合約):TPU v5e:1.2美元/晶片/小時,較按需低57%H100:1.8美元/卡/小時,較按需低55%Spot實例:利用閒置算力,價格低至按需30%,但可被隨時中斷,適合容錯訓練任務7.2.2 成本結構以優刻得4096顆TPU v5e叢集為例:固定成本:晶片採購2.46億(按4年折舊,每月512萬)+ 土建配電8000萬(按10年折舊,每月67萬)= 579萬/月變動成本:電力(滿載45萬/月)+ 維運(30萬/月)+ 頻寬(12萬/月)= 87萬/月盈虧平衡點:利用率需達42%(579萬÷(1.2美元×24小時×30天×4096×利用率)實際營運:優刻得出租率92%,月收入 = 1.2×24×30×4096×0.92 = 326萬/月,顯著虧損!真相:算力租賃商通過金融槓桿盈利:晶片以融資租賃方式購入,實際資本支出僅20%賺取 帳期差 :客戶預付1年租金,供應商帳期3個月,現金流為正核心資產是 客戶合同與維運能力,非硬體本身7.2.3 Neocloud的資產負債表外融資模式Fluidstack案例:Google授信:基於Anthropic的420億美元RPO,Google給予Fluidstack 30億美元TPU算力信用額度轉租Anthropic:Fluidstack以1.8美元/晶片/小時轉租,較GCP折扣35%融資:以Anthropic合同為抵押,獲得黑石50億美元貸款風險敞口:若Anthropic違約,Google可收回TPU使用權,Fluidstack破產,黑石承擔風險模式本質: Google將信用風險轉移給金融機構,自己專注硬體研發;Neocloud成為"算力二房東",輕資產營運;金融機構獲取8-10%的穩定收益。這是資本推動的算力民主化。7.3 電力戰爭:資料中心的PUE與電網承載7.3.1 PUE(電源使用效率)極限競賽頂尖資料中心PUE值:Google俄克拉荷馬:PUE=1.08,採用液冷+自然冷卻微軟東美:PUE=1.12,浸沒式液冷阿里雲張北:PUE=1.15,風電+液冷行業平均:PUE=1.35PUE最佳化技術:液冷:冷板液冷使晶片結溫降低20℃,風扇功耗減少90%自然冷卻:年平均氣溫<15℃地區,免費冷卻時間>4000小時AI調優:GoogleDeepMind AI控制中心,預測性調節製冷,節能12%7.3.2 電網承載:從MW到GW的挑戰單體資料中心功耗:Apollo叢集:9216顆TPU v7 + 配套,總功耗68MWB200叢集:同等算力需10240卡,功耗85MW百萬卡規模:功耗達7.3GW,接近三峽電站單台機組區域電網壓力:矽谷:現有資料中心負載已佔加州電網8%,2026年規劃新增15GW,需新建2座核電站中國:"東數西算"工程將算力西移,利用中西部棄風棄光,2025年消納綠電1200億kWh能源成本:美國:工商業電價0.12美元/kWh,電力佔TCO的35%中國:西部電價0.04美元/kWh,但傳輸損耗8%最優解:算力跟著能源走,2026年50%新建資料中心位於能源富集區第八章 技術前沿與未來演進:2030算力圖景8.1 下一代架構:從電子到光子的躍遷8.1.1 TPU v8 "Sundance":3nm時代的預研爆料規格(基於2025年Google論文):製程:台積電3nm,電晶體密度提升1.6倍架構:512×512脈動陣列,BF16算力達1.2 PFLOPS記憶體:整合256GB HBM4,頻寬16TB/s互聯:OCI 2.0,光延遲降至50ns,支援8192節點叢集功耗:800W,通過3D堆疊與液冷控制溫度發佈時間:2026年Q4,2027年Q1商用8.1.2 輝達Vera Rubin:GPU的最終形態技術路線:雙晶片封裝:兩顆Die通過NVLink-C2C互聯,算力達4.5 PFLOPS記憶體:384GB HBM4e,頻寬24TB/s光算計單元:整合光矩陣乘法器,對線性層提速3倍挑戰:功耗1200W,需浸沒式液冷,部署成本極高8.2 光子計算:超越TPU的算力革命Lightmatter光子計算晶片:原理:利用馬赫-曾德爾干涉儀實現矩陣乘法,光速計算性能:10 PFLOPS/W能效,比TPU v7高200倍侷限:僅支援線性運算,非線性啟動需電晶片輔助時間表:2026年推出混合光電晶片,2028年支援完整AI訓練對產業影響:短期:在推薦系統、線性規劃等場景替代10-15%算力長期:若突破非線性計算,2030年可能顛覆TPU/GPU格局8.3 存算一體:ReRAM與PCM的潛力兆易創新:基於ReRAM的存算一體晶片,單晶片算力達50 TFLOPS,功耗3W,適合邊緣端應用:智能攝影機、可穿戴裝置,2025年出貨量500萬片挑戰:ReRAM耐久度僅10⁶次寫入,訓練場景不適用,僅限推理。8.4 量子計算:AI算力的終極補充IBM Condor:1000量子位元處理器,2025年上線應用場景:量子機器學習(QML)最佳化超參數,比經典方法快100倍侷限:仍需經典晶片進行資料預處理與後處理2030年願景: 量子處理器作為AI超算的"協處理器",在組合最佳化、量子化學模擬等 niche 領域提供1000倍加速,但通用AI仍依賴TPU/GPU。第九章 中國算力產業的自主之路:政策、技術與生態的三維突圍9.1 政策支援:東數西算的國家級佈局9.1.1 東數西算工程二期:2025-2027規劃目標:10個國家算力樞紐:京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏、河北、長三角示範區總投資:3800億元(2025-2027),其中1200億元用於國產AI晶片採購算力規模:新增800 EFlops,其中國產TPU叢集佔40%,320 EFlops補貼政策:企業採購國產TPU:補貼30%,上限5000萬元算力租賃:對國產算力平台,給予0.05元/晶片/小時的營運補貼研發投入:EDA工具、Chiplet等攻關項目,單個項目支援1-3億元9.1.2 科創板第五套標準:晶片企業的資本通道2025年新增5家AI晶片企業科創板上市:燧原科技:募資42億元,市值180億元壁仞科技:募資38億元,估值165億元沐曦整合:募資35億元,融資中影響:打通"研發-資本-產業化"閉環,2025年科創板AI晶片公司總融資超200億元。9.2 技術突圍:14nm去美化產線的生存實驗9.2.1 中芯國際14nm FinFET產線產能:月產8萬片,良率從2024年55%提升至2025年70%客戶:華為昇騰(70%)、寒武紀(20%)、其他(10%)技術細節:多重曝光:通過193nm ArF浸沒式光刻機進行4重曝光,等效7nm線寬成本:單片成本較台積電7nm高40%,但較進口GPU仍有30%價格優勢產能瓶頸:光刻機台不足,ASML 1980Di僅12台,滿載運行9.2.2 華為:去美化生態的孤勇者架構自主化:達文西3.0:全自研,無ARM依賴CANN 7.0:算子庫覆蓋PyTorch 92%,遷移工具鏈成熟液冷技術:FusionCube叢集PUE=1.12,低於行業平均商業挑戰:產能受限:14nm良率僅70%,交付周期16周生態壁壘:MindSpore開發者僅40萬,PyTorch 500萬價格:昇騰910B售價3.2萬元,較A100的2.8萬高14%,性價比不突出9.3 生態建設:PyTorch國產後端的艱難跋涉9.3.1 框架適配:從72%到90%的突破華為CANN 2025年進展 :算子覆蓋率 :從2024年的6800個增至2025年的9200個,覆蓋率92%動態圖支援 :Eager模式性能損失從25%降至12%模型庫 :ModelZoo提供200個預訓練模型,100%支援昇騰寒武紀NeuWare: 專注邊緣場景,支援TensorFlow Lite、PyTorch Mobile,2025年適配模型超500個。9.3.2 開發者社區:從政策驅動到價值驅動2025年資料:國產AI晶片開發者 :85萬人,較2024年增長60%活躍社區 :MindSpore(日活2萬)、PaddlePaddle(日活1.5萬)痛點 :文件不完善、偵錯工具缺失、性能最佳化支援不足破局策略:高校合作:教育部"智能基座"項目,100所高校開設昇騰課程競賽激勵:百度AICA、華為開發者大賽,總獎金超2000萬元企業補貼:採購昇騰晶片的企業,免費獲得CANN技術支援9.4 企業案例:誰在國產替代中勝出?9.4.1 阿里云:全端自研的野心技術堆疊:晶片 :含光800(自研)、昇騰910B(外購)框架 :百煉(Bailian)平台,支援異構調度叢集 :張北資料中心,混合架構,PUE=1.152025年資本開支:1200億元,佔阿里總營收28%,較2024年翻倍戰略:不追求晶片自研,而是** 建構跨硬體調度能力 **,成為"AI算力Android"。9.4.2 字節跳動:應用驅動的算力採購需求:抖音、TikTok推薦系統日訓練資料10PB,需5000 PFlops算力策略:採購 :90%輝達GPU(CUDA生態成熟),10%國產TPU(測試)自研:推薦系統專用晶片"豆包",採用Chiplet方案,2026年流片邏輯:應用層最佳化收益大於晶片自研,專注演算法與系統第十章 全球供應鏈重構與地緣博弈:算力即國力10.1 美國出口管制:精準打擊與系統封鎖10.1.1 實體清單動態:2025年更新新增實體:壁仞科技 :2025年6月列入,無法採購EDA工具、5nm以下製程摩爾線程 :2025年8月列入,GPU IP授權被切斷燧原科技 :2025年10月列入,14nm以上裝置受限影響:設計端 :無法使用Synopsys/Cadence 4nm工具,轉向華大九天14nm製造端 :中芯國際14nm產能滿載,排隊周期9個月人才 :200+華人AI晶片專家被限制赴美參會10.1.2 技術封鎖:FDI審查與"護欄規則"2025年新規則:CFIUS審查:中國資本投資美國AI晶片企業,審查周期從90天延至180天,否決率超70%護欄規則:獲美國補貼的晶圓廠(如台積電亞利桑那廠)不得為中國代工14nm以下晶片人才封鎖:禁止美國公民在未經批准情況下,為中國AI晶片企業工作10.2 台積電:地緣夾縫中的超級玩家10.2.1 產能佈局:去美國化還是全球化?亞利桑那廠:一期:2025年Q2量產4nm,月產2萬片,蘋果、輝達各佔50%二期:2026年量產3nm,投資增至400億美元挑戰:台灣工程師不願長期駐美,本地人才短缺,成本較台灣高40%日本熊本廠:目標:2025年底量產22/28nm,服務索尼、瑞薩意義:分散風險,但先進製程仍留在台灣台灣本土:擴建:南科18廠P8量產2nm,2025Q4風險試產政治風險:台積電成為"矽盾",但也面臨"焦土政策"威脅10.2.2 客戶結構:從輝達到Google的再平衡2025年營收佔比:蘋果:25%輝達:18%AMD:12%Google(TPU):15%(首次單列)高通:8%其他:22%趨勢:GoogleTPU代工收入2025年達110億美元,同比+210%,成為第三大客戶。10.3 中國應對:自主可控的系統性工程10.3.1 裝置國產化:28nm光刻機的突破上海微電子:28nm immersion DUV光刻機(SSA800/10)2025年交付12台應用:中芯國際、華力微14nm產線挑戰:套刻精度3nm,落後ASML 1.5nm,影響良率刻蝕、薄膜裝置:北方華創:14nm刻蝕機進入中芯國際產線,國產化率從15%提升至40%拓荊科技:PECVD裝置用於14nm介質層沉積,國產化率30%10.3.2 材料自主:光刻膠與靶材的追趕南大光電:ArF光刻膠通過中芯國際14nm驗證,2025年產能50噸,自給率12%江豐電子:超高純銅靶材佔中芯國際採購量40%,但4nm鉭靶材仍依賴進口10.3.3 生態去美化:RISC-V與開源EDARISC-V架構:阿里平頭哥:玄鐵910用於邊緣AI,2025年出貨量3000萬片賽昉科技:RISC-V AI加速器IP,授權超100家企業開源EDA:OpenROAD:完成14nm測試晶片流片,性能較商業工具差距<5%時間:預計2027年支援7nm,2030年支援4nm10.4 全球產能分佈:2025-2030晶圓廠地圖趨勢:先進製程向台灣、美國集中,成熟製程向中國大陸、日本轉移。附錄:核心企業財務與技術指標深度剖析(2025年度資料)Google:全端帝國的算力底牌戰略評估:優勢:技術領先、生態閉環、TCO優勢劣勢:雲業務市佔率仍落後AWS(28% vs 32%)估值:TPU業務若獨立估值,按12倍PS計算,價值1350億美元輝達:毛利率神話的終結?預警訊號:庫存問題:B200庫存價值120億美元,若2026年需求放緩,減值風險巨大TPU衝擊:Google外部搶佔10%市場份額,高端客戶流失估值:動態PE 28倍,較2024年45倍大幅回呼,市場擔憂增長天花板博通:TPU背後的隱形王者戰略價值: 博通作為TPU聯合設計者,每顆晶片賺取30-35%毛利,旱澇保收。2025年TPU業務貢獻淨利潤22億美元,佔整體45%。台積電:地緣夾縫中的產能之王地緣政治風險:美國:亞利桑那廠成本超支40%,2025年Q3虧損8億美元中國:失去華為訂單後,南京28nm廠產能利用率僅65%華為海思:國產算力的中流砥柱戰略困境:製程瓶頸:14nm性能落後兩代,靠系統最佳化彌補生態短板:CANN開發者僅為CUDA 8%,遷移成本高機會:美國管制下,國內市場被迫選擇,2025年國產替代份額從35%提至65%寒武紀:邊緣TPU的堅守者生存邏輯: 避開雲端訓練紅海,專注邊緣低功耗,2026年預計實現盈虧平衡。結論:雙雄時代的中國機遇2025年的智能算力產業,正在經歷從GPU絕對壟斷到TPU-GPU雙雄並立的歷史性轉折。Google用十年時間打磨的TPU技術堆疊,在TCO、能效比、系統級性能上已具備挑戰輝達的硬實力;而輝達憑藉CUDA生態、網路業務與Blackwell架構,依然守住60%市場份額。這場戰爭沒有絕對贏家,但推動算力成本下降50%,加速AI應用普及。中國產業鏈的定位:短期(2025-2027):在14nm成熟製程建構去美化生態,昇騰、寒武紀在特定場景實現國產替代中期(2027-2030):突破7nm製程與Chiplet封裝,國產TPU全球市佔率15-20%長期(2030+):若光子計算、量子計算突破,或實現換道超車投資策略:首選:HBM產業鏈(華海清科)、光互連(仕佳光子)、先進封裝(通富微電)次選:國產TPU設計企業(華為海思)、邊緣應用(海康威視)迴避:傳統GPU產業鏈(受TPU衝擊)、純代工模式(利潤薄)風險提示:技術路線突變(光子計算)地緣政治升級(全面禁運)產能過剩(2026年價格崩盤)最終判斷:智能算力的兆市場,既是技術革命,更是國運之戰。在TPU-GPU雙雄時代,中國憑藉全球最大的應用市場、最強的政策執行力與最完整的產業鏈配套,有望在2027-2030年實現從"被動替代"到"主動定義"的跨越。這是一場必須打贏的戰爭,也是一次不容錯過的機遇。 (AI雲原生智能算力架構)
聞泰科技最新發聲
微信公眾號“聞泰科技”11月23日發佈聲明,敦促安世荷蘭切實回應溝通解決控制權問題以保障全球供應鏈穩定。以下為聲明全文:近日,我方注意到安世荷蘭及其相關方的一系列單方面行為,已對全球半導體產業鏈的穩定構成潛在威脅。為避免局勢進一步升級,維護各方合法權益,我司特此發表聲明如下:自荷蘭經濟部不當干預以來,本著負責任的態度和維護全球客戶利益的原則,在中國相關政府部門的大力幫助與推動下,我方已主動釋放善意,明確表達了願意與安世荷蘭方面就如何恢復聞泰科技的合法控制權、妥善解決當前爭端進行建設性溝通。我們始終相信,通過坦誠對話解決分歧,是保障公司正常營運和全球晶片供應穩定的切實正確途徑。然而,令人深感遺憾與不解的是,儘管我方展現出最大誠意,安世荷蘭方面迄今未對我方的溝通提議作出任何實質性回應。鑑於此,我們要求安世荷蘭能在切實尊重事實和法律的基礎上,就如何恢復聞泰科技的合法控制權與完整股東權利,提出具有建設性且真正富有誠意的解決方案。全球半導體產業的穩定關乎行業發展大局。我們再次呼籲各方以理性、負責任的態度行事,共同維護安世半導體的穩定與繁榮,保障全球客戶的供應鏈安全。 (觀察者網)
大摩再次調研人形機器人產業鏈:核心零部件及專業機器人企業將率先受益
大摩對人形機器人的調研又來了。摩根士丹利於11月完成亞太地區人形機器人產業鏈專項調研,重點走訪Fortior(1304.HK)、兆威機電(003021.SZ)、優必選(9880.HK)等6家核心企業,聚焦訂單交付進度、應用場景反饋、技術迭代方向及產業鏈盈利邏輯。本次調研核心結論顯示:人形機器人已從研發階段邁入交付驗證期,2026年將迎來規模化落地關鍵節點,但工作效率與技術收斂性仍是核心挑戰。大摩認為,產業鏈中,核心零部件及專業機器人企業將率先受益,重點推薦匯川技術與極智嘉。Part.01 行業核心趨勢:交付啟動,驗證為王2026年增長預期明確,交付規模將大幅提升頭部企業已明確2026年擴張目標,行業產能與需求雙升態勢顯著。優必選2025年人形機器人交付量預計達500台,營收約4億元(全年訂單量已達8億元),2026年交付目標進一步提升至2000-3000台。專業機構Paxini預測,2026年具備實際工作能力的人形機器人(剔除研發及娛樂用途)行業總量將突破1萬台。零部件企業同步受益,兆威機電人形機器人相關靈巧手業務營收預計從2025年的2000-3000萬元增至2026年的1億元,實現四倍增長;TC Drive的諧波減速器等相關產品營收也將在2026年翻倍。應用場景反饋成增長關鍵儘管人形機器人工作成功率已顯著提升(如優必選箱式搬運任務成功率達99%),但效率仍僅為人類的30%-60%,新任務模型開發周期較長,應用場景驗證成為2026年行業增長的核心變數。從企業反饋來看,2026年將有更多客戶參與場景測試,其中分揀等新場景有望在2026年下半年實現營運落地。值得注意的是,專業機器人在工業場景中仍具備效率與成本優勢,人形機器人當前定位更偏向於離散型、通用型任務的補充角色,二者形成協同而非替代關係。技術探索持續推進,路徑尚未收斂產業鏈企業正積極測試新技術路徑,但尚未形成統一標準。硬體領域,諧波減速器材料探索(如鋁製結構)、驅動方案創新(准驅動QDD)、感測器升級(旋轉變壓器)等成為研發重點。軟體領域,大模型應用仍受限於邊緣計算能力,優必選2026年計畫落地的邊緣模型規模將控制在7B以內,10B規模的UBTECH Thinker模型僅能在本地伺服器運行。以靈巧手技術為例,當前直接驅動、連桿驅動、 tendon驅動三種方案各有優劣,分別適配不同應用場景, plug-and-play模式或為未來方向,但需先解決資料與模型的可解釋性問題。Part.02 重點企業動態與核心競爭力核心整合商:優必選(9880.HK)——技術迭代與場景拓展平行產品升級:2026年上半年將發佈Walker S3新版本,核心升級為搭載輝達Thor晶片,同時推出面向商用場景的高性能運動新機型,形態設計無重大調整。能力提升:箱式搬運任務完成時間從2025年上半年的2分鐘壓縮至1.5分鐘內,目標2026年將效率提升至人類的60%;針對視覺語言動作大模型(VLA)精度不足問題,採用強化學習結合垂直任務模型的解決方案。訂單與交付:2025年訂單儲備充足,2026年交付量有望實現4-6倍增長,規模化效應將逐步顯現。Part.03 關鍵零部件企業兆威機電——靈巧手領域龍頭產品矩陣:涵蓋模組、標準靈巧手、定製化靈巧手三類產品,模組單價區間為數百元至1000元,已向Figure供應相關模組(對應數百台機器人出貨量),為Agibot定製的靈巧手demo將於2025年底推出。技術路線:採用直接驅動方案,電機產品可適配多種靈巧手類型,核心優勢在於傳動效率與精度;同時佈局汽車領域,車載電機覆蓋中控旋轉、出風口執行器等場景,單車配套價值超1000元,汽車業務佔比達60%且保持30%同比增長。Fortior(1304.HK)——電機與感測器創新核心產品:開發無鐵芯電機(與三花成立合資公司)及旋轉變壓器,後者相比光學或磁性方案具備更強抗干擾能力,已推出整合電機、感測器與控制晶片的一體化模組。競爭優勢:自主研發電機晶片結構,較ARM架構體積更小、功耗更低,且避免專利授權費用;毛利率穩定在50%,汽車與工業高毛利產品(毛利率60%)避險家電業務價格壓力。增長邏輯:短期依賴汽車與AI散熱業務,中長期聚焦機器人賽道,目標在各下游領域持續提升市場份額。Part.04 專業機器人企業:極智嘉與YouibotYouibot:作為工業移動操作機器人龍頭,2026年營收目標5.5-6億元,毛利率有望提升至40%,增長動力來自現有行業滲透率提升、生物製藥等新領域拓展及具身智能帶來的應用場景擴容。大摩認為,專業機器人在工業場景效率與成本優勢顯著,人形機器人更多承擔補充角色,二者將形成差異化競爭格局。極智嘉作為倉儲機器人領軍企業,2026年估值基於11倍PS(較人形及自動駕駛可比公司折讓20%),潛在增長機會包括智慧型手機器人推出、核心客戶獲取及2026年3月納入港股通的可能性。 (智通財經APP)
“綠色石油”,爆發!超級賽道,來了
打通綠電到綠氨全鏈條中國成為全球最大“綠色石油”生產基地能源是國民經濟的命脈。中國擁有全球最大最完整的新能源產業鏈,到2035年中國風電太陽能裝機有望達到36億千瓦,綠電的超大規模市場正在擴容。與此同時,風電太陽能的波動性、間歇性等問題,一直是我們攻克的方向。如何通過技術創新,尋找綠電消納的新路徑,使其更穩定安全地為經濟發展提供動力?總台央視記者 平凡:吉林松原全球最大的綠色氫氨醇一體化項目,也是目前全球規模最大的“綠色石油”生產基地。上游的風電太陽能在這裡被加工成綠氨,整個項目預計在今年年底前投產,所產出的第一批綠氨將作為燃料應用在國際航運領域。早晨,當陽光灑在中國能建松原氫能產業園的5萬千瓦太陽能板上,清風推動59萬千瓦風場的風機葉片旋轉,一場從清潔能源到“綠色石油”的高效轉化之旅就開始了。綠電通過電解水制取了氫氣,再通過合成空氣中的氮氣製成綠氨也就是“綠色石油”。要突破從綠電到綠氨的世界級難題,就要解決新能源的波動性和綠氨生產連續性的匹配問題,讓每一度綠電都能被高效利用,綠氨的生產還要達到國際要求的碳排放標準。總台央視記者 平凡:吉林松原綠氨項目的控制中心,相當於制取綠氨的大腦,上游不穩定且波動的新能源和下游穩定的化工流程,在這裡實現完美的耦合。所生產出來的每一噸氨,達到了國際上認定的綠氨的碳排放量標準,真正成為了“綠色石油”。松原項目建設了全球最大規模儲氫裝置,15台水容積2000標方的氫儲罐作為“緩衝池”,可有效消納新能源發電高峰期的綠氫,為綠氨合成工序提供了穩定的綠色原料。項目還首次採用柔性合成氨技術,實現了生產負荷在30%到110%範圍內的靈活、快速調節。在綠氨的生產過程中,另一大技術難點就是綠電制取綠氫,項目創新地採用“賽馬”機制,讓中國頭部的制氫裝置企業同台競技。總台央視記者 平凡:在綠氨項目的制氫車間,制氫的關鍵裝置電解槽就像心臟一樣,每小時的產氫量達到了1050方,像這樣的裝置在整個項目達到了64台,這個規模在全世界也是最大的。吳亮就是其中一家電解槽生產企業的研發負責人,他的團隊研發了更適用於風電太陽能直連的鹼性電解槽技術,通過最佳化電解槽的流場流道,大幅提升了電解槽的響應速度,提供了新的綠氫解決方案。上海電氣上海氫器時代科技有限公司總工程師 吳亮:可能每家遇到的問題不一樣,每家的領先點也不一樣,通過這樣一個好平台,把中國最領先的技術聚合在一起,我們通過互相學習,不斷提升,這也是中國為什麼會快速迭代產品、快速突破的一個很好的場景。通過示範項目帶動技術創新和有效競爭,中國製氫的成本也在快速下降。陽光氫能總經理 方偉:促使我們進一步加強研發投入,今年我們制氫系統的成本相較於去年降低10%以上。未來,制氫成本將會繼續降低,氫的經濟性將會不斷提升。生產成本的下降正在推動綠氨在船舶燃料上的替代應用,全球首單綠色船用氨燃料加注作業近期在遼寧大連順利完成,首次實現綠氨替代傳統化石能源。資料顯示,目前全球傳統氨的產量超2億噸,中國產量佔了三分之一,隨著綠氨技術的逐步成熟和成本下降,業內預計到2035年,綠氨需求有望突破1億噸。國家能源局表示,重點在風光開發潛力大、生物質和水資源豐富的地區,規劃佈局可再生能源制氫氨醇綜合產業基地。中國電力企業聯合會常務副理事長 楊昆:當前中國風光總裝機突破17億千瓦,已超越火電成為第一大電源,每年新增新能源容量超過2億千瓦。利用好風光全產業鏈的超大規模市場優勢,一方面降低“綠色石油”的生產成本,另一方面拓展新產業帶來的綠色溢價優勢,讓“綠色石油”成為推動綠色低碳發展的新型綠電產品。專家:進一步啟動創新潛能為大市場創造更多優勢超大規模市場的獨特優勢,在創新鏈條中發揮著不可替代的放大器作用,龐大的市場體量,可以讓創新成果快速實現規模化應用。如何將這一獨特優勢,進一步轉化為強勁動能,實現產業升級?華創證券研究所副所長 張瑜:所有兆級以上產業的創新需要的需求容量,在中國可以說是相當有空間的,隨意可以去湧現和發展的。面對這種量級的市場,企業可以充分去嘗試和試錯,可以大幅攤銷很多固定成本。要進一步啟動大市場的創新潛能,除了政策直接扶持,還要充分利用市場自身力量,發揮金融服務實體經濟的效能,引導資本精準流向科技創新前沿領域。國務院辦公廳日前印發《關於加快場景培育和開放推動新場景大規模應用的實施意見》,提出充分發揮中國超大規模市場和豐富應用場景優勢,推動新場景大規模應用,形成從技術突破到場景驗證,再到產業應用和體系升級的路徑,進一步激發創新活力。 (央視財經)
造芯,馬斯克是“來真的”,2026年
馬斯克正加速在美國建構從晶片設計、封裝到製造的完整自主產業鏈。德州PCB中心已投產,FOPLP工廠計畫2026年量產;下一代AI晶片研發同步推進。最終將建成月產能達百萬片的晶圓廠,專注於14奈米等適用製程。這一戰略旨在擺脫外部依賴,應對AI算力需求並規避地緣風險,預計2027年前大幅削減外部訂單。馬斯克正加速推進其晶片自主化戰略,計畫在美國打造一條從印刷電路板(PCB)、扇出型面板級封裝(FOPLP)到晶圓製造的完整晶片產業鏈,以逐步擺脫對外部供應鏈的依賴。11月16日,據媒體報導,該計畫已進入實質性推進階段。位於德克薩斯州的全新PCB中心目前已投入營運,FOPLP工廠也已啟動裝置安裝,預計將於2026年第三季度實現小規模量產。據華爾街見聞,此前在特斯拉年度股東大會上,馬斯克明確表達了“造芯”意向。在最新社交媒體動態中,馬斯克透露,其團隊已於周六完成AI5晶片的設計評審,並已同步啟動AI6晶片的早期研發工作。他強調,AI5是專為特斯拉AI軟體定製的推理晶片,功耗降至250瓦左右,這對Optimus來說至關重要。在特定應用場景下性能將全面優於市場上任何其他晶片方案。01 生產設施已啟動部署馬斯克的晶片產業鏈計畫包含兩個核心設施。德克薩斯州的PCB中心已開始營運,為後續生產提供基礎支撐。FOPLP工廠目前處於裝置安裝階段,預計2026年第三季度開始限量生產。SpaceX是這一戰略的主要推動力。該公司計畫整合衛星晶片封裝流程,降低成本並實現對星鏈元件的完全控制。在自主產能建成前,公司從意法半導體和群創採購射頻和電源管理晶片,但這些外部採購將在2027年內部產能提升後逐步減少。據媒體報導,馬斯克已從英特爾、台積電和三星招募技術人員,顯示其對晶片業務的高度重視。02 晶圓廠目標直指百萬片產能為全面實現晶片自主化,馬斯克計畫建設一座大型晶圓廠,初期月產能目標為10萬片,最終目標達到100萬片。雖然該廠在先進製程節點上難以匹敵台積電,但將具備14奈米及更先進製程的生產能力,足以支撐機器人、自動駕駛和衛星網路等業務需求。這一產能規劃使特斯拉和SpaceX能夠規避地緣風險及產能限制問題。對於特斯拉的自動駕駛技術和SpaceX的星鏈項目而言,穩定的晶片供應至關重要。馬斯克此前曾與台積電在產能優先權上產生分歧,這成為其自建供應鏈的直接動因之一。通過掌控從設計到生產的完整流程,馬斯克旗下公司可按自身需求和時間表進行生產,不受外部供應商制約。03 自主供應鏈應對AI需求高峰建立自主供應鏈的戰略與馬斯克應對未來AI需求激增的目標相契合。隨著人工智慧應用擴展,晶片需求預計將持續攀升,依賴外部供應商可能在需求高峰期面臨交付瓶頸。馬斯克的做法實質上是在建構類似台積電和東京電子的自主體系,但規模和定位專門服務於其旗下企業。這種垂直整合模式在關鍵供應鏈環節提供了更大的靈活性和安全性。從2026年下半年開始,馬斯克旗下公司將陸續從合作夥伴處撤回生產訂單,轉向內部製造。這一轉變對現有供應商的訂單量構成直接影響,同時也標誌著科技巨頭在晶片領域自主化趨勢的加速。 (硬AI)
被產業鏈“寄予厚望”,AIPC現在如何了?
讓消費者能直接感知的AI體驗尚未成熟,相關廠商對AIPC的樂觀預期可靠嗎?2025年10月28日,安徽合肥,在聯想集團(00992.HK)旗下聯寶科技的PC(個人電腦)生產基地,一條SMT(表面貼裝技術)自動化產線正高速運轉,機械臂以微米級精度抓取元件,將其精準地貼裝在深綠色的主機板上。產線上正在批次下線的,是一批“聯想拯救者AI版”筆記型電腦,之所以叫AI版,是因為該款機型預裝了聯想的“天禧個人超級智能體”大模型。這種產品所屬的類別,即為當下科技行業正全力投入的新品類——AIPC(人工智慧個人電腦)。簡單來說,AIPC與傳統個人電腦的核心區別,是它在CPU(中央處理器)和GPU(圖形處理器)之外,額外整合了一顆NPU(神經網路處理器)。NPU則是一種專門用於低功耗、高效率執行AI任務的晶片,可以讓電腦在本地更流暢、更安全地運行AI應用。事實上,自幾年前ChatGPT 3.5橫空出世以來,消費者對於能在自己的電腦上部署AI大模型便有了殷切期待。就在記者前往聯想電腦工廠實探的幾天前,根據主要網路銷售管道的反饋資訊,聯寶科技就調整了拯救者AI系列產品的生產優先順序。“我們整個AIPC的銷量一直在增長,AIPC是一種趨勢。”聯想消費業務群京東業務總經理余尚奇在10月28日接受經濟觀察報記者採訪時如此表示。聯想的情況並非個例,2025年以來,為了滿足日益增長的市場需求,科技行業圍繞AIPC的佈局明顯提速,各大廠商正密集地拿出各自的解決方案。10月24日,英特爾發佈了2025年第三季度財報。財報顯示,該公司第三季度營收為136.5億美元,同比增長2.8%,這是英特爾的營收在經歷了一年半的下滑後,首次恢復季度同比正增長。這家晶片巨頭營收恢復增長的原因,離不開AIPC。在財報中,英特爾預期,到2025年底,將為超過1億台AIPC供應處理器。11月5日,科大訊飛(002230.SZ)也在合肥召開發佈會,推出了“訊飛星火AIPC”。除了硬體上的革新,科大訊飛還宣佈自家AIPC打通了龍芯、飛騰等國產CPU(中央處理器),以及統信UOS、麒麟等國產作業系統,試圖建構一個服務於政企辦公場景的“全端自主”生態。消費者的期待“超出預期”,廠商的投入“聲勢浩大”,但從實際應用層面來看,AIPC的“軟體生態碎片化”和“實用性不足”等痛點依然突出。比如,一方面,知名市場研究機構頭豹研究院資料顯示,2025年第二季度國內AIPC的出貨量佔比已超28%;但另一方面,AIPC的核心硬體NPU,在許多主流的生產力軟體中並未得到有效呼叫,這導致早期使用者在支付了硬體溢價後,並未在日常工作中獲得廠商宣傳中所描述的AI體驗提升。這就帶來了一個問題:讓消費者能直接感知的AI體驗尚未成熟,相關廠商對AIPC的樂觀預期可靠嗎?01 “局內人”當下這股AIPC熱潮,首先是從產業鏈的最上游——晶片端開始的。AIPC的硬體基礎是晶片,它與傳統電腦最大的不同,在於普遍採用了“CPU+GPU+NPU”的異構計算架構。其中,CPU負責複雜的管理和調度,GPU負責高強度的平行計算(如圖形渲染),而新增加的NPU則是一種低功耗晶片,專門負責處理AI應用,如背景虛化或智能降噪。目前,晶片市場主要有幾股力量在推動各自的AIPC方案。首先是傳統的x86架構(一種指令集架構)聯盟,以英特爾和AMD為代表。英特爾推出了酷睿Ultra(Core Ultra)處理器,採用了“分離式Tile”(即模組化)架構,將計算、圖形、NPU模組等不同單元獨立封裝,再組合到一起。英特爾高管在2025年10月24日的財報電話會議上表示,下一代Panther Lake處理器正按計畫推進,該晶片將採用其18A(約1.8奈米)製程工藝。AMD則推出了銳龍AI300系列處理器,公開資訊顯示,其NPU算力達到50 TOPS(TOPS,即每秒兆次操作,是衡量AI算力的單位)。但x86架構並非唯一的選擇,高通正試圖將其在手機端積累的ARM(一種指令集架構)優勢引入PC市場,ARM架構的核心優勢在於低功耗。高通在2025年9月推出的驍龍X2 Elite晶片,其NPU算力據稱達到80 TOPS。此外,國產晶片廠商也在進入這個賽道:科大訊飛在其11月5日舉辦的AI PC發佈會上,就明確宣佈其“訊飛星火AIPC”方案適配了龍芯、飛騰、海光、兆芯等國產CPU;另有公開資訊顯示,華為也在規劃搭載自研鯤鵬CPU和鴻蒙PC系統的商用AI筆記型電腦。算力晶片夠了之後,就需要作業系統來定義標準和調度算力。在系統層面,美國微軟公司依然是市場的主導者,微軟制定了“Copilot+PC”的規範——這是微軟為其AIPC制定的一個新標準,特指那些配備了NPU、能夠在本地(而非雲端)高效運行AI任務的電腦。該規範明確要求,AIPC的NPU算力“不低於40 TOPS”,並且記憶體“至少需要16GB”。另外,高通則聯合了Google,正在打造一個融合Android和ChromeOS的“Android AIPC”新平台。在國產領域,科大訊飛選擇與統信UOS、麒麟等國產作業系統進行深度適配。晶片和系統最終被組裝成整機,交付給消費者,在這一環節,相關廠商的訂單開始實質性落地。華勤技術(603296.SH)就是一家代表性的ODM(原始設計製造商)廠商,其管理層在10月28日的2025年第三季度業績說明會上表示,公司在2024年筆記型電腦(筆電)出貨量突破1500萬台的基礎上,2025年前三季度筆電業務(包含AIPC)“實現收入超30%的增長”,預計“2025年全年收入將超過300億元”。華勤技術的管理層將其在AIPC賽道的競爭優勢,歸結為“在手機產品上積累了創新技術”,例如“輕薄設計、散熱技術等方面的技術優勢”,被橫向“延展到筆電產品”。另一家ODM廠商龍旗科技(603341.SH)管理層也在近期的投資者交流會上表示,AIPC領域“全球頭部客戶首個合作項目正式落地”,並“預計2026年AIPC業務將實現規模化出貨”。也就是說,隨著晶片、系統與整機的協同落地,AIPC不再只是概念,正轉化為實實在在的增量市場——對產業鏈上的多數廠商來說,這意味著更高價值的產品結構和更可觀的單機利潤空間。最直觀的溢價首先來自機殼(即結構件),主營業務包括PC結構件的英力股份(300956.SZ)管理層在11月5日舉辦的一場投資者交流會上就明確表示,AIPC散熱需求加大,機殼需要增加散熱孔,這“會導致加工單價提高30%左右”。頭豹研究院資深分析師曾涵宇在11月6日接受經濟觀察報記者採訪時亦表示,AIPC晶片功耗較傳統PC提升了“30%—50%”,這直接激發了對均熱板(VC)、石墨散熱片等散熱模組的強勁需求;另外,要在本地裝置上運行AI大模型,電腦上的多個部件都必須同步升級,其中儲存和主機板是兩個關鍵環節。在儲存方面,群智諮詢IT事業部資深分析師張玉彬告訴記者,為滿足大模型計算需求,記憶體容量從16G升級至32G已成為“必然趨勢”。同時,DDR5(第五代雙倍資料速率記憶體)和PCIe 4.0/5.0 SSD(一種更高速的固態硬碟)也正在加速成為AIPC的標配。在主機板(PCB,印刷電路板)方面,新的異構晶片(CPU+GPU+NPU)則需要更複雜的主機板來承載。對此,曾涵宇表示,這推動了18層以上的高多層板和HDI(高密度互連)電路板的需求,其“產品價值量較傳統PC PCB提升超20%”。此外,張玉彬還認為,隨著AI對人機互動的強化,筆記型電腦的Touch Panel(觸控板)也將迎來利多,預計到2026年,In-cell(內嵌式)觸控筆記本面板的出貨份額有望攀升至約18%。從晶片到整機,從結構件到散熱模組,AIPC已初步形成一條高溢價、高協同的完整產業鏈,廠商們憑藉硬體升級率先收割了“換機潮”的第一波紅利。但熱鬧的供應鏈背後,一個更根本的問題浮出水面——眼下的AIPC,配得上“AI”這兩個字嗎?02 “尚需時日”英特爾定下的“1億台”目標聽上去氣勢十足。但這1億台AIPC的需求,究竟是靠AI的體驗“拉”動的,還是被別的因素“推”動的?2025年10月14日,微軟正式終止了對Windows 10作業系統的支援,在張玉彬看來,這一變動將那些對安全性和AI功能有較高需求的主流商用企業使用者,“推向了換機的快速通道”。曾涵宇亦認為,“系統迭代”是目前驅動商用換機的主因,疊加多地政府推行的“以舊換新”補貼政策,共同推動了市場需求的回暖。換言之,至少在2025年的當下,AIPC市場的高速增長,與“Windows 10停服”帶來的剛性換機需求緊密相關。相比之下,AI功能本身的“拉力”似乎明顯不足,在社交平台上,許多購買了AIPC的消費者的反饋,都集中指向了“聽不懂、不好用”的體驗問題:比如,家住北京的王女士最近剛花8000多元換了一台AIPC,她原本期望AI助手能幫她自動整理每周的視訊會議紀要,但她發現,匯出的紀要“錯字連篇,還不如自己手寫”;在上海從事市場工作的楊先生也遇到了類似問題,他試圖讓AI助手讀取本地電腦上的一份季度銷售報告(Excel表格),並要求其“自動生成一份總結PPT”,但結果卻是AI助手生成的PPT不僅套用了錯誤的主題範本,圖表資料也完全錯誤。“最後我還得自己一頁一頁重做,”楊先生抱怨,“(AI)純屬幫倒忙。”經濟觀察報記者在10月28日實探聯想工廠時亦目睹了相似的一幕,一名工程師在演示其“天禧個人超級智能體”時,試圖用語音指令調出針對《黑神話:悟空》這款遊戲的專屬最佳化模式,但在多次嘗試後,AI智能體均未理解該指令,演示最終未能成功。在深圳華強北從事多年電腦銷售的吳先生則向記者表達了對硬體瓶頸的擔憂。在他看來,在軟體生態之外,本地裝置的物理限制也是一大難題:“現在都說本地AI,但不管是筆記本還是桌上型電腦,空間和功率總是有限的。這個算力天花板就在那裡,跑不了參數太高的大模型,這才是真正限制本地體驗的地方。”聯想消費業務群京東業務總經理余尚奇也向記者強調,目前AIPC的痛點包括“互動模式的反應速度仍需提升”,以及“AI生態的初期應用相對還是比較少”。換句話說,今天的AIPC,更像是“披著AI外衣的傳統電腦”——硬體已就位,軟體卻還在趕路,廠商們賣的是“矽基生命”的想像,使用者買到的卻是“智能不足”的現實。在曾涵宇看來,當前AIPC的多數AI功能仍停留在“單一、被動的輔助操作”(如文字生成、圖片修飾)層面,而並非使用者所期待的、具備主動感知和跨場景協同能力的“智能夥伴”,其背後的原因是“開發者生態尚未成熟”,“廠商自研AI應用覆蓋的場景有限,第三方應用適配率不足”。在採訪過程中,記者注意到,儘管AIPC在晶片算力、整機設計和供應鏈配套等方面已基本就緒,但真正決定使用者體驗的“最後一公里”,即豐富、穩定、智能的AI應用生態,尚未形成閉環。也就是說,廠商們押注的是未來三到五年的技術演進窗口,而使用者當下支付的溢價,本質上是在為一個尚未成型的智能願景買單。正因如此,多位受訪的業內人士均向記者表示,AIPC的真正爆發不會發生在2025年,而是需要等到開發者工具鏈完善、端側大模型輕量化成熟,以及跨應用智能體協同機制建立之後。“AIPC滲透率至少要到2028年才能實現佔比過半的突破”。張玉彬向記者如是稱。 (經濟觀察報)