#全球AI
談談Google TPU :全球AI加速器革命與中國A股機遇
在人工智慧浪潮席捲全球的當下,專用計算硬體已成為定義勝負的關鍵戰場。Google 的 Tensor Processing Unit(TPU)作為AI領域的標誌性ASIC(Application-Specific Integrated Circuit),以其脈動陣列架構和極致能效,深刻影響著從模型訓練到即時推理的全流程。最近隨著第七代TPU Ironwood的正式發佈,Google挑戰了輝達的GPU霸權, 在中國A股市場,這一波“Google鏈”熱潮已然點燃,光庫科技、德科立、騰景科技等概念股應聲暴漲,對應出本土企業深度嵌入AI基礎設施的潛力。一、TPU的起源與全球影響:從Google內部工具到生態引擎TPU的誕生可追溯至2013年Google對AI計算瓶頸的深刻洞察。當時,RankBrain和Google Photos等項目面臨海量矩陣運算的挑戰,傳統CPU/GPU的馮·諾依曼架構難以滿足低延遲、高吞吐的需求。 僅用15個月,Google團隊便推出第一代TPU(v1),於2015年內部部署。這不僅是硬體創新,更是資料流計算範式的復興,借鑑了上世紀80年代的脈動陣列(systolic array)思想。從v1的整數推理專用,到2025年v7 Ironwood的4.7倍性能躍升(峰值4614 TFLOPS),TPU已迭代七代。 其全球影響力體現在:AlphaGo的蒙特卡洛樹搜尋、Gemini 3的訓練均依賴TPU Pod超大規模叢集。 2025年11月,Google與Meta的TPU合作傳聞進一步放大其效應,Meta擬部署百萬級TPU晶片,挑戰輝達供應鏈。 這波“偷家”行動,不僅推升Google股價破300美元,還波及A股“Google鏈”類股。在中國語境下,TPU的興起加速了本土AI硬體自主化。A股公司如寒武紀,其思元系列NPU(Neural Processing Unit)在架構上與TPU高度相似,均採用脈動陣列最佳化矩陣乘法。 同時,光庫科技作為GoogleOCS(Optical Circuit Switching)交換機核心代工廠,份額超70%,直接受益TPU Pod的互聯升級。 2025年Q3,光庫科技訂單激增30%,市值一度翻番,也成為從被動供應鏈到主動創新的雙重角色。二、TPU核心架構剖析:脈動陣列與資料流革命TPU的魅力在於其“為AI而生”的設計,無法運行通用任務,卻在神經網路負載上碾壓對手。 核心是TensorCore,包括矩陣乘法單元(MXU)、向量/標量單元,以及高頻寬記憶體(HBM)整合。這些元件協同,實現從資料注入到結果輸出的無縫流水線。2.1 MXU:脈動陣列的計算心臟MXU是TPU的靈魂,採用256x256(v7)脈動陣列,每周期執行海量乘累加(MAC)操作。 資料如心跳般“脈動”流動:權重從HBM載入,啟動值逐行注入,避免傳統架構的記憶體瓶頸。v7支援FP8精度,峰值吞吐達4614 TFLOPS,頻寬7.37 TB/s。對比A股寒武紀,其MLU系列NPU同樣嵌入脈動陣列,支援BF16/INT8混合精度,適用於雲端訓練。 2025年,寒武紀發佈MLU290,性能逼近TPU v6,訂單覆蓋阿里雲和華為鯤鵬生態,年營收增長45%。 這表明,中國ASIC設計已從模仿到平行,填補TPU在本土部署的空白。2.2 輔助單元與互聯:高效擴展的基石向量單元處理啟動函數(如GELU),標量單元管理控制流。 TPU的infeed/outfeed佇列實現主機-加速器零複製傳輸,延遲低至微秒級。互聯方面,ICI(Inter-Chip Interconnect)支援9216晶片Pod,採用3D立方拓撲。在A股,德科立專注光互聯模組,供應GoogleOCS整機核心,助力TPU Pod的低功耗擴展。 2025年11月Meta合作消息後,德科立股價大漲,Q3淨利潤預增60%。 類似地,天孚通訊提供矽光子晶片,最佳化TPU的頻寬瓶頸,與TPU v7的7nm工藝高度契合。2.3 與本土架構的異同:啟發與差距TPU的確定性執行(無快取亂序)確保99%尾延遲穩定,功耗僅為GPU的1/3。 A股芯原股份作為ASIC設計服務商,助力企業定製類似TPU的加速器。 其VeriSilicon平台支援脈動陣列IP,2025年AI訂單佔比90%,營收同比增85%。 然而,國內公司仍面臨生態壁壘:TPU深度繫結TensorFlow,而寒武紀的Cambricon CNDK更相容國產框架。三、TPU世代演進:技術躍遷與中國鏡像TPU七代迭代體現了工藝縮小、精度提升與規模擴展的邏輯,每代均針對AI痛點最佳化。3.1 v1-v3:奠基與浮點轉型v1(28nm,92 TOPS)專注8位整數推理。 v2(16nm,45 TFLOPS)引入BF16訓練,Pod達180 TFLOPS。 v3(123 TFLOPS)最佳化液冷,1024晶片Pod。同期,中國企業起步:曙光資訊推出“星雲”伺服器,整合國產NPU,模擬TPU Pod。3.2 v4-v5:7nm革命與效率焦點v4(7nm,275 TFLOPS)Pod 4096晶片。 v5e/v5p(197/459 TFLOPS)強調推理/高記憶體。A股工業富聯作為富士康子公司,代工TPU伺服器,2025年AI產能擴至30%。 其訂單受益v5稀疏核心,淨利潤預增25%。3.3 v6-v7:Trillium與Ironwood巔峰v6e(918 TFLOPS)4.7倍v5e。 v7(4614 TFLOPS,FP8)定義2025標準。騰景科技專注PCB,供應TPU封裝,11月連續漲停。 寒武紀則推出“雲端智算一體機”,性能對標v6,助力“東數西算”。性能對比表(含本土鏡像):從表可見,A股產品性能追趕迅猛,但規模化仍需時日。四、性能實測與本土應用:TPU vs. A股加速器v1在CNN/LSTM上快GPU 15-30倍,能效80倍。 v7在Gemini 3訓練中,吞吐提升4倍。寒武紀NPU在阿里“通義千問”推理中,延遲低20%,成本降30%。 芯原的ASIC服務助力中小企定製TPU-like晶片,2025訂單12億。 侷限:TPU生態封閉,A股需強化XLA相容。五、相關公司案例:Google鏈與自主創新雙軌5.1 供應鏈受益者:光通訊與封裝光庫科技:OCS代工70%,TPU Pod互聯關鍵,2025市值翻倍。德科立:整機供應,Q3淨利增60%。勝宏科技:高多層PCB,TPU伺服器板卡。5.2 自主加速器先鋒:寒武紀與芯原寒武紀:NPU架構仿TPU,MLU雲平台支援萬卡叢集,營收45%增長。芯原股份:IP授權費99% QoQ,AI ASIC訂單主導。5.3 伺服器整合:曙光與富聯曙光資訊:國產伺服器整合NPU,模擬TPU Pod。工業富聯:TPU代工,AI產能30%。這些公司2025年集體市值增超500億,ETF如159363漲3.45%。六、TPU vs. 競爭:全球格局與中國突圍TPU不僅是架構,更是AI民主化的催化劑。其在能效上勝GPU,但靈活性遜色。 A股寒武紀填補國產空白,芯原橋接自研。v8或破10 PFLOPS,融入光子計算,從鏈條末端向核心進軍,寒武紀等或領跑“TPU中國版”。希望相關公司借勢而上,助力中國智算強國夢。 (Visionary Future Keys)
港股四季度的主線邏輯
在十一長假期間,再創年內新高,恆生指數突破27000點,之前我們多次提到的恆生科技指數表現更加亮眼,自9月以來最高漲超20%。恆生科技指數的強勢,其實邏輯不難理解,一是美股的AI處理程序不斷加速,美國科技公司都在加速投入,上半年已經見到了成效,而擁有最大使用者基數的科技公司,其實就是最強的AI應用股,目前港股也在逐漸反應這邏輯。二是此前恆生科技指數的走勢與恆生指數的差距太大,在全球科技牛的背景下,恆生科技指數追平漲幅差只是第一步,第二步是科技股拉開差距,有充分的條件表現的更加好。所以,在阿里雲的表現超預期後,AI的邏輯在不斷強化,AI是人類生產力的大槓桿,中美都在演繹這樣的邏輯。那麼,在全球股市一致性的大行情下,恆生科技指數的長期機會還是很明顯的,值得長期關注恆生科技指數ETF(513180)。全球AI浪潮下的恆生科技在我們國慶期間,美股的表現非常熱鬧,先是OpenAI推出Sora 2視訊模型火爆全球,再是OpenAI入股AMD簽署4GW的訂單,美國的AI進展是一天一個樣,每天都在越好的路上。在一個多月前,火爆全球的AI應用還是Google的Nano banana製圖模型,而現在OpenAI搶迴風頭,美股的AI競爭十分激烈,可以說是你追我趕。港股方面,主要還是以阿里來扛大旗推進AI發展,包括自主可控的晶片自研作為副邏輯,雖然港股的進展慢一拍,但好處是大趨勢是確定的,估值也不貴,AI大方向的勝率足夠高。值得注意的是,最近市場逐漸反應過來,現在可能不會有什麼小公司做出一個AI應用殺出重圍,一是因為做好AI需要花費很多的金錢和人力,小公司沒有這樣的實力;二是市面上的AI應用並不少,但缺少應用場景,例如像GoogleGemini大模型推出Nano banana,或是OpenAI推出Sora 2,一下就是幾億的使用者在使用。所以,在AI時代下,大型科技公司的頭部優勢會越來越明顯,大公司有足夠多的錢來買GPU建資料中心,也有足夠大的使用者基數來推進AI應用,再不濟AI也是個保底的生產力槓桿工具,現在美股交易的是這邏輯,而這也適用於港股。可以想想,騰訊系和阿里系的使用者基數有多麼大。或許大家還不能夠詳細理解到AI的幫助,黃仁勳在最新的採訪上提到兩點:1.AI改變了人類過去的做事方式,簡單來說電機取代了勞動力和體力勞動,而現在科技公司擁有AI和超級資料中心,GPU生產出來的tokens將增強人類的能力。舉個簡單的例子,我用10萬美元請一名員工,並用一套價值1萬美元的AI來增強這名員工,這套AI使得這個員工的生產力放大了2-3倍,甚至是更多,那科技公司毫無疑問地會去使用。現在NVDA每個員工身上都這樣做,比如我們每個工程師設計師都在這樣做,因此我們工作的速度加快,晶片製造的也更好,公司發展的更快。因此我們招更多的員工,再用更多的AI來放大槓桿,為公司創造更高的收入,這為什麼不呢?2.為什麼科技公司都在買更多的GPU?黃仁勳提到,目前面向消費者的內容很大程度上是由推薦系統所做的,未來也會完全由GPU來生成內容,更加精準的將廣告推流給使用者,例如像Meta、aws、google、字節跳動的營運都需要GPU。大概意思是指,我們當下看到的廣告,過往主要是有人在系統後台所勾選“廣告內容”標籤推送的,這大概會選擇3-5個標籤,但這廣告推流的並不精準,那就意味著廣告主的投入回報率不高,那廣告主賺不到錢,可能就不會再投更多的廣告。但如果是由GPU來做內容推薦的話,廣告的推送,搜尋引擎的推薦,包括像tiktok的演算法,這都需要GPU來運作,這就能更加精準的將內容/廣告推送給使用者。那商家投入的廣告回報率提升了,自然會投入更多的錢,那科技公司就能賺到更多的廣告收入和佣金。3.那麼,瞭解到上面兩個邏輯後,現在回到港股的討論裡,目前騰訊和阿里都符合這兩個條件,一是AI能作為公司的生產力槓桿,員工能借助AI放大生產效率;二是騰訊的廣告推流會越來越精準,阿里也同樣,例如淘寶的搜尋引擎,個性化的內容推薦等。所以說,雖然明面上好像沒有一個超級的AI應用公司出現,但其實最受益AI進步的公司是這些科技巨頭,中美公司來說都一樣。更何況,從估值上看,目前港股的科技股還是不貴的。根據小程序“紅色火箭”的資料統計,目前恆生科技指數的市盈率為24.7倍,PE百分位為38.7%,估值水平比過去5年61%的時間要低。另外,抓熱點可用紅色火箭,紅色火箭看這些估值分位數非常方便,不像其他軟體看起來很複雜,大家感興趣也可參照看看。總的來說,順著當下全球股市對AI發展的一致性認可,這是長達未來5年的成長敘事,現在或許還是配置恆生科技指數ETF(513180)的好機會。另外,今天港股創新藥因為季度初的調倉,以及個別小作文的干擾有調整,但創新藥長期看好的邏輯並未發生改變,恆生醫藥ETF(159892)也值得關注。 (真是港股圈)
重磅《Nature》2024全球AI領域Top100大學名單:美國46所,中國19所,英國7所...
近期,權威科學期刊《自然》(Nature)旗下的“Nature Index Supplements 2024 AI”重磅發佈了全球AI研究領域領先的TOP100高校榜單!這份基於過去五年頂級期刊論文產出的排名,不僅揭開了學術界的科研暗戰,更折射出全球AI教育格局的深刻裂變:哈佛、斯坦福、MIT穩坐前三;清華大學首次殺入前十;電腦“神校”卡內基梅隆卻跌至62名。一、美國霸榜與加州系的“集體狂歡”美國高校以46所上榜的絕對優勢,延續著AI領域的統治地位。前三分別為:哈佛大學:以805.23的“科研份額值”登頂,相當於平均每天在頂級期刊發表1.5篇AI論文,其跨學科實驗室“腦科學與AI交叉中心”每年吸引Google、OpenAI投入超2億美元合作經費。斯坦福和MIT:分別以550.22、545.21的份額值緊隨其後,前者在生成式AI課程中直接引入ChatGPT-5作為教學工具,後者則把自動駕駛實驗室開進了波士頓地鐵隧道。2024全球AI領域Top100大學排名(Top10)更令人側目的是加州大學系統的“集團軍作戰”——UCSD、UCB、UCLA三校集體挺進前十,舊金山分校(UCSF)也位列20名。這些公立校憑藉矽谷地緣優勢,將產學研融合玩到極致:UCSD學生每周三天在高通總部偵錯晶片,UCB的AI倫理課由前GoogleCEO施密特親自授課,而UCLA醫學院正用AI預測癌症突變,論文直接轉化進輝瑞新藥研發管線。二、中國崛起:從7所到19所的“狂飆”中國高校的爆發式增長是最大亮點:清華大學:以264.24份額值衝至全球第9,其自動駕駛團隊在CVPR會議包攬3項最佳論文,深度學習框架“計圖”下載量突破千萬。2024全球AI領域Top100大學排名(中國)北京大學位列14,而中科院大學、浙江大學等19所高校集體上榜,數量較2020年激增171%。這種躍進離不開“國家隊”的投入:清華為AI專業本科生配備人均50萬元科研基金,中科院則把大模型訓練機房建在了貴州山洞裡,用天然低溫省下3成散熱成本。但光鮮背後也有隱憂。香港大學、港中文雖上榜,卻因論文合作率超60%被學界質疑“含金量”。而內地高校在《自然》《科學》等頂刊的獨立發文量僅為美國的1/5,顯示原創性研究仍有差距。三、英國:AI強校實力不容小覷英國政府非常重視 AI 技術的發展,早前就宣佈將加大投資力度,使英國 AI 超級計算能力提高 30 倍。本次排名中共有7所英國大學躋身全球AI研究百強,牛津大學與劍橋大學分別位列第4名和第5名。帝國理工學院: 作為G5超級精英大學之一,IC的電腦系擁有超過30個活躍的研究小組,研究範圍覆蓋從基礎AI理論到複雜智能系統的廣泛領域。愛丁堡大學: 在人工智慧領域的歷史可以追溯到上世紀60年代,是歐洲乃至全球最早開展AI研究的中心之一。其資訊學院 (School of Informatics) 是歐洲最大的電腦科學和資訊學研究機構之一,在機器學習、自然語言處理、電腦視覺和機器人學等領域擁有世界一流的研究實力。倫敦國王學院: 地處倫敦市中心的KCL,其電腦科學實力同樣強勁。得益於其優越的地理位置,KCL與倫敦蓬勃發展的科技產業聯絡緊密,為學生提供了豐富的實習、就業和產學研合作機會。英國AI名校推薦:帝國理工學院、劍橋大學、牛津大學、倫敦大學學院、愛丁堡大學、南安普頓大學、曼徹斯特大學、聖安德魯斯大學等。2024全球AI領域Top100大學排名(英國)四、電腦聖殿CMU為何暴跌?卡內基梅隆大學(CMU)的62名排名引發最大爭議。這所連續13年霸榜CSRankings的“電腦聖殿”,在《自然》體系中竟不敵貝勒醫學院、匹茲堡大學等“非傳統強校”。深究其因,CMU推崇的“問題導向型研究”與《自然》的論文數量指標天然衝突——該校教授更願把成果藏在DARPA軍事項目或創業公司程式碼庫,而非急於發表。其機器人研究所所長曼努埃爾·赫爾特曾說:“我們追求的是讓機器人在阿富汗拆彈,而不是在期刊上拆解公式。”這種“叛逆”反而成就了獨特優勢:CMU2018年開設全美首個AI本科專業,學生大二就能進入Uber無人車核心演算法組;其與Meta共建的元宇宙實驗室,讓學生用腦機介面設計虛擬城市,這些實戰經驗讓畢業生起薪高達16萬美元,遠超榜單前十高校。五、留學生的兩難:追排名還是賭未來?榜單折射的不僅是科研實力,更是留學選擇的認知革命。當南加州大學憑“好萊塢+矽灘”雙IP衝至46名,其電影AI專業學生已能用GPT-5生成劇本並自動匹配投資人。而華盛頓大學靠著亞馬遜的14億美元捐贈,把AI課程開進了西雅圖太空針塔頂層的全景教室。但理性聲音也在浮現:耶魯AI倫理課教授露西亞·溫警告,盲目追求論文產出會催生“學術流水線奴隸”,她更欣賞CMU“用技術解決真問題”的理念。這給留學生拋出尖銳選擇題——是擠進榜單前排高校獲取“學術光環”,還是投身CMU這類“反叛者”擁抱產業前沿?這場排名的真正價值,或許在於撕開了AI教育的複雜面相:當清華用國家力量猛追基礎研究,當CMU在產研融合中另闢蹊徑,當加州系把校園變成科技公司前哨站,每個選擇都對應著不同的未來圖景。正如MIT媒體實驗室主任伊藤穰一所言:“AI教育的終極考核不在榜單,而在十年後你的技術是否還活著。”2024全球AI領域Top100大學排名(人工智慧行動資訊港AI HUB)