#NVIDIA
系統級摩爾定律:推理時代 NVIDIA×Groq 的真實含義,光進銅退的再加速
過去半個世紀,“摩爾定律”幾乎是科技行業最強的敘事武器:把更多電晶體塞進一顆晶片,性能更強、成本更低,世界自動向前滾動。但到了 AI 時代,尤其進入大模型推理成為主戰場之後,這套敘事正在發生一次深刻升級——摩爾定律從“晶片內部”擴展為“系統工程”。如果說過去的摩爾定律在追求“每平方毫米更多電晶體”,那麼 AI 時代的摩爾定律更像是在追求:單位時間產出更多 token(token throughput),並且這條曲線要能持續向上。而 token throughput 的提升,早就不再是單顆 GPU 的問題,它是一整座“AI 工廠”的問題:晶片、HBM、封裝、PCB、供電散熱、機櫃內互聯、機櫃外網路,以及軟體如何把這些組織起來、調度起來,讓系統始終跑在“最短板”之上。在這個框架下,NVIDIA×Groq 的合作/交易(無論最終形態是什麼)更值得被理解為:推理時代的一次“系統級加碼”,而不是“解決某個供應鏈瓶頸”的神蹟。一、先把交易定性:不是“買產能”,更像“推理能力授權 + 關鍵人才併入 + 生態介面補強”市場上最常見的誤讀,是把這類交易想像成“為了補齊 CoWoS、HBM、電力”等供給瓶頸而做的資本動作。現實更複雜。公開披露資訊顯示,這一合作/交易的核心是推理技術的非獨家授權,並伴隨 Groq 核心人員加入 NVIDIA 推進相關技術的規模化落地,Groq 公司仍獨立營運。換句話說,它更像是在為 NVIDIA 增加一條推理時代的“技術路線選項”,並把關鍵經驗與人才納入自己的產品化體系,而不是直接改變封裝產能、HBM 供給這類供應鏈事實。這一定性非常關鍵:因為它將討論重心從“供給約束”拉回到“推理範式”。二、AI 時代的“系統級摩爾定律”:為什麼摩爾定律必然外溢到 PCB、機櫃和互聯?推理系統的吞吐,本質上受制於一個非常樸素的三角形:算、存、傳。算(Compute):算力夠不夠、計算單元是否被喂飽存(Memory):權重/啟動/KV 的訪問是否形成記憶體牆傳(Communication):跨卡、跨 tray、跨機櫃的資料交換是否堵塞這個三角形的殘酷之處在於:只要把其中一條邊推上去,瓶頸就會遷移到另一條邊。因此推理時代的競爭,必然從 GPU 單點性能擴展到系統工程能力:互聯拓撲、網路頻寬密度、功耗與可靠性、軟體抽象與調度策略,都會變成吞吐曲線的一部分。這也解釋了為什麼 NVIDIA 的“摩爾定律”會被改寫成系統級版本:它追求的不是單晶片 transistor scaling,而是整座 AI 工廠的 token scaling。三、MoE 推理的結構性事實:天然需要“權重分層”(Weight Hierarchy)如果要理解“Groq 的 SRAM 路線”為什麼會在推理時代顯得格外有價值,必須先抓住當下主流模型架構之一:MoE(Mixture of Experts)。MoE 在推理側的關鍵特徵是:權重訪問天然分成兩類。1)always-on 的熱權重:每個 token 都必須執行的部分dense 層shared experts(共享專家,層層必跑)2)sparse-on 的冷權重:按路由稀疏啟動的部分routed experts(例如從 256 個裡選 top-8)啟動更隨機、訪問更像“按需取用”於是,一個極其工程化、極其自然的推理加速方向出現了:把 always-on 的熱權重常駐在更近、更低延遲、更高頻寬的儲存層(比如 SRAM/近儲存),把 routed experts 留在 HBM 或更遠端,並用熱度快取/複製策略最佳化。這件事的目標不是“省 HBM”,而是更直接的兩件事:降低 latency(減少權重搬運等待)提高穩定吞吐(HBM 頻寬從“啥都搬”變成“只搬稀疏部分”)可以把它理解為:CPU 時代的 cache hierarchy,在 MoE 時代升級為 weight hierarchy。四、用 DeepSeek V3 做一次“量級校驗”:為什麼“3–4GB FP8 熱權重集合”是硬體形態演化的抓手?推理討論最怕缺乏量級感。這裡用 DeepSeek-V3(總參 671B、每 token 啟動 37B,MoE 架構)做一次可復算的量級校驗。結合典型實現參數(hidden=7168,MoE FFN 的 intermediate=2048,約 58 個 MoE 層 + 3 個 dense 層;每 MoE 層 1 shared + 256 routed;每 token top-8 路由),可以得到一個關鍵結論:always-on 的熱權重集合本身就是 GB 級。1)shared experts(跨 58 層)的 FFN 主權重規模門控 FFN(如 SwiGLU)的一個 expert,近似包含三塊矩陣:up、gate、down。每層 shared expert 參數量約為:Params ≈ 3 × hidden × moe_intermediate= 3 × 7168 × 2048≈ 44M / 層58 層合計:44M × 58 ≈ 2.55B 參數2)3 個 dense 層的 FFN 主權重規模dense 的 intermediate 更大(約 18432):Params ≈ 3 × 7168 × 18432≈ 396M / 層3 層合計 ≈ 1.19B 參數3)合計熱權重集合(FFN 主體)≈ 3.74B 參數2.55B + 1.19B ≈ 3.74B 參數按 FP8 粗算 1 byte/參數:≈ 3–4GB 量級(不同實現是否包含量化中繼資料會有小幅偏差)這個量級的意義非常關鍵:大到:普通意義上的 L2/L3 cache 解決不了問題小到:如果系統存在某種近儲存層/推理專用駐留層,讓這 3–4GB 常駐,就非常有吸引力換句話說,MoE 推理天然提供了一個“熱權重集合”的明確對象——這就是推理硬體形態演化最容易抓住的把手。註:估算聚焦 FFN/expert 權重,是因為 MoE 推理權重搬運的大頭集中在專家 FFN;注意力部分在不同架構(如低秩投影/MLA 等)下可顯著壓縮,不改變熱權重集合為 GB 級這一判斷。五、“Groq 式 SRAM/近儲存能力”的合理落點:推理專用“熱權重層”,不是取代 GPUGroq 長期強調片上 SRAM 帶來的高頻寬與流水線式推理執行。把這一點放到 NVIDIA 的系統工程語境裡,最符合邏輯的推斷並不是“把 NVIDIA 變成 Groq”,而是:為推理系統增加一層 熱權重近儲存/專用駐留層讓 GPU 更容易被喂飽,提高有效 token/s通過軟體抽象層把這種形態納入 NVIDIA 生態,降低開發與遷移成本這裡關鍵不是“SRAM 這個名詞”,而是:更近、更低延遲、更高頻寬的權重層。至於它長在 GPU 封裝裡、長在板上、長在 tray 上,或者以某種異構加速單元形態出現,都屬於工程實現的分叉路線;但動機與收益目標是清晰的:推理提速。六、最重要的鏈式反應:計算效率上升 → 互聯壓力上移 → 光進銅退可能再加速一旦熱權重常駐近儲存,使推理端的“記憶體牆”變薄,系統會進入典型的再平衡過程:單節點有效 token/s 上升(等待變少、計算更“吃飽”)同時間裡生成更多 token,平行請求更大MoE 路由與跨卡/跨節點組織開銷佔比上升為繼續擴吞吐,系統平行度向外擴:卡內 → tray 內 → 機櫃內 → 機櫃間互聯成為新短板:頻寬密度、距離、功耗與可管理性壓力增大銅在更高頻寬與更長距離下更快觸頂,光的滲透被動加速因此,“推理提速→互聯升級→光進銅退”的邏輯並不是口號,而是一條相對自洽的系統工程鏈條:推理加速的盡頭往往不是算力,而是互聯;當計算更快,互聯必須更快。這也解釋了為什麼很多人只盯著 GPU 出貨,會低估光通訊的“二階彈性”:計算端效率提升,會讓通訊需求斜率變陡,從而推高機櫃內/機櫃間頻寬升級的緊迫性。七、投資對應:系統級摩爾定律下,那些環節更容易成為“增量受益”?如果把“推理吞吐持續提升”作為主線,那麼產業鏈受益往往不是單點,而是鏈式擴散。1)機櫃內互聯:從“銅還能撐一撐”走向“更早換光”頻寬密度更快觸頂距離、損耗、功耗與可維護性讓銅在高階速率下更尷尬光在機櫃內滲透有可能被動加速2)機櫃間網路:更高階速率光模組與交換體系token/s 上升帶動跨節點平行更深scale-out 網路更容易成為系統短板交換晶片、光模組速率升級與拓撲最佳化的需求更強3)PCB/連接器/電源散熱:系統密度提升的“基礎設施”計算更密,供電散熱與板級設計更關鍵可靠性與可維運性成為規模化推理的隱性門檻4)軟體與調度:最終決定“硬體是否兌現吞吐”MoE 路由、批處理、快取/複製策略跨卡/跨節點通訊編排統一抽象層(生態介面)帶來的鎖定效應如果說訓練時代的核心是“買更多 GPU”,那麼推理時代的核心越來越像“買系統、買網路、買軟體”。八、風險提示與可證偽點:那些前提不成立,推演就要改寫?為了避免過度演繹,有必要把邊界條件講清楚:MoE 未必長期絕對主導:結構變化會改變“熱權重集合”的形態近儲存不必然是 SRAM:實現路徑可能多樣,關鍵是“更近的權重層”專家不必然跨機櫃:現實系統會優先局部化、熱專家複製,跨櫃更多是邊界情況收益受制於軟體調度:硬體再優,調度若跟不上,吞吐不會線性提升TCO 約束:電力、散熱、網路、維運、良率與供給鏈會共同決定最優點這些因素決定了:相關判斷應被視作“方向與機制”,而不是確定性預告。結語:NVIDIA×Groq 更像推理時代的“系統級選項”,而不是供應鏈神話當摩爾定律升級為系統級摩爾定律,推理競爭的核心就從“單點性能”轉向“系統吞吐曲線”。MoE 推理所暴露出的“熱權重集合”與“權重分層”需求,為近儲存/推理專用駐留層提供了清晰抓手;一旦推理效率上升,互聯壓力上移,機櫃內與機櫃間的頻寬升級與光滲透加速也更可能成為連鎖反應。因此,NVIDIA×Groq 的意義更接近:推理時代的一次系統級加碼——未必立刻改變供給,卻可能在下一代推理範式與異構硬體生態的介面層與方法論層面,提前佔住高地。(彼得全球科技觀察)
華爾街分析師稱,這只人工智慧股票在2026年可能會飆升47%
不要指望這家人工智慧晶片股會成為下一個輝達(Nvidia)。華爾街看好輝達(Nvidia),你可能不會感到驚訝。去年12月,標準普爾全球調查了64位研究輝達的分析師,其中60位將該股評為“買入”或“強力買入”。對該公司晶片的需求激增,推動輝達的股價今年上漲了約30%。市場對該股12個月目標價的普遍預期反映出該股可能上漲44%,這是一個令人印象深刻的漲幅。然而,一位華爾街分析師表示,2026年,另一隻人工智慧(AI)股票的漲幅可能會超過這只股票。依然在上升?去年11月,Evercore ISI分析師Mark Lipacis將安森美半導體的目標價從68美元上調至80美元。這比該晶片製造商在2025年12月18日收盤時的股價上漲了47%。Lipacis的展望還顯示,Onsemi的業績將明顯好於2025年,該股今年迄今下跌了兩位數。誠然,並非每一位華爾街分析師都像Evercore ISI一樣看好Onsemi。該股的平均目標價僅反映出9%的潛在上漲空間。Lipacis對Onsemi設定的80美元目標價是華爾街最高的。此外,在接受標準普爾全球調查的34位分析師中,只有不到一半的人(15位)將Onsemi評為“買入”或“強力買入”。18位分析師建議持有該股,1位建議投資者賣出。為什麼安森美半導體會在2026年飆升輝達生產用於託管人工智慧系統的伺服器的gpu,而Onsemi則開發智能電源和感測技術,該公司的產品用於資料中心、汽車——尤其是電動汽車(ev)、工業設施、能源基礎設施和其他應用。公司有巨大的增長機會,Onsemi估計其潛在市場總額為440億美元,預計該市場將以18%左右的復合年增長率(CAGR)擴張。Onsemi推出的新型垂直氮化鎵(vGaN)功率半導體將幫助該公司在潛在市場中佔據更大的份額,這種晶片可以實現更高的工作電壓和更快的開關。因此,它們可以減少高達50%的能量損失,這些特性應該使該公司的vGaN半導體對營運人工智慧資料中心的客戶特別有吸引力。Onsemi最近收購了Aura Semiconductor的Vcore電源技術,這也可能推動明年的增長。Onsemi首席執行長Hassane El-Khoury在公司第三季度財報電話會議上表示,Vcore應該幫助“縮小”下一代人工智慧資料中心解決方案中的“關鍵差距”。真的會在2026年飆升47%嗎?在我看來,Evercore ISI對Onsemi的看法似乎過於樂觀,公司肯定還有很多工作要做。Onsemi第三季度收入同比下降12%,其攤薄後每股收益下降了32%。管理層預計,到2027年,收入的復合年增長率將達到10%至12%。雖然這是半導體行業增長的三倍,但並不令人印象深刻。相比之下,分析師預計輝達明年的收入將增長48%。此外,Onsemi潛在市場中增長最快的領域預計將是電動汽車和電動汽車充電站。但據彭博社(BloombergNEF)報導,美國的電動汽車普及率正在放緩。這种放緩的原因包括國家燃油經濟性目標的回落,《通貨膨脹減少法案》中促進電動汽車的具體條款的刪除,以及加州建立特定州空氣質量標準的能力可能受到限制。好消息是Onsemi的估值是合理的,該公司股票的預期市盈率為18.5倍。但這種預期市盈率低到足以吸引大批投資者嗎?可能不會。我認為,華爾街普遍認為Onsemi在2026年將適度上漲,這似乎比Evercore ISI預測的47%的漲幅更為現實。不過,不管怎樣,我懷疑分析師預測輝達將飆升44%也可能過於樂觀。 (北美財經)
美國最新報告:NVIDIA AI晶片將領先17倍!
根據美國對外關係委員會(CFR)的最新報告,雖然華為在AI晶片領域取得了長足進步,但NVIDIA的領先優勢不僅依然穩固,且預計在未來兩年內將急劇擴大。報告通過對比兩家公司的公開性能資料與產能估算發現,目前美國最頂尖的AI晶片性能約為中國同類產品的5倍,預計到2027年下半年,NVIDIA最好的AI晶片將比華為強大約17倍。報告直言,華為在至少兩年內難以推出性能超越NVIDIAH200的產品,預計到2027年第四季度推出的昇騰960,其性能和視訊記憶體頻寬才可能與目前的H200持平。除了晶片性能,報告還提到了產能問題,即使在最樂觀的假設下,即華為的產能在2025年達80萬個AI晶片,2026年達200萬個,2027年達400萬個。這一數字仍然遠遠低於2025年NVIDIA產能的約5%,在2026年降至4%,2027年降至2%。報告甚至直言,即便華為在2027年產能增加百倍,也無法達到NVIDIA產量的一半。此外雖然華為推出了如CloudMatrix 384等叢集系統試圖通過“以量補質”,但報告指出,即使在最激進的晶片生產假設下,華為也無法以有意義的數量生產這些叢集系統。但NVIDIA也並不是沒有對手,黃仁勳傳記《The Thinking Machine》的作者Stephen Witt近日在接受採訪時表示,Google是目前唯一能對NVIDIA構成實質性威脅的科技巨頭。他表示,如果Google最終在AI競賽中勝出,NVIDIA將會陷入困境,其引以為傲的CUDA生態護城河可能也會崩潰。Witt指出,Google的Gemini模型是目前NVIDIA生態系統之外表現最好的AI模型,並且完全是在Google自主研發的TPU晶片上訓練而成。這一成功案例打破了“頂級AI必須依賴NVIDIA”的觀點,為其他試圖擺脫NVIDIA束縛的科技巨頭樹立了先例。摩根士丹利的報告也指出,到2027年,GoogleTPU的出貨量有望達到500萬顆,並開始發展TPU租賃服務。同時為了挑戰NVIDIA的CUDA護城河,Google正努力克服TPU的軟體相容性挑戰,比如大幅加強對PyTorch等流行AI工具的支援,降低開發者的遷移門檻。因此,如果Google最終在AI競賽中獲勝,雖然不會立即對NVIDIA業務造成致命打擊,但這種變化可能削弱NVIDIA AI晶片的定價能力。 (硬體世界)
路透早報:12月10日
要聞提示川普批准Nvidia對華銷售H200晶片引發美國安全擔憂中國總理:“十五五”經濟將持續向好,實施更積極宏觀政策、保持增長在合理區間中國資料觀測:菜價偏強料帶動11月CPI同比上行至0.7%,PPI降幅續縮至2.0%上海的德國聖誕集市 圖 路透/Go Nakamura重巨量資料或新聞--川普批准Nvidia對華銷售H200晶片引發美國安全擔憂華盛頓的對華強硬派和民主黨議員猛烈抨擊川普政府允許Nvidia(輝達)向中國出口其第二先進的人工智慧(AI)晶片H200,理由是擔心北京可能會利用這項技術來增強其軍事實力,並最終導致Nvidia破產並取而代之。但由白宮人工智慧主管David Sacks領導的政府團隊辯稱,向中國出口先進AI晶片可阻止華為等中國競爭對手加倍努力追趕Nvidia和AMD的最先進晶片設計。--中國總理:“十五五”經濟將持續向好,實施更積極宏觀政策、保持增長在合理區間中國總理李強分別會見世界銀行、國際貨幣基金組織、聯合國貿易和發展會議負責人。他表示,“十五五”(2026-2030年)時期中國經濟將持續向好,中國將實施更加積極的宏觀政策,從市場關切出發,更好發揮財政政策、貨幣政策作用,保持經濟增長在合理區間。新華報導援引李強並稱,中國將堅持擴大內需這個戰略基點,促進消費和投資、供給和需求良性互動。李強表示,今年中國經濟頂壓前行,取得新的發展成績,“有信心有能力”完成全年經濟社會發展目標任務。--中國資料觀測:菜價偏強料帶動11月CPI同比上行至0.7%,PPI降幅續縮至2.0%中國今日將公佈11月CPI和PPI資料。路透綜合45家機構預估中值顯示,蔬菜價格偏強、金價維持高位,疊加翹尾因素拖累減輕,中國11月居民消費價格指數(CPI)同比料上行至0.7%,這將創下21個月高位。其中,14家機構預估中值顯示,11月CPI環比料維持0.2%漲幅。同時,38家機構預估中值顯示,11月工業生產者出廠價格指數(PPI)同比跌幅料進一步縮小至2.0%,若真如此,這將是15個月最小跌幅。--美國10月職位空缺略有增加,辭職人數驟降美國10月職位空缺增加1.2萬個至767.0萬個,但招聘受抑,且辭職率達到五年來最低水平,凸顯出經濟不確定性,經濟學家在很大程度上將此歸咎於關稅。9月職位空缺大增43.1萬個,至765.8萬個,增幅為近一年來最大。9月資料此前因聯邦政府停擺43天而取消發佈。9月和10月的合併報告暗示,勞動力市場仍處於經濟學家和政策制定者所稱的 "不僱人、不裁人"狀態。--英國央行官員利率前景現分歧,通膨與降息路徑成焦點英國央行高級官員在利率前景上發表了不同看法,顯示貨幣政策委員會(MPC)在下周借貸成本決策前仍存在分歧。央行貨幣政策副總裁隆巴爾代利表示,她更擔心通膨上行風險,並稱英國央行可能正接近降息周期的尾聲。英國央行市場與銀行業務副總裁拉姆斯登稱,隨著英國央行將利率下調至中性水平,貨幣政策在控制通膨方面的效果將更難辨別,因此認為逐步解除政策約束仍是合適的。外部MPC委員丁格拉表示擔心食品價格通膨,但整體通膨下降處理程序仍在軌道上。另一位外部委員曼恩則表示,她更關注經濟中的長期行為變化,而不是預算對價格增長的短期影響。--川普稱將會見"幾位"聯準會主席候選人川普表示,他將與“幾位聯準會主席一職的候選人”會面。此前英國金融時報援引三位政府高級官員的話報導,川普將很快啟動聯準會主席的最後一輪面試。據報導,川普和財長貝森特定於周三與前聯準會理事瓦爾許會面。這些官員表示,美國國家經濟委員會主任哈西特仍處於領先位置,預計將於明年5月接替鮑爾擔任主席。*哈西特告訴華爾街日報CEO Council,仍有“充足空間”進一步降息,但他補充說,如果通膨上升,情況可能會發生變化。*在美國新聞媒體Politico周二刊出的專訪中,川普表示,支援立即降息將是他選擇聯準會主席人選的一項必要條件 。--路透短觀調查顯示,日本12月製造業景氣判斷指數回落至正10,電子和鋼鐵業疲軟抵消汽車業的持續成長。非製造業信心指數從正27升至正33,其中房地產和資訊服務業表現最為突出。--日本央行總裁植田和男表示,相信經濟將在第四季及以後恢復正成長;目前來看通膨風險並不高,尤其是財政刺激導致基準通膨加速的風險;密切關注食品通膨和日元疲軟可能對通膨預期產生的影響;匯率應遵循基本面,匯率變動將如何影響我們的通膨前景,這是一個非常重要的問題。--韓國官方資料顯示,11月經季節調整後的失業率上升至2.7%,10月為2.6%。--路透/益普索的一項最新民調顯示,美國總統川普的支援率在過去一周小幅上升至41%,因共和黨人對他在生活成本問題上的應對方式表示讚賞。這表明政府近期對“負擔能力”的新關注可能正在提升他的受歡迎度。--中國伺服器和人工智慧(AI)晶片設計商--海光資訊表示,公司將停止換股吸收合併中科曙光。在公佈合併計畫近200天後,這項交易金額超過1100億元人民幣、旨在加速建設國產算力生態的收購計畫宣告失敗。該公司稱,本次實施重大資產重組的條件尚不成熟,公司決定終止本次交易事項,但這不影響雙方後續的持續合作。--中國國防部周二稱,根據中國和俄羅斯兩軍年度合作計畫,雙方當天在東海、太平洋西部空域組織實施第10次聯合空中戰略巡航。俄羅斯新聞機構援引國防部報導稱,俄羅斯和中國的戰略轟炸機周二在亞太地區進行了聯合巡邏。一組俄羅斯圖-95MS和中國轟-6K轟炸機在日本海、東海和西太平洋上空執行了一次為期八小時的飛行任務。--英國金融時報援引官員的話報導,川普的特使已要求烏克蘭總統澤倫斯基在幾天內回應一項擬議的和平協議,該協議將要求烏克蘭放棄部分領土,以換取美國未明確說明的安全保障。--紐西蘭央行總裁佈雷曼表示,貨幣政策沒有預設路線,如果通膨前景發生變化,將會做出調整。佈雷曼告訴記者,貨幣政策委員會正在密切關注包括通膨和經濟增長資料在內的所有出爐資料。--美國農業部在月度報告中維持美國大豆出口預期不變,此前中國這一最大進口國已恢復採購。美國農業部預計,2025/26年度(截至8月31日)的大豆出口量為16.35億蒲式耳。結轉庫存也與上月持平,為2.9億蒲式耳。--瑞士政府撤回了一份關於美國下調瑞士商品關稅生效時間的公告,稱該公告系誤發,內容尚無法確認。一位政府發言人表示,經濟部將“適時積極溝通”相關事宜。--國際金融協會(IIF)表示,發達市場引領了一股借貸熱潮,推動全球債務在第三季度末升至近346兆美元。與此同時,美國關稅合法性的裁決懸而未決,可能會迫使美國發行更多債券。IIF資料顯示,上一季度,中國和美國再次成為政府債務增幅最大的國家,其次是法國、義大利和巴西。成熟市場的未償債務增至創紀錄的230.6兆美元,新興市場也創下超過115兆美元的紀錄。俄羅斯、韓國、波蘭和墨西哥的增幅最大。--法國央行在最新的企業景氣調查中表示,儘管國內政治局勢不確定,但在工業活動穩健的支撐下,法國經濟預計在今年最後一個季度增長0.2%,低於第三季度0.5%的增幅。--中國、伊朗、沙烏地阿拉伯三方聯合委員會第三次會議周二在德黑蘭舉行。中國外交部刊登會議聯合新聞稿稱,三方期待在經濟、政治等各領域擴大合作,並呼籲立即停止以色列對巴勒斯坦、黎巴嫩和敘利亞的侵犯,譴責對伊朗國家主權和領土完整的侵犯。--英仕曼集團與Brevan Howard兩家避險基金的負責人,以及阿布達比投資委員會的首席投資官表示,因地緣政治緊張及利率分化導致市場動盪,為來年提供了獲利機會。避險基金Balyasny資產管理公司的管理合夥人兼首席投資官Dmitry Balyasny表示,明年最大的尾部風險在於人工智慧是否會出現超預期的正面或負面表現。--美國能源資訊署(EIA)表示,美國今年石油產量預計將創下比此前預期更大的紀錄,目前對全球供應將過剩的預期升溫。EIA將2025年的石油產量預測上調2萬桶,至平均1361萬桶/日,將創紀錄新高。不過,該機構將2026年的總產量預測下調5萬桶,至平均1353萬桶/日。EIA還將2025年的石油需求預測上調10萬桶/日,至2060萬桶/日,並預測2026年需求將持平。--德國總理梅爾茨駁斥了川普政府對歐洲民主的猛烈抨擊,稱“我認為沒有必要由美國來拯救歐洲的民主。如果真的需要拯救,我們自己也能做到。”川普政府上周發佈的戰略檔案聲稱歐洲大陸面臨"文明消亡"。梅爾茨還表示,川普的祖父來自德國,預計川普明年將訪問德國。--據供應鏈技術提供商Descartes Systems Group稱,由於對中國貨物需求疲軟,且感恩節假期導致11月工作日少一天,11月份美國集裝箱進口量同比下降7.8%。儘管存在貿易政策和經濟不確定性,但11月份的進口量仍創同月曆史第四高。來自中國的進口量同比下降19.7%,是上月整體進口量回落的主要原因。--聯合國貿易與發展署表示,全球貿易今年預計增長約7%,並有望突破35兆美元的紀錄。該機構在一份聲明中稱,“新資料證實,儘管地緣政治緊張、成本上升以及全球需求不均衡拖慢了勢頭,但貿易在2025年下半年仍持續擴張。”--微軟宣佈規模約230億美元的新人工智慧(AI)投資計畫,其中大部分將投向印度,以加大對全球增長最快的數字市場之一的投資。微軟稍早表示,未來兩年將在加拿大投資超過75億加元(54.2億美元)。--香港警方稱,大埔宏福苑火災死亡人數升至160人,6人仍然失聯。市場摘要股市美國股市標普500指數周二微跌,因投資者預計聯準會本周即使降息也將維持鷹派立場,而全美最大銀行摩根大通在警告2026年將面臨高額開支後成為拖累該指數的最大因素。道瓊斯工業指數下跌179.03點,跌幅0.38%,收報47560.29點;標普500指數收跌6.00點,跌幅0.09%,報6840.51點;納斯達克指數上漲30.58點,漲幅0.13%,收報23576.49點。歐洲股市收盤基本持平,投資者在聯準會為期兩天的政策會議召開前保持謹慎,同時在Google公佈推出人工智慧眼鏡計畫後,EssilorLuxottica股價大跌。泛歐STOXX 600指數收盤基本持平,報578.11點。德國DAX指數表現突出,上漲0.5%;法國CAC-40指數下跌0.7%。匯市美元走高,因就業市場資料好於預期,凸顯出在聯準會預期降息之前勞動力市場仍有韌性,決策者可能會強調通膨風險,這可能制約進一步的寬鬆舉措。報告公佈後,美元上漲,兌日元攀升至兩周高點157日元附近,尾盤上漲0.6%,報156.86。美元兌歐元0.1%,報1.1625美元。美元指數上漲 0.1%,報99.21。債市美國公債收益率多數上漲,扭轉稍早跌勢,之前勞工部公佈的就業市場報告顯示職位空缺增加,且在聯準會發佈政策聲明前,市場普遍預計將降息。指標10年期公債收益率上漲1.4個基點至4.186%,盤中曾觸及日內低點4.141%。兩年期與10年期公債收益率差為57.3個基點。歐元區政府公債收益率小幅下跌,投資者排除歐洲央行在2026年降息的可能性後稍作喘息,他們還預計2027年3月加息的機率超過50%。德國10年期公債收益率下跌1.5個基點,至2.85%,此前一度觸及2.879%的3月中旬以來最高。油市油價繼上一交易日下跌2%後延續跌勢,投資者密切關注結束俄烏和平談判,供應充足憂慮以及即將公佈的美國利率決定。布蘭特原油期貨收低55美分或0.88%,至每桶61.94美元。美國原油下跌63美分或1.07%,至每桶58.25美元。金屬市場由於交易商在聯準會利率決定前保持樂觀,黃金上漲,而白銀在供應緊張的情況下達到前所未有的每盎司60美元的里程碑。現貨金收盤漲0.49%,至每盎司4209.32美元。2月交割的美國期金收高0.4%,報每盎司4236.2美元。現貨白銀攀升4.38%,報每盎司60.67美元,創下歷史新高。銅價下跌,因投資者在經歷一輪猛烈漲勢後獲利了結,同時擔憂美國降息步伐放緩以及中國需求前景。1715 GMT,倫敦金屬交易所(LME)三個月期銅下跌1.3%,至每噸11485美元,周一曾觸及紀錄高位11771美元。 (路透財經早報)
AWS發佈3nm晶片: 144 GB HBM3e,4.9 TB/s頻寬
亞馬遜網路服務 (AWS) 預覽其下一代 Trainium AI 加速器 Trainium3 至今已近一年。今天,這款晶片正式面世。在 AWS re:Invent 大會上,該公司宣佈 Amazon EC2 Trn3 UltraServer 正式上線,這是首批基於這款新晶片建構的系統,並作為其彈性計算雲 (EC2) 服務的一部分提供。Trainium3 由台積電採用 3 奈米工藝製造,單晶片可提供 2.52 PFLOPs 的 FP8 計算能力。該器件整合了 144 GB 的 HBM3e 視訊記憶體,提供 4.9 TB/s 的記憶體頻寬。AWS 向HPCwire表示,這些性能提升源於架構的改進,旨在平衡現代 AI 工作負載的計算、記憶體和資料傳輸。該公司表示,Trainium3 新增了對 FP32、BF16、MXFP8 和 MXFP4 的支援,並增強了對結構化稀疏性、微擴展、隨機舍入和集體通訊引擎的硬體支援。該公司稱,這些新增功能旨在使晶片更好地適應 LLM、混合專家架構和多模態系統的訓練模式。這些改進概述了晶片層面的新特性,但AWS表示,真正的規模優勢在於Trainium3的部署方式。該公司指出,許多最大的性能和效率提升都體現在UltraServer層面,因為新的架構、記憶體拓撲和整合引擎在數百個晶片上運行。在系統層面,一個完全配置的Trainium3 UltraServer連接144個晶片,聚合了362 FP8 PFLOPs的計算能力、20.7 TB的封裝內HBM3e記憶體以及706 TB/s的記憶體頻寬。據AWS稱,與上一代基於Trainium2的架構相比,該系統可提供高達4.4倍的計算性能提升、4倍的能效提升以及近4倍的記憶體頻寬提升。這些資料基於AWS在其發佈博文中分享的內部測量結果。AWS 向HPCwire透露,Trainium3 引入了 NeuronSwitch-v1,這是一種全新的全連接架構,可在單個 UltraServer 中連接多達 144 個晶片,並將晶片間頻寬提升至 Trn2 UltraServer 的兩倍。該公司還重點介紹了其網路堆疊的改進:升級後的 Neuron Fabric 將晶片間通訊延遲降低至“略低於 10 微秒”,而 EC2 UltraClusters 3.0 則提供多拍位元網路,以支援跨越“數十萬個 Trainium 晶片”的大型分佈式訓練作業。AWS 表示,UltraServer 層面更高的記憶體容量、更快的架構以及改進的協同引擎相結合,旨在減少大型 Transformer 和 MoE 模型(尤其是具有更長上下文窗口或多模態元件的模型)中的資料傳輸瓶頸。在對 OpenAI 的開源權重模型 GPT-OSS 進行的內部測試中,AWS 報告稱,與上一代 UltraServer 相比,每個晶片的吞吐量提高了 3 倍,推理響應時間提高了 4 倍,這表明該公司正在利用系統級的性能提升,使 Trainium3 能夠勝任數兆參數的訓練和大規模推理任務。AWS 表示,客戶已經開始使用 Trainium3 來降低訓練成本,Anthropic、Metagenomi和 Neto.ai等公司報告稱,與替代方案相比,成本最多可降低 50%。AWS 還指出,Amazon Bedrock 已經在 Trainium3 上運行生產工作負載,這表明該晶片已準備好進行企業級部署。早期採用者也在積極探索新的應用領域:據 AWS 稱,人工智慧視訊初創公司 Decart 正在使用 Trainium3 進行即時生成視訊,並以 GPU 一半的成本實現了 4 倍的幀生成速度。AWS 已著手研發下一代定製晶片。該公司表示,Trainium4 旨在顯著提升計算、記憶體和互連性能,包括至少 6 倍的 FP4 吞吐量、3 倍的 FP8 性能以及 4 倍的記憶體頻寬。AWS 將 FP8 性能的提升描述為“基礎性飛躍”,這將使企業能夠以至少三倍的速度訓練模型或處理三倍數量的推理請求,並且預計通過持續的軟體和工作負載最佳化,性能還將進一步提升。為了支援更大規模的模型和更高的節點級擴展性,AWS 表示 Trainium4 還將整合輝達的 NVLink Fusion 互連技術。其目標是使 Trainium4、Graviton 和 Elastic Fabric Adapter 能夠在通用的基於 MGX 的機架中互操作,從而建立一個靈活的機架級設計,既可以託管 GPU 伺服器,也可以託管 Trainium 系統。隨著 Trainium3 投入生產,Trainium4 也即將面世,AWS 似乎正在為未來做好準備。未來,人工智慧訓練的真正瓶頸將不再在於加速器本身,而在於連接它們的網路和系統設計。AWS 能否有效執行這一路線圖,將決定其在建構前沿規模人工智慧基礎設施的持續競爭中的地位。NVIDIA NVLink Fusion 被選中用於未來的 AWS Trainium4 部署今天,NVIDIA 和 AWS 宣佈建立多代合作夥伴關係,將 NVLink Fusion 晶片整合到未來的 AWS AI 機架和晶片設計中。AWS 在 2015 年收購 Annapurna Labs 後,開始自主設計 Graviton CPU、Nitro 網路卡和 AI 加速器。因此,AWS 的技術堆疊並非 NVIDIA 的技術堆疊,儘管它也採購了大量 NVIDIA GPU。未來,AWS 計畫將 NVIDIA 的技術整合到其定製的晶片棧中,這意義重大。NVLink Fusion 背後的理念是,NVIDIA 可以銷售一個 IP 模組,使其他晶片能夠使用 NVIDIA NVLink 進行通訊。NVIDIA宣佈了一系列合作夥伴,而Arm等其他公司最近也加入了進來。從新聞稿中我們可以看出,“AWS 正在設計 Trainium4,使其能夠與 NVLink 6 和 NVIDIA MGX 機架架構整合,這是 NVIDIA 和 AWS 在 NVLink Fusion 領域開展的多代合作的首個成果。”這對兩家公司來說都是一筆划算的交易。AWS 可以將與 NVIDIA NVL72 機架類似的機架架構用於其定製晶片項目。對輝達而言,這項技術正被融入到一項超大規模的定製晶片項目中。它有機會將NVLink Fusion Chiplet和NVLink交換機銷售到那些非輝達的CPU/GPU/NIC晶片機架中。或許最有趣的是,AWS在推進Trainium未來版本開發的同時,決定採用NVIDIA NVLink技術,而不是自行建構通訊協議、交換機以及機架基礎設施。此外,值得注意的是,AWS採用NVLink意味著它不會在其機架內擴展計算鏈路中使用Broadcom Tomahawk Ultra或其他基於乙太網路的交換機晶片,因為將兩種技術用於同一用途顯得不合常理。 (半導體行業觀察)
昨夜今晨全球大公司動態 | 輝達市值蒸發逾7000億美元;台積電起訴加入英特爾的前高管
輝達市值本月蒸發逾7000億美元。台積電起訴加入英特爾的前高管。大眾稱其中國產電動汽車可將研發成本減半。特斯上月歐洲銷量幾乎減半。滴滴、理想汽車、迪爾公佈業績。11月以來輝達(Nvidia)已累計下跌14%,市值本月蒸發逾7000億美元,因投資者越來越擔心AI支出出現泡沫,以及輝達對OpenAI等初創企業的循環投資——這些企業同時也是輝達的客戶。此前一份報告稱Google母公司Alphabet的AI處理器正取得進展。輝達的估值實際上是基於它能夠保持市場份額的預期。如果它開始失去部分市場份額,投資者就會重新評估增長前景以及公司應有的估值。不到一個月前,輝達市值剛剛突破5兆美元,周三收盤,輝達市值回升到4.38兆美元。投資者正推動AI交易的兩大領頭羊走向相反的方向。Alphabet向4兆美元市值又邁進了一步,延續了數月來由投資者對這家Google(Google)母公司的AI工具、雲端運算和晶片業務的熱情所推動的漲勢。輝達這家全球市值最高的公司則進一步遠離數周前才達到的5兆美元估值。隨著來自ChatGPT的威脅減退,使用者更多地回到Google進行搜尋,其變現能力似乎保持完好。OpenAI是一個上面蓋著網站的“燒錢黑洞”,但由於OpenAI是一家私營公司,想要估算這個黑洞有多深,仍需要大量的猜測。匯豐(HSBC)在美國的軟體與服務團隊更新了其OpenAI預測模型,按累計交易總額最高可達1.8兆美元計算,OpenAI每年的資料中心租賃費用約為6200億美元——儘管預計到本十年末,所簽約電力中只有三分之一能投入運行。預測模型顯示,OpenAI到2030年將面臨2070億美元資金缺口。全球最大晶片製造商台積電(TSMC)正起訴一名近期加入其美國競爭對手英特爾(Intel)的前高管,以鞏固其行業主導地位。台積電表示,已對前高管羅唯仁提起訴訟,指控其違反了競業禁止協議,並可能洩露了商業秘密。羅唯仁曾長期擔任台積電的研發資深副總裁,於今年夏天從台積電退休,之後不久便加入英特爾(Intel)擔任執行副總裁。台積電表示,羅唯仁高度可能使用或洩漏、告知、交付或轉移台積公司商業秘密及機密資訊予英特爾公司。惠普公司(HP)周二表示,預計到2028財年將在全球範圍內裁員4000至6000人,這是該公司精簡營運和採用人工智慧來加快產品開發、提高客戶滿意度和提高生產率計畫的一部分。此次裁員將影響惠普專注於產品開發、內部營運和客戶支援的團隊。作為此前宣佈的重組計畫的一部分,該公司今年2月份已宣佈裁減1000至2000名員工。大眾汽車(Volkswagen)表示,其純電動汽車若在中國實現全流程生產,成本可比在其他地區生產同類車型低一半。這家歐洲最大車企稱,在中國進行一系列投資後,公司首次能夠在德國境外開發新車型,包括測試和部署輔助駕駛等新技術。大眾計畫在未來五年內在中國推出約30款電動車型,押注本地化研發。該公司表示,與其2023年在德國生產電動汽車的成本相比,中國某些車型的成本下降幅度高達50%,得益於供應鏈效率提升,包括電池採購、研發周期縮短以及較低的勞動力成本。特斯拉(Tesla)上個月在歐洲的銷量幾乎減半,這令改款Model Y將重振該公司在該地區業務的希望受阻。根據歐洲行業組織ACEA周二發佈的資料,這家電動汽車製造商10月份在歐洲售出6964輛汽車,低於上年同期的13519輛。根據10月份的銷量,特斯拉在歐洲的市場份額僅為0.6%。通用汽車公司(GM)正在首席產品官斯特林·安德森(Sterling Anderson )領導下將軟體與產品整合,原高級副總裁巴裡斯·切蒂諾克(Baris Cetinok)離職,此前人工智慧主管巴拉克·圖洛夫斯基(Barak Turovsky)和高級副總裁戴夫·理查森(Dave Richardson)也已離職。法國汽車零部件製造商法雷奧(Valeo)表示,該行業正經歷一場“達爾文式轉型”,並警告稱除非歐盟保護該行業免受來自中國的競爭,否則該公司的多數裁員將發生在歐洲。這一警告發出之際,歐盟委員會(European Commission)正準備在12月10日對包括法雷奧在內的汽車業的要求做出回應,這些要求包括調整其到2035年禁止新售內燃機車型的目標,並制定關於汽車中歐洲本土零部件比例的法規。荷蘭銀行(ABN Amro)計畫削減近四分之一的全職員工。該行周二表示,將在2028年前裁減5200個全職崗位,作為其降低成本、提升盈利能力的新戰略的一部分。截至去年年底,荷蘭銀行約有2.2萬名全職員工。該行表示,約半數“淨減少”的崗位將通過自然流失實現,即員工離職後不再補招。澳大利亞小鎮帕克斯正憑藉其在打破中國稀土控制權競爭中的突出表現贏得全球關注。礦業大亨羅伯特-弗裡德蘭德(Robert Friedland)是Sunrise Energy Metals的聯席主席兼最大股東。該公司計畫在雪梨以西350公里的帕克斯開採一座鈧礦,預計2028年投產。Sunrise上周籌集了3000萬美元,用於啟動礦山的前期建設。這是華盛頓與堪培拉在10月簽署擴大稀土供應協議後,澳大利亞最先落地的項目之一。韓國兩大石化企業樂天化學(Lotte Chemical)與HD現代化學(HD Hyundai Chemical)26日聯合發佈公告稱,向政府提出審查批准兩家公司石化業務整合方案的申請。這是今年8月包括該兩家公司在內的十家石化企業為業務重組簽約以來,業界拿出的首份具體重組方案。該重組方案擬將樂天化學位於大山產業園的石腦油裂解工廠業務分離,並將此併入HD現代化學,從而建構涵蓋NCC等石化產品生產的統一化營運體系。合併完成後,大山產業園區內的石化產品生產將實現一體化。一項試驗發現,諾和諾德(Novo Nordisk)公司的新型減肥藥可使糖尿病患者的體重顯著下降,並使血糖水平顯著改善,這對這家丹麥公司的藥物開發管線是一個積極訊號。這款新藥結合了司美格魯肽與胰淀素,前者是諾和諾德公司糖尿病與肥胖症爆款藥物諾和泰(Ozempic)與諾和盈(Wegovy)的活性成分,後者是一種能促進飽腹感的激素。嘉吉公司(Cargill)周三表示,該公司目前沒有關閉其美國牛肉加工廠的計畫,因為該行業正在努力應對牛群供應緊張的問題。由於連年乾旱以及飼養成本上升,牧場主將美國牛群數量減少到了幾十年來的最低水平,牛肉加工商一直面臨著壓力。緊張的庫存提高了肉類包裝商的成本,他們必須支付更高的價格才能買到牛,這也將牛肉價格推向了歷史新高。昂跑(On)憑藉形如瑞士奶酪的鞋底和簡約、具有未來科技感的美學設計,成為全球增長最快的跑鞋品牌之一。然而,為了跑贏關稅,它卻選擇按兵不動。面對高達20%的關稅,這家瑞士鞋履品牌既沒有趕在徵稅前囤積商品,也沒有與工廠合作夥伴協商分攤額外關稅,更沒有要求零售商幫助緩衝衝擊。這個瑞士運動鞋品牌不斷提價,但顧客似乎並不介意。本周四美股將因感恩節休市,周五則於美東時間下午1點提前收盤。財報資訊滴滴發佈2025年第三季度業績報告。第三季度營收585.9億元人民幣,上年同期為539.49億元;季度歸屬於公司股東淨利潤14.59億元,上年同期為9.29億元。第三季度調整後EBITDA利潤為16億元。理想汽車發佈2025年第三季度財報。季度總營收為274億元,同比下滑36.2%,環比下滑9.5%。汽車銷售額為259億元,上年同期的413億元下滑37.4%,較今年第二季度的289億元下滑10.4%。季度毛利率為16.3%,上年同期為21.5%,上季度為20.1%。季度淨虧損6.244億元,上年同期淨利潤28億元,上一季度淨利潤11億元。不按美國通用會計準則,調整後的淨虧損3.597億元,上年同期淨利潤39億元,上一季度淨利潤15億元。第三季度,汽車交付總量為93211輛,同比下滑39.0%。迪爾(Deere & Company)公佈截至2025年11月2日的第四財季和財年業績。第四財季總淨銷售額和營收123.94億美元,上年同期為111.43億美元。季度營業利潤13.51億美元,上年同期為14.5億美元。季度歸屬公司的淨利潤10.65億美元,上年同期為12.45億美元。財年總淨銷售額和營收456.84億美元,上財年為517.16億美元。財年營業利潤60.2億美元,上年為90.39美元。財年歸屬公司的淨利潤50.27億美元,上年為71億美元。 (全球企業動態)