#3nm
德銀:3nm產能告急,台積電大客戶被迫分流,三星、英特爾機會來了?
德銀表示,台積電3nm產能直至2027年已完全訂滿,迫使其將2026年資本支出指引大幅上調至520-560億美元。產能瓶頸導致蘋果、輝達等六大客戶被迫尋求三星和英特爾作為替代方案,台積電先進製程市場份額或微降至90%。該行仍將台積電目標價上調10%至2200新台幣。AI浪潮下晶片需求井噴,由於台積電產能直至2027年都已訂滿,蘋果、輝達等“六大客戶”被迫考慮將部分訂單轉向三星和英特爾。德意志銀行最新發佈的研報顯示,全球半導體代工巨頭台積電(TSMC)正面臨“幸福的煩惱”。由於3nm製程產能極度緊缺,且訂單已排滿整個2026年甚至延伸至2027年,台積電不得不大幅上調資本支出計畫。而這一產能瓶頸正在重塑市場格局,迫使原本依賴台積電的頂級客戶開始認真考慮三星(Samsung)和英特爾(Intel)作為替代方案。德意志銀行分析師Robert Sanders等在報告中指出,台積電公佈的2026年資本支出指引高達520億至560億美元,這一數字顯著高於該行預期的500億美元及市場共識的460億美元。分析師認為,這實際上是台積電承認其2025年的資本支出計畫在面對飆升的AI需求時“過於保守”。目前的局面已不再是簡單的CoWoS封裝產能溢出,而是核心的晶圓製造產能——尤其是3nm製程——出現了嚴重的供不應求。這種供需失衡正在產生直接的市場溢出效應。報告強調,儘管三星和英特爾在代工記錄上“毀譽參半(chequered record)”,但蘋果、輝達、AMD、博通、高通和聯發科這“六大客戶”目前別無選擇,只能尋求替代產能。受此影響,台積電在先進製程代工領域的市場份額預計將從95%下滑至90%。資本支出激增至560億美元,3nm產能“一票難求”台積電第四季度財報中最引人注目的數字莫過於其對2026年的資本支出指引。520億至560億美元的規模表明,公司正全力以赴應對產能危機。德意志銀行指出,考慮到台積電2026年全年的產能很可能已經完全被預訂,且訂單積壓已深入2027年,這一支出的激增並不令人意外。此前,面對AI需求的爆發,最初的瓶頸主要集中在CoWoS封裝環節,這導致部分訂單溢出至日月光(ASE)和安靠(Amkor)等廠商。然而,目前的情況更為嚴峻:需求遠遠超過了供應,尤其是3nm製程。報告資料顯示,儘管台積電計畫在2026年底將3nm產能提升至每月19萬片晶圓(190k wpm),但仍無法滿足客戶胃口。德意志銀行在報告中提到:“客戶想要更多產能是台積電高利用率下的常態,但達到這種程度卻是前所未有的。”六大客戶被迫“分流”,三星泰勒工廠或成首選產能的極度緊張正在迫使台積電採取更激進的策略。據報導,台積電正在推遲啟動新的3nm開發項目,轉而引導客戶將2027/28年量產的產品規劃更多地轉向2nm GAA製程。同時,台積電也在利用定價策略來“推動”客戶做出這一轉變,這一點從其強勁的2026年一季度指引中可見一斑。這種次優的局面迫使全球最大的六家晶片設計公司——蘋果、輝達、AMD、博通、高通和聯發科——不得不將目光投向競爭對手。德意志銀行分析認為,在這場產能爭奪戰中,三星位於泰勒(Taylor)的工廠(SF2P)可能比英特爾更受青睞。報告指出:“對於尋求替代供應的客戶來說,三星泰勒工廠更有可能成為第一停靠港。”具體而言,高通和AMD最有可能考慮三星;而據此前討論,蘋果和博通則據報導正在考慮英特爾。不過,分析師也補充道,英特爾雖然有14A製程的故事潛力,但“仍有大量工作要做”。AI驅動長期增長預期上調,毛利率看高至56%儘管短期面臨產能調配的挑戰,但AI帶來的長期增長紅利確定性極高。台積電確認,預計AI相關增長將以更快的速度提升,2024年至2029年的復合年增長率(CAGR)預期從此前的40%中段上調至50%中高段(mid-to-high-50s)。受此驅動,台積電將公司的長期整體增長預測上調至25%的復合年增長率,長期毛利率目標也隨之上調至56%。德意志銀行認為,考慮到AI發展的最新動態以及台積電的定價行動,這些數字的上調“並不令人意外”。關於海外產能擴張,報告提到台積電亞利桑那工廠目前處於低產量階段(一期4nm,月產能2萬片),預計今年年底二期將產生首筆3nm收入。儘管海外建廠會帶來2-4%的毛利率稀釋,且面臨人才、基礎設施和良率等挑戰,但市場重心目前仍聚焦於其核心的盈利能力。基於更高的晶圓定價帶來的盈利能力提升,德意志銀行將台積電(2330.TW)的目標價上調10%至2200新台幣。這一目標價相當於2027年預期每股收益(EPS)的20倍市盈率,與同行水平一致。分析師Robert Sanders表示,這一估值反映了台積電在2028年之前的穩固地位和強勁增長率。然而,報告也提示了潛在風險,包括地緣政治風險以及英特爾試圖將生產收回內部帶來的潛在阻力等。此外,如果AI相關支出突然放緩,或者CoWoS產能提升執行不力,也將構成風險。 (invest wallstreet)
傳英特爾18A效能不如台積電3nm
攸關英特爾(Intel )生死關鍵的18A製程,不僅傳出客戶只有自己而已,市場最新調查指出,英特爾自家新產品用采18A製程生產,結果跑分還跑輸上一代用台積電3奈米生產的產品,被業界認為「英特爾麻煩大了」,也印證台積電總裁魏哲家去年就早預言,台積電3奈米效能比英特爾18A好。消費者新聞與商業頻道(CNBC)上周五 (19 日) 報導,英特爾在亞利桑那州的新晶圓廠Fab52 已開始量產18A製程晶片,希望藉此追上台積電,但目前唯一的客戶就是英特爾自家產品,能否說服其他大廠下單代工,將關鍵英特爾這家晶片龍頭能否翻身。英特爾18A製程相近於台積電的2奈米製程,不僅傳出客戶只有自己而已,市場調查Techbang指出,英特爾新一代Panther Lake處理器(酷睿Ultra 300系列)最近測試動作頻頻,但最新的跑分結果可能會讓不少粉絲大失所望。 根據Geekbench流出的資料,這款代號酷睿Ultra 7 365的新晶片,在單核與多核效能上,竟然都輸給現有的Ultra 7 268V。測試資料顯示,Ultra 7 365的單核得分為2451、多核9714,前一代的Ultra 7 268V,平均跑分有2639與10318,顯示新晶片效能不增反減,縮水約6%到7%。 兩者都是4個效能核心加4個低功耗節能核心的配置,但Ultra 7 365目前的時脈最高只到4.7GHz,比起前代的5.0GHz矮一截。 正式版上市的測試結果是否如工程樣品跑分,則還待觀察。半導體業界指出,英特爾核心處理器代號Panther Lake(包含 Ultra 7 365),被英特爾視為「重返榮耀」之作,運算晶片(Compute Tile)由英特爾采最先進的18A 製程生產。 相較目前Ultra 200 系列核心產品Lunar Lake / Arrow Lake,運算晶片由台積電採用3奈米製程生產,因當時英特爾自家的20A 製程良率不如預期,為了搶市佔率,決定將核心運算晶圓外包給台積電。魏哲家去年年初就曾對外資法人表示,台積電的3奈米製程優於英特爾的18A製程,他自信地說,台積電3奈米性能、能耗和可靠度都勝一籌,不只好看、好名聲,還很實用,技術持續領先。 他並強調台積電與客戶的緊密合作,專注製造不與客戶競爭,唯有讓客戶成功,台積電才能成功。英特爾的18A工藝採用High-NA EUV與背部供電新技術。 業界認為,英特爾現在最重要的是18A製程,已經在內部晶圓廠跑了兩年了,即使前陣子延攬從台積電前資深副總羅唯仁也無濟於事,因整個製程的架構已確定,18A若良率起不來,英特爾後面的技術也不可能再發展了。 (大話晶片)
美國3奈米製程迎來台積電時刻!
台積電美國亞利桑那州Fab 21廠區今日宣佈,首批3nm製程裝置已提前兩個月開始搬入,比原定「2026年Q2裝機」時間表顯著提速。公司規劃2027年上半年實現量產,每月產能約3萬片12吋晶圓,屆時將為蘋果A20/A20 Pro、輝達下一代AI GPU「Rubin」以及AMD Zen 6c等提供美國本土製造的全球最尖端晶片。這也是台積電首次將量產級3nm(N3E)節點帶出台灣,被視為美國《晶片與科學法案》落地後最具指標意義的里程碑。根據供應鏈透露,台積電此次共向ASML、應用材料、東京電子等發出60台3nm級裝置訂單,包括4台0.33 NA EUV、2台新一代High-NA EUV原型機,以及用於GAA電晶體環繞柵刻蝕的原子層沉積系統,裝置總價值逾120億美元。為搶時間,美方特許台積電裝置走“綠色通關”,從加州長灘港卸貨後全程冷鏈陸運,48小時內運抵鳳凰城無塵室,較常規物流周期縮短一周。Fab 21第一期原規劃只建4nm,2024年台積電董事會決定“直接上3nm”,追加投資80億美元,總資本支出提升至280億美元。公司官方表示,良率目標與台灣南科Fab 18B同步,2027年Q1風險試產時即要求晶片級良率≥70%,Q2正式量產爬坡至90%以上。蘋果已鎖定首批1.8萬片月產能,用於2027年秋季發表的iPhone 19系列A20應用處理器;輝達亦預留5000片產能,計畫將Rubin GPU的HBM3E封裝放在同一廠區完成,縮短供應鏈至兩周內交付。對於美國半導體生態而言,3nm本土流片意味著「最先進封裝」隨之落地。台積電同步在亞利桑拉州建設SoIC-P與CoWoS-L產線,預計2027年Q3月產5000片3D堆疊封裝,對應AI GPU算力卡約50萬顆。美國商務部已承諾提供45億美元聯邦補貼,用於分攤裝置折舊與人才培訓;亞利桑那州政府再加碼3.5億美元基礎建設補貼,並承諾在鳳凰城技術學院開設“3nm技師專班”,四年內培養1200名高級操作員。中國大陸晶圓廠亦緊盯台積電美國節點節奏。中芯國際南方廠內部技術高層向記者分析,3nm GAA電晶體結構對EDA、IP、材料要求極高,「台積電把整條生態搬到美國,等於把3nm技術窗口再鎖三年」。國內目前量產節點停留在7nm,若要追趕3nm,不僅需突破GAA環繞柵與High-NA EUV雙重門檻,還要自建3D封裝與矽鍺外延供應鏈,技術差距可能從兩年擴大至三年半。不過,台積電赴美也面臨成本與人才挑戰。美方無塵室人力成本比台灣高55%,加上夜班限制與工會法規,Fab 21量產初期單位成本估計比台灣高出30%。台積電為此匯入「5D自動化」系統:利用AI視覺+機器人搬運,把潔淨室人力密度降至台灣廠的60%,目標2028年將成本差距縮小到10%以內。隨著裝置搬入序幕拉開,美國白宮國家經濟委員會發表聲明稱,這是“美國半導體史上最昂貴、最先進的一台發動機”,將直接創造6000個高薪崗位,並撬動上下游千億美元投資。對於全球晶片格局而言,當3nm晶圓可以在亞利桑那沙漠​​下線,台積電「台灣-美國-日本」三大基地連線正式成型,先進製程「去美國化」時代宣告終結,而圍繞3nm及以下節點的產能、裝置與材料競爭,也將進入多極混戰的新賽段。 (晶片產業)
突破3nm瓶頸:半導體材料的新戰場在那?
當各類AI產品掀起新一輪算力競賽,當新能源汽車的智能座艙流暢響應每個指令,背後支撐這些科技奇蹟的,正是半導體材料的持續突破。從矽基到化合物,從三維到二維,材料的每一次迭代都在重塑晶片產業的遊戲規則——新材料如何改寫產業版圖?2025 年全球半導體材料市場迎來結構性增長,規模預計達 780 億美元,同比增長 8.5%,其中中國市場以 1920 億元人民幣(約 270 億美元)規模佔據全球 34.6%份額,首次超越台灣成為全球第一大市場。這一格局重構源於兩大驅動力:一是中國大陸 300mm 晶圓廠產能達每月 400 萬片(8 英吋當量),佔全球 34.4%;二是 AI 晶片需求爆發推動先進製程材料採購量激增,7nm 及以下製程材料市場規模同比增長 22%,佔整體市場的 42%。產業鏈呈現"三極分化"特徵:上游原材料領域,日本信越化學(矽烷氣體全球市佔率 45%)、美國查爾斯河實驗室(超高純試劑市佔率 38%)仍壟斷核心環節;中游材料製造環節,中國在矽片(滬矽產業全球市佔率 5%)、電子特氣(華特氣體全球市佔率 7%)等領域實現突破;下游應用端,台積電 CoWoS 封裝產能擴張帶動先進封裝材料需求增長 34%,國內長電科技的 SiP 封裝材料採購量同比提升 52%。2025 年成為中國半導體材料國產替代的關鍵轉折點,技術創新呈現三大方向:先進製程適配方面,中微公司開發的原子層沉積(ALD)裝置配套材料,滿足 3nm 製程 High-NA 光刻膠需求;綠色製造領域,金宏氣體推出的電子級氨氣回收系統,使晶圓廠氣體利用率提升至 95%;材料復合化趨勢顯著,安集科技開發的奈米結構 CMP 拋光液,將 3D NAND 晶圓的拋光效率提升40%。(EDA365電子論壇)
AWS發佈3nm晶片: 144 GB HBM3e,4.9 TB/s頻寬
亞馬遜網路服務 (AWS) 預覽其下一代 Trainium AI 加速器 Trainium3 至今已近一年。今天,這款晶片正式面世。在 AWS re:Invent 大會上,該公司宣佈 Amazon EC2 Trn3 UltraServer 正式上線,這是首批基於這款新晶片建構的系統,並作為其彈性計算雲 (EC2) 服務的一部分提供。Trainium3 由台積電採用 3 奈米工藝製造,單晶片可提供 2.52 PFLOPs 的 FP8 計算能力。該器件整合了 144 GB 的 HBM3e 視訊記憶體,提供 4.9 TB/s 的記憶體頻寬。AWS 向HPCwire表示,這些性能提升源於架構的改進,旨在平衡現代 AI 工作負載的計算、記憶體和資料傳輸。該公司表示,Trainium3 新增了對 FP32、BF16、MXFP8 和 MXFP4 的支援,並增強了對結構化稀疏性、微擴展、隨機舍入和集體通訊引擎的硬體支援。該公司稱,這些新增功能旨在使晶片更好地適應 LLM、混合專家架構和多模態系統的訓練模式。這些改進概述了晶片層面的新特性,但AWS表示,真正的規模優勢在於Trainium3的部署方式。該公司指出,許多最大的性能和效率提升都體現在UltraServer層面,因為新的架構、記憶體拓撲和整合引擎在數百個晶片上運行。在系統層面,一個完全配置的Trainium3 UltraServer連接144個晶片,聚合了362 FP8 PFLOPs的計算能力、20.7 TB的封裝內HBM3e記憶體以及706 TB/s的記憶體頻寬。據AWS稱,與上一代基於Trainium2的架構相比,該系統可提供高達4.4倍的計算性能提升、4倍的能效提升以及近4倍的記憶體頻寬提升。這些資料基於AWS在其發佈博文中分享的內部測量結果。AWS 向HPCwire透露,Trainium3 引入了 NeuronSwitch-v1,這是一種全新的全連接架構,可在單個 UltraServer 中連接多達 144 個晶片,並將晶片間頻寬提升至 Trn2 UltraServer 的兩倍。該公司還重點介紹了其網路堆疊的改進:升級後的 Neuron Fabric 將晶片間通訊延遲降低至“略低於 10 微秒”,而 EC2 UltraClusters 3.0 則提供多拍位元網路,以支援跨越“數十萬個 Trainium 晶片”的大型分佈式訓練作業。AWS 表示,UltraServer 層面更高的記憶體容量、更快的架構以及改進的協同引擎相結合,旨在減少大型 Transformer 和 MoE 模型(尤其是具有更長上下文窗口或多模態元件的模型)中的資料傳輸瓶頸。在對 OpenAI 的開源權重模型 GPT-OSS 進行的內部測試中,AWS 報告稱,與上一代 UltraServer 相比,每個晶片的吞吐量提高了 3 倍,推理響應時間提高了 4 倍,這表明該公司正在利用系統級的性能提升,使 Trainium3 能夠勝任數兆參數的訓練和大規模推理任務。AWS 表示,客戶已經開始使用 Trainium3 來降低訓練成本,Anthropic、Metagenomi和 Neto.ai等公司報告稱,與替代方案相比,成本最多可降低 50%。AWS 還指出,Amazon Bedrock 已經在 Trainium3 上運行生產工作負載,這表明該晶片已準備好進行企業級部署。早期採用者也在積極探索新的應用領域:據 AWS 稱,人工智慧視訊初創公司 Decart 正在使用 Trainium3 進行即時生成視訊,並以 GPU 一半的成本實現了 4 倍的幀生成速度。AWS 已著手研發下一代定製晶片。該公司表示,Trainium4 旨在顯著提升計算、記憶體和互連性能,包括至少 6 倍的 FP4 吞吐量、3 倍的 FP8 性能以及 4 倍的記憶體頻寬。AWS 將 FP8 性能的提升描述為“基礎性飛躍”,這將使企業能夠以至少三倍的速度訓練模型或處理三倍數量的推理請求,並且預計通過持續的軟體和工作負載最佳化,性能還將進一步提升。為了支援更大規模的模型和更高的節點級擴展性,AWS 表示 Trainium4 還將整合輝達的 NVLink Fusion 互連技術。其目標是使 Trainium4、Graviton 和 Elastic Fabric Adapter 能夠在通用的基於 MGX 的機架中互操作,從而建立一個靈活的機架級設計,既可以託管 GPU 伺服器,也可以託管 Trainium 系統。隨著 Trainium3 投入生產,Trainium4 也即將面世,AWS 似乎正在為未來做好準備。未來,人工智慧訓練的真正瓶頸將不再在於加速器本身,而在於連接它們的網路和系統設計。AWS 能否有效執行這一路線圖,將決定其在建構前沿規模人工智慧基礎設施的持續競爭中的地位。NVIDIA NVLink Fusion 被選中用於未來的 AWS Trainium4 部署今天,NVIDIA 和 AWS 宣佈建立多代合作夥伴關係,將 NVLink Fusion 晶片整合到未來的 AWS AI 機架和晶片設計中。AWS 在 2015 年收購 Annapurna Labs 後,開始自主設計 Graviton CPU、Nitro 網路卡和 AI 加速器。因此,AWS 的技術堆疊並非 NVIDIA 的技術堆疊,儘管它也採購了大量 NVIDIA GPU。未來,AWS 計畫將 NVIDIA 的技術整合到其定製的晶片棧中,這意義重大。NVLink Fusion 背後的理念是,NVIDIA 可以銷售一個 IP 模組,使其他晶片能夠使用 NVIDIA NVLink 進行通訊。NVIDIA宣佈了一系列合作夥伴,而Arm等其他公司最近也加入了進來。從新聞稿中我們可以看出,“AWS 正在設計 Trainium4,使其能夠與 NVLink 6 和 NVIDIA MGX 機架架構整合,這是 NVIDIA 和 AWS 在 NVLink Fusion 領域開展的多代合作的首個成果。”這對兩家公司來說都是一筆划算的交易。AWS 可以將與 NVIDIA NVL72 機架類似的機架架構用於其定製晶片項目。對輝達而言,這項技術正被融入到一項超大規模的定製晶片項目中。它有機會將NVLink Fusion Chiplet和NVLink交換機銷售到那些非輝達的CPU/GPU/NIC晶片機架中。或許最有趣的是,AWS在推進Trainium未來版本開發的同時,決定採用NVIDIA NVLink技術,而不是自行建構通訊協議、交換機以及機架基礎設施。此外,值得注意的是,AWS採用NVLink意味著它不會在其機架內擴展計算鏈路中使用Broadcom Tomahawk Ultra或其他基於乙太網路的交換機晶片,因為將兩種技術用於同一用途顯得不合常理。 (半導體行業觀察)
AI晶片大戰升級!亞馬遜推出首款3nmAI晶片Trainium 3,挑戰輝達、Google
年底,AI晶片領域的競爭愈發激烈。繼11月,Google發佈自研TPU,引發市場廣泛關注,輝達隨即入股新思科技加碼推廣自身GPU後,亞馬遜剛發佈的新產品,也很有可能成為攪動市場的另一極。美國時間12月2日,在拉斯維加斯舉辦的亞馬遜雲科技re:Invent全球大會上,亞馬遜正式推出了新一代自研AI晶片Trainium 3。這是亞馬遜首款3nm製程的AI晶片,由台積電代工生產。圖片來源:unsplash根據亞馬遜AWS首席執行官馬特·加曼(Matt Garman)的介紹,Trainium 3的計算能力較之Trainium 2大幅提升,是在當前的人工智慧浪潮中,專為滿足下一代生成式AI工作負載的高性能需求而設計打造的,能夠幫助客戶更快地建立更大的模型,並在部署模型時提供卓越的效能。AWS方面同時拿出了整合144顆新一代晶片的Trainium3 UltraServer伺服器。該公司給出的資料顯示,新伺服器的計算能力是上一代產品的4.4倍,記憶體頻寬是上一代產品的4倍,能夠將能效提升40%,同時大幅提高了產品部署能力上限,通過伺服器之間的互聯互通,最多能部署多達百萬顆Trainium 3晶片,將此前的天花板提高了10倍。從AWS披露的資料來看,Trainium 3的產品性能是更新換代等級的存在,但市場更關注的,還是其與佔據絕對主導地位的輝達和正在崛起的Google之間的比較。不過,AWS方面拒絕直接就其新一代晶片的性能與輝達、Google進行對比,沒有提供太多相關資訊。Barron's等提到,從記憶體來看,每顆Trainium 3整合了144GB高頻寬記憶體,而Google最新TPU是192GB,輝達最新的Blackwell GB30更是高達288GB,同時,性能更強的輝達超級新品Rubin也即將走向市場。從這方面來看,目前幾大巨頭之間的晶片在性能上仍有明顯差距。科技媒體IMPLICATOR.ai撰文指出,與輝達的GPU不同,亞馬遜的Trainium晶片是專為在AWS雲服務中訓練和運行大模型而設計的定製化AI晶片,會針對AWS的雲基礎設施和Bedrock平台進行針對性最佳化。AWS也在官方新聞中,著重強調了專用晶片的“性價比優勢”,稱與同等GPU系統相比,Trainium在相關場景中可以將訓練和推理成本降低50%。實際上,Google的TPU是專為加速機器學習和深度學習任務而設計的。輝達在這些競爭者冒頭時曾發聲表示,公司的產品領先業界一代,是唯一能夠運行所有AI模型並應用於計算場景的平台。與專為特定AI框架或功能設計的產品相比,輝達晶片提供了更高的性能、多功能性和可互換性。就在亞馬遜發佈新品的同一時間,輝達首席財務官科萊特·克雷斯(Colette Kress)在瑞銀全球技術與AI大會上表示,其他晶片競品絕無可能動搖輝達的地位。她還表示,輝達的護城河不只晶片,而是標準和生態,所有模型都運行在輝達的平台上,市場地位非常穩固。不過,相較於競爭關係,亞馬遜與輝達的合作同樣值得關注。大會期間,AWS與輝達共同宣佈,前者將在下一代晶片Trainium 4中使用後者的NVLink Fusion技術。該技術能夠實現不同類型晶片之間的高速連接,以及不同伺服器之間的快速通訊。晶片領域的頭部企業英特爾、高通都是使用者。通過引入該技術,AWS得以建構規模更大、適用性更強的AI伺服器,進一步提高互聯互通能力,再次推高部署能力的上限,幫助客戶更好地訓練大模型。IMPLICATOR.ai的文章分析稱,相較於“打不過就加入”,AWS引入輝達技術更類似一種引流策略,在無法快速實現晶片替代的情況下,這種合作能夠幫助那些依賴輝達工作負載的企業更輕鬆地逐步遷移到Trainium基礎設施中。輝達CEO黃仁勳則表示,輝達和AWS將攜手打造AI產業革命的計算架構,加速世界邁向智能化的道路。令人好奇的是,誰成為亞馬遜新AI晶片第一批擁躉?亞馬遜強調,新一代的晶片和伺服器都是為了讓雲服務客戶能以更低成本享受更好的服務,訓練出質量更高的大模型來實現自身的AI雄心。事實上,除了自用外,Trainium 3目前的市場前景仍然成疑。以往,Trainium的主要客戶是Anthropic、理光(Ricoh)等公司,使用者基礎本就不多。其中,Anthropic一直是最大客戶。實際上,AWS方面此前就曾表示,計畫在今年底之前向Anthropic提供100萬個Trainium晶片。摩根大通分析師道格・安穆斯(Doug Anmuth)稱,考慮到亞馬遜對Anthropic的投資及兩者歷來的緊密關係,Trainium最新晶片預計仍會首先供應這家打造出了Claude的公司。未來,只要電力等供應充足,AWS可以在新的伺服器上複製為Anthropic打造的架構,吸引其他大型客戶,讓自己的晶片被更廣泛地使用。不過,就算是Anthropic,這家公司對晶片也有多種選擇。除了輝達的主流產品,該公司去年還曾表示與Google達成協議,將採購後者100萬顆TPU晶片。另外,在今年的re:Invent大會中,AWS還發佈了包括推理模型、語音模型、純文字模型在內的Nova 2系列模型,並推出了“開放式訓練”服務Nova Forge,允許使用者在訓練的各階段注入自己的資料,支援更多行業為特定知識定製大模型,同時通過Nova Act進軍代理服務市場,幫助使用者建構自動化網頁操作智能體。從基礎設施、自研晶片,再到大模型、代理服務,這家雲服務巨頭已癒發凸顯出全面押注AI垂直一體化的趨勢。而資本市場還無法明確判斷該公司相關戰略的前景。12月2日亞馬遜股價收盤微漲0.23%,今年以來漲幅為6.85%,在“美股科技七巨頭”中與特斯拉相近,低於其他公司。 (鈦媒體AGI)
馬斯克 3nm AI 晶片即將流片,AI6 正在路上!
近日,特斯拉首席執行官埃隆·馬斯克在 X 平台上表示,特斯拉 AI5 晶片的設計已經接近最終流片階段,預計將在 2027 年年中進入量產。同時,特斯拉也已經啟動下一代 AI6 晶片的研發。他給出的目標仍然激進,每 12 個月推出一款新的人工智慧晶片,並按節奏推進量產。馬斯克甚至稱,特斯拉未來生產的 AI 晶片數量將超過其他所有 AI 晶片廠商的總和。馬斯克強調,特斯拉多年來一直擁有自己的頂尖 AI 晶片和主機板設計團隊,這支團隊已經完成了數百萬顆 AI 晶片的設計,並部署在車輛與資料中心中。他認為,正是這些自研晶片能力,讓特斯拉能在現實世界 AI 領域持續領先。圖源:馬斯克X帳號截圖AI5 接近流片意味著設計已基本成型,是正式進入生產前的最後一步。按照馬斯克此前的說法,AI5 在部分任務上的速度比 AI4 提升可達 40 倍。該晶片採用台積電 3nm 工藝,目標算力 2000~2500 TOPS,大約是現款 HW4 的五倍。依託低功耗設計,AI5 將重點服務於 Optimus 人形機器人,使其能在複雜環境中更高效運行。在資料中心側,AI5 將為特斯拉的 FSD 訓練和推理提供支撐,並與 Dojo 構成完整的訓練生態。AI5 的定位非常明確,承擔特斯拉下一階段自動駕駛的核心算力任務,在能效比、神經網路處理和資料吞吐上進一步加強,繼續壓縮模型推理和決策的延遲,讓車輛在複雜交通場景中能夠更快做出判斷。圖源:特斯拉與此同時,特斯拉已經著手研發 AI6,並計畫由三星代工。AI6 的設計重點預計將進一步圍繞能效、平行處理能力以及散熱最佳化展開。馬斯克透露,AI6 的性能將比 AI5 再提升兩倍。不過,高速迭代也帶來了現實挑戰。如此頻繁的硬體升級難免會讓現有車主擔心車輛過快落伍。早在 2016 年,特斯拉就對外宣稱後續車輛都已具備未來實現自動駕駛的全部硬體,但在 2023 年,馬斯克又在財報會議上表示,由於改裝成本過高,特斯拉將不再為舊款晶片提供升級服務。這使不少早期車主頗有意見。圖源:彭博社不過,對潛在購車者而言,特斯拉的晶片迭代意味著車輛在未來幾年將持續通過OTA更新與硬體迭代保持競爭力。晶片只是其中的一環,但它正成為智能駕駛體系穩定擴展的重要支點。 (晶片大師)
10年了!三星旗艦自研手機晶片回歸中國,加入高通聯發科小米3nm芯大戰
又一款3nm自研手機晶片來了!落地摺疊屏機皇。智東西7月10日報導,就在昨晚,三星在全球發佈會上正式發佈了Galaxy Z Fold7和Galaxy Z Flip7兩款摺疊屏新機,後者搭載了三星首顆3nm自研旗艦手機晶片Exynos 2500。▲Galaxy Z Flip7(左)和▲Galaxy Z Fold7(右)相比手機在外觀設計、影像拍照和AI體驗上的升級,手機圈討論熱度最高的點,要屬三星Exynos 2500在剛剛發佈的摺疊屏Galaxy Z Flip7中落地,並且國行版本的機型也大機率將搭載這顆晶片(如果官網資訊不變)。要知道,上次三星在國行版旗艦機中使用自研手機晶片,已經是大約10年前了。2015年,三星旗艦機Galaxy S6搭載了其自研的Exynos 7420。不過期間三星在國行版中端機,比如A系列中一直有使用自研Exynos系列晶片。此次焦點三星Exynos 2500實則在去年就已經官宣,但遲遲未能落地,今年年初發佈的新旗艦Galaxy S25系列也全部採用了高通晶片。有業內爆料稱,三星3nm 環繞柵極(GAA)工藝良率過低是Exynos 2500遲遲未能大規模量產的主要原因之一。在高通、聯發科、小米等廠商的旗艦手機晶片製程工藝都已經來到台積電第二代3nm後,三星的壓力是不言而喻的,此次Exynos 2500在摺疊屏新機中全版本落地,無疑對三星手機業務和三星半導體業務都是一個關鍵節點。售價方面,Galaxy Z Fold7國行預售起步價為13999元,Galaxy Z Flip7國行預售起步價為7999元。▲Galaxy Z Fold7▲Galaxy Z Flip701.最高主頻3.3GHz,CPU性能跑分曝光AI算力59 TOPS這次根據三星官網參數頁資訊,三星Galaxy Z Flip7小摺疊屏會搭載Exynos 2500,並且沒有標明會有其他版本。從官方參數上來看,這顆晶片與小米玄戒O1同樣是十核心四叢集架構,超大核的最高頻率為3.3GHz,相比小米的3.9GHz,有比較大的差異,其餘三組CPU核的最高頻率分別為2.74GHz、2.36GHz和1.8GHz。▲三星Exynos 2500▲小米玄戒O1工藝方面,官網資訊中提到,Exynos 2500採用3nm GAA工藝技術製造,通過扇出型晶圓級封裝(FOWLP)提供更好的電源效率和增強的散熱性能,同時大幅度降低晶片厚度。此外,三星通過上述對CPU核心結構的修改和模擬GNSS介面的實施,實現了進一步的最佳化。就在兩周前,Geekbench 6網站上已經流出了Exynos 2500的相關跑分,其單單核分數在2303-2356分之間,多核則在8062-8076分之間。相較自家旗艦Galaxy S25 Ultra搭載的驍龍8 Elite,單核跑分差距約為19%,多核跑分差距約為16%。▲Geekbench 6官網跑分從三星官網的Exynos 2500晶片資訊來看,Exynos 2500的NPU的AI算力達到了59 TOPS,據稱端側AI性能比上代Exynos 2400提升了39%。Exynos 2500的AI-ISP支援3.2億像素解析度攝影機,支援60fps的8K視訊錄製。GPU方面,Exynos 2500搭載了第四代Xclipse 950 GPU,其基於AMD的RDNA 3架構,支援硬體加速光線追蹤。02.AI+摺疊屏能否實現不一樣的AI手機體驗?回到手機本身,今年上半年OPPO、vivo、小米、榮耀、三星接連發佈摺疊屏旗艦,據外媒爆料,蘋果大機率將於明年發佈首款摺疊屏,隨著蘋果的入局,摺疊屏戰事無疑將來到新的階段,市場格局或將重塑。三星是Android陣營中最早做摺疊屏的廠商之一,從2018年至今,7年多時間裡,三星摺疊屏也迭代至第7代,在摺疊屏硬體形態已經較為成熟、軟體互動也 難出新意的今天,三星能否給行業和消費者帶來一些驚喜?AI是否會成為影響摺疊屏這一形態產品的最大變數?從發佈會來看,輕薄、拍照和AI體驗是此次三星摺疊屏重點升級的三個方面。但在這三個方面,三星基本上都是在原有設計和思路的基礎上進行最佳化迭代,並沒有比較顛覆性的設計改變或功能創新。輕薄方面的細節升級、外觀設計、拍照效果和實際上手體驗智東西已經發佈相關文章(全球首發體驗!三星摺疊屏Galaxy Z Fold7上手:太輕薄了,AI圈搜萬物)。在大家最關心的AI方面,摺疊屏能帶來什麼不一樣的AI體驗嗎?目前來看,摺疊屏的AI體驗與直屏旗艦並沒有本質區別,基本上只有AI智能分屏這一功能是摺疊屏獨佔的。不過值得一提的是,在AI圈搜方面,大屏可以讓AI在呈現搜尋結果時不遮擋我們當前正在操作的內容。比如玩遊戲時,可以隨時圈中BOSS搜尋視訊攻略,而遊戲不會被打斷,也不用切換應用。AI方面,三星此次重點強調了多模態AI的重要性,也提及他們要將智能體和多模態能力整合到手機裡,並進一步提升個性化和隱私安全。從AI功能上來看,AI即圈即搜、AI識屏識物、AI總結會議紀要、AI改寫重寫文案、AI生成各類風格的圖像、AI即時翻譯這些AI手機已經迭代多時的基本功能已經成為標配。在當下大火的主動性AI方面,三星的AI可以針對使用者的旅行計畫給出一些出行和遊玩的建議。小摺疊屏Galaxy Z Flip7在AI體驗上有一個相對獨特的功能,使用者可以把手機摺疊後放置在桌面上,通過後置攝影機進行自拍,詢問AI穿搭建議。總體來說,三星摺疊屏上的AI體驗與直屏旗艦基本一致,主要是基於已發佈的功能進行迭代,並沒有重磅新功能首次亮相。03.結語:旗艦晶片落地摺疊屏三星軟硬協同能否帶來新驚喜?三星旗艦自研晶片Exynos 2500的全版本應用,客觀來說體現了三星對這款產品的自信,在競爭激烈的手機市場,對於蘋果和三星這樣的全球手機巨頭來說,手機晶片“不出錯”的重要性是不言而喻的。Exynos 2500雖然從CPU的性能上來說仍然與高通、聯發科旗艦晶片存在一定差距,但在AI、影像、通訊、連接等方面幾乎都已經看齊。面對未來的AI手機之戰,尤其是端側AI的快速發展,底層軟硬協同會給AI應用體驗帶來獨特優勢,三星能否借此在AI手機賽道實現新的突破?我們將持續關注。 (智東西)