#GPU
老黃秘密武器曝光:AI一夜設計晶片,頂人類頂級工程師10個月!
8人團隊做10個月,AI只需一夜!輝達祭出「造芯」神技:晶片設計效率狂飆百倍,非人類直覺的設計方案驚呆工程師。矽基生命開始自進化,人類正退居二線?進來看黃仁勳的秘密武器。就在今天,這條消息全網刷屏了。輝達用AI設計GPU,原本需要8名資深工程師10個月才能完成的任務,一夜就完成了!在剛剛過去的輝達GTC大會上,首席科學家Bill Dally與Google首席科學家Jeff Dean的一場巔峰對話,揭露了令人震驚的這個事實。現在,這個Youtube演講已經有上萬人觀看,受到網友們的盛讚。在半導體行業的歷史長河中,摩爾定律曾是不可踰越的真理,但隨著物理極限的逼近,研發一款旗艦GPU的複雜程度已呈指數級增長。但現在,輝達的AI造芯神技,幾乎讓人類工程師徹底退居二線了?從「80個人月」到「一塊GPU的一夜」在傳統晶片設計流程中,標準單元庫(Standard Cell Library)的遷移是一項極度枯燥且耗時的重體力活。每當台積電或三星推出新的半導體工藝(如從5nm跨越到3nm),輝達必須將其包含約2500至3000個單元的基礎庫重新適配新工藝。Bill Dally透露,過去這項任務需要一個由8名資深工程師組成的團隊,連續奮鬥10個月才能完成,總計耗費80個人月的人力成本。但在AI介入後,這一切被徹底顛覆了!現在,輝達開發了一款基於強化學習的工具——NB-Cell。只需將需求輸入系統,一塊GPU在一夜之間即可完成全部遷移工作。在這個過程中,NB-Cell通過不斷的試錯和自我最佳化,在極短時間內探索數以億計的設計排列組合。令人震驚的是,AI生成的單元在尺寸(Area)、功耗(Power)和延遲(Delay)等核心指標上,不僅達到了人類水平,甚至在某些案例中優於人類的手工設計。這種「隔夜交付」的能力,意味著輝達可以比競爭對手更早地跑通新工藝,從而在硬體競賽中始終保持身位領先。AI在晶片設計中的具體應用層次邏輯重塑:Prefix RL與「非人類直覺」的佈局如果說NB-Cell解決的是重複性勞動,那麼Prefix RL則展示了AI在複雜邏輯設計上的創造力。在晶片的算術邏輯單元(ALU)中,進位前瞻鏈(Carry Lookahead Chain)的放置是一個研究了幾十年的經典難題。人類工程師憑藉經驗和直覺進行佈局,往往會達到一個性能瓶頸。但Prefix RL系統給出了一份完全不同的答案。Dally形容,AI生成的佈局是「人類永遠無法想到的怪異設計」。這些設計違背了傳統電子工程的審美,但在性能表現上,卻比人類最優設計提升了約20%到30%。這標誌著一個轉折點:AI不再僅僅是人類的助手,它正在突破人類認知的邊界,去尋找那些隱藏在數百萬維空間中的「最優解」。矽基導師Chip Nemo,讓初級工程師「原地升級」在輝達內部,人力資源的錯配曾是一個很大的隱痛:資深設計師往往需要花費大量時間指導新人,解釋某個特定硬體模組(RTL)是如何工作的。為了釋放核心生產力,輝達開發了內部大語言模型——Chip Nemo和Bug Nemo。不同於市面上的通用LLM,這些模型基於輝達數十年積累的專有架構文件、RTL程式碼和硬體規格進行微調。經過私有化訓練,它們是「最懂輝達GPU」的專家。初級工程師遇到複雜的模組設計不再需要去打擾忙碌的高級工程師,而是直接詢問Chip Nemo。它能像一位極具耐心的導師,條分縷析地解釋GPU的工作原理。Bug Nemo則負責彙總錯誤報告,自動將Bug分配給最合適的工程師或模組,極大地縮短了晶片驗證這一「長跑階段」的時間。AI真的能完全自主「造芯」嗎?儘管效率提升了百倍,但Bill Dally在對話中依然保持了極其清醒的克制。他明確指出,完全端到端的自動化晶片設計(即只需說一句「給我設計一個新GPU」,AI就吐出完整圖紙)距離實現還有「很長的路要走」。目前,AI扮演的角色更像是「增強設計(Augmented Design)」,而非自主造芯。其中有三大關鍵限制:高層級架構決策仍依賴人類專家。創造性電路設計和複雜邏輯結構仍需人工主導。設計驗證仍是整個流程中最長的「長桿」,AI只能輔助加速,無法完全閉環也就是說,框架設定的部分,比如頂層的邏輯架構、跨模組的協調以及關鍵的決策,依然牢牢掌握在人類手中。另外,雖然AI可以加速驗證,但最終的模擬模擬和實際實驗依然必不可少,以確保晶片在物理世界中萬無一失。輝達的實踐表明,AI並非淘汰工程師,而是重構工程師的工作方式。初級工程師需要通過Chip Nemo自主學習複雜模組的工作原理,減少對資深工程師的打斷。資深工程師能從重複性任務中解放,專注於更高價值的創新和決策。在整體流程上,AI負責大規模搜尋、最佳化、驗證,人類負責目標設定、約束定義、創意引導。只是一種「人類設定框架 + AI極速執行」的協同模式。而Dally構想的未來,是一個「多智能體(Multi-agent)」模型,不同的專業AI系統處理不同的設計環節,就像現在的各職能團隊一樣協作。長期目標仍是端到端自動化設計,但需要克服驗證、介面協商、動態調整等難題。目前的進展已經讓輝達能夠 更快地迭代下一代硬體,成為維持摩爾定律的重要支撐。人類工程師,還不能被替代當8名工程師10個月的工作被一塊GPU的一夜取代時,我們不得不直面一個殘酷的現實:平庸的體力型工程勞動正在迅速貶值。輝達正在構築一道由AI驅動的技術壁壘。當競爭對手還在通過增加人力來追趕進度時,輝達已經進入了「AI設計AI,AI最佳化AI」的自循環體系。這種效率上的降維打擊,正是其能夠一年一更旗艦顯示卡的核心密碼。對於晶片工程師而言,這既是危機也是機遇。人類正從繁瑣的布線、搬運單元中解脫出來,被迫向更高層級的架構思考、更複雜的創造性決策進化。在矽基造芯的新紀元。在這裡,計算不再僅僅是晶片的目的,計算已成為晶片誕生的源頭。 (新智元)
處理器價格持續暴漲原因找到了!Intel:CPU和GPU需求量將達1:1
生成式AI的爆發,不僅帶火了GPU市場,更讓CPU重回半導體產業的核心戰場。近期全球CPU市場供需嚴重失衡,終端價格持續走高,核心原因正是代理式AI帶來的CPU需求結構性暴漲。Intel日前披露,AI正快速從訓練走向推理與代理式(Agentic AI)應用。此前AI訓練階段,資料中心GPU與CPU的用量配比約為8:1。如今隨著代理式AI興起,這一比例已降至4:1,未來甚至可能達到1:1甚至反轉。CPU在資料調度、記憶體管理與系統協作上的核心價值大幅提升,伺服器CPU市場迎來強勁增長。Intel經營層直言,當前CPU需求遠大於供給,產能不足已讓公司流失數十億美元的營收機會。為鎖定高價值賽道,Intel將有限產能優先供給高價的至強伺服器處理器與高端PC產品。中低端消費級CPU、Chromebook平台CPU供應被大幅壓縮。其中PC組裝市場,Intel市佔率從巔峰時期的近9成,下滑至與AMD平分秋色。Chromebook平台CPU交期甚至拉長至1年,2026年整體出貨量預計因缺貨下滑至1800萬台。供需缺口持續擴大,直接推動CPU價格上行。供應鏈資訊顯示,Intel自2025年底至今已兩度上調CPU價格,2025年12月首輪調漲約10%,2026年3月針對部分型號再漲約10%,高端產品漲幅更高。AMD也同步跟進漲價策略,同時快速搶佔市場缺口,其伺服器CPU市佔率已逼近5成。深耕Chromebook平台多年的聯發科,成為本輪缺貨潮的大贏家。2026年其Chromebook處理器出貨量預計同比增長超40%,主力型號MK8189出貨量將達700萬顆,幾乎追平Intel同等級產品。目前Intel正通過18A製程良率提升、上調資本支出擴產緩解壓力,2026年二季度營收有望創下6年來首次雙位數增長,但行業短期供需失衡與價格高企的局面難有根本改變。另據DigiTimes報導,在代理式AI需求激增的推動下,CPU供需缺口持續擴大,導致Intel產能陷入罕見的供不應求盛況。在這種情況下,AMD和聯發科都在趁機搶佔市場,Intel、AMD和聯發科三大晶片廠商均在加緊擴產,但短期內價格漲勢和供貨緊張局面難以緩解。Intel高管在財報會議上直言,GPU與CPU的需求比例已從8:1來到4:1,並可能進一步走向1:1。Intel已將有限產能優先供給高利潤的至強伺服器處理器,供應鏈消息稱,至強6系列需求創歷史新高,Intel甚至動用回收晶圓來維持出貨。AMD也在借勢快速擴大市場份額,伺服器CPU市佔率有望很快突破50%,基於Zen 6架構、採用台積電N2工藝的下一代EPYC Venice處理器將於今年出貨。在主流市場,Intel將重心轉向伺服器和高端產品後,Chromebook的CPU供應明顯不足,交期甚至已拉長至1年,OEM廠商紛紛轉向替代方案,聯發科成為最大受益者之一,消息稱2026年聯發科Chromebook處理器出貨年增逾40%。(硬體世界)
儲存為什麼不擴產?
大家晚上好,我是刀哥。市場已經沒啥好說的了。這幾天我是天天看到小作文,甚至今天看到一個離譜的AI圖文,說是一些消費的行業大佬都集體去看光了。光模組確實離譜。但是,底層的邏輯還是我們之前提到的算力鏈路的硬體類股,上游其實比較多,GPU、CPU、儲存、半導體、裝置、材料,再往上看到大宗商品、電網裝置、AIDC等等,其中光模組算是這條鏈路中的一個模組,只是漲的最多。但儲存其實漲的也挺多。所以這是普漲的行情,只是內部有分化。但只要你主線抓到了這條鏈路,基本上不會差。我們其實在1月28號的會員內部直播就有專題提到CPU的事兒。其實當時我記得還畫了個圖:總之,當時其實已經深入淺出的講了這個點了。現在看了下,我們還是講的太超前了。實際上CPU也是最近才開始漲起來了。我最近又不斷的看到CPU又要漲價了。其實這就是供需失衡,而且這種供需失衡一時半會還不太可能結束。供給這塊代工有壓力,產能不足;需求因為Agent的發展,AI的發展,需求一直猛增。包括我們當時也提到儲存我們同樣認為因為產能的原因,2026年,其實一直缺貨的邏輯,甚至2027年都是。以及像台積電,其實是同樣的邏輯,要到2028年產能才能擴起來,那麼現在AI這麼發展,Token瘋了一樣增長,2026年、2027年怎麼辦?而且儲存廠商跟商量好了的似的,幾乎都不擴產。這背後的真實原因,大家要深刻理解。在口罩之後的2023-2024 年,一個巨虧的教訓。三星、SK 海力士、美光合計虧損超1500 億元,價格跌到成本線以下,當時這些公司要崩了都。你看這圖看起來還挺好的,對吧。似乎只要熬過來就沒問題,但是你要知道,我們單獨看這段:其實那個時刻是很不好的時刻。所以,現在很簡單,大家不再比誰擴產快,而是控產能、穩價格、提毛利。還有就是,漲價賺的錢,遠比重資產擴產更穩、更賺。而這個行業的寡頭只有三家,這三家佔 DRAM 93%、NAND 80%+,誰先亂擴產,全行業崩盤,大家都不敢先動手。三家也都默契了。當然,我們周報也提了,國內有兩家公司準備擴產,一個是長江儲存,一個是長鑫儲存。還有,即使擴產,也不容易的:總之,這個行業形成了一致性。還是回到之前的內容來。這次核心看還是硬體。而現在A股的大資金其實都在抱團光模組,這個盤子可能更適合他們抱團。於是就這樣了。當然光模組本身有業績,這也是很好的。 (柳葉刀財經)
摩根大通:GPU租賃在3月全面漲價,DRAM與NAND二季度漲價繼續!
AI基礎設施需求持續升溫,GPU租賃價格3月全線走高,其中B200單月大漲23.5%,與H100溢價比值修復至2.07倍,反映市場對最新一代算力的緊迫需求。儲存端,DRAM與NAND合約價格一季度分別環比上漲96%和88%,預計二季度增長環比放緩至61%與73%。AI基礎設施需求持續升溫,推動GPU租賃價格在2026年3月全線上漲,其中B200漲幅尤為突出;與此同時,儲存晶片合約價格雖延續漲勢,但二季度擴張節奏預計有所收斂。摩根大通4月19日發佈資料中心追蹤報告指出,三大GPU層級租賃價格3月均環比走高,B200單月漲幅高達23.5%,B200與H100的價格比值隨之回升。儲存方面,據TrendForce資料,DRAM合約價格一季度環比大漲96%,NAND合約價格環比上漲88%;預計二季度兩者漲勢延續,但環比增速將分別放緩至61%和73%。GPU租賃價格的全面上行,反映出市場對高性能算力的旺盛需求;儲存合約價格在同比層面仍維持數倍漲幅,顯示供需格局並未根本逆轉,只是擴張斜率趨於平緩。B200領漲,GPU租賃價格3月全線走高據彭博指數資料,截至2026年3月底,B200租賃價格升至每GPU小時5.47美元,環比大漲23.5%,大幅高於2月的-0.2%和1月的+0.7%。這一跳升逆轉了自2025年9月指數推出以來持續壓縮的B200對H100溢價趨勢。B200與H100的價格比值從2月的1.82倍回升至3月的2.07倍,儘管仍低於指數推出初期約2.63倍。H100租賃價格延續上行,3月報每GPU小時2.64美元,環比上漲8.6%,高於2月的5.2%和1月的4.5%,連續第四個月錄得環比正增長。A100租賃價格3月報每GPU小時1.48美元,環比上漲6.5%,較2月的3.7%和1月的1.5%明顯加速,連續第三個月錄得加速上漲。H100與A100的價格比值也從2月的1.75倍小幅擴大至1.78倍,延續拉開趨勢,反映市場需求持續向更高性能GPU層級遷移。DRAM與NAND合約價格二季度漲勢趨緩,同比仍達數倍據TrendForce資料,DRAM合約價格一季度環比擴張96%,較四季度的48%大幅提速;NAND合約價格一季度環比增長88%,同樣高於四季度的36%。進入二季度,兩者漲勢預計延續但節奏放緩:DRAM合約價格預計環比增長61%,NAND合約價格預計環比增長73%。從同比維度看,漲幅依然相當可觀。最新預測顯示,2026年二季度DRAM合約價格同比預計上漲421%,NAND合約價格同比預計上漲362%。現貨價格走勢有所分化。DDR5 16Gb現貨價格3月報31.18美元,環比下跌6.1%,連續第二個月走弱,但同比仍上漲573%,約為去年同期4.63美元的近7倍。NAND 1Tb現貨價格則延續升勢,3月報28.96美元,環比上漲16.0%,同比上漲475%,約為去年同期5.04美元的近6倍,但環比增速較此前有所回落。供需格局支撐價格中樞,增速放緩不改上行趨勢綜合來看,GPU租賃價格的全面走高與儲存合約價格的持續擴張,共同指向AI基礎設施投資熱潮下的強勁需求側驅動。B200租賃價格的異常跳升尤其值得關注,其對H100溢價比值的快速修復,或暗示市場對最新一代算力的緊迫需求正在重新定價。儲存方面,合約價格二季度增速的放緩並非需求轉弱的訊號,而更多是高基數效應下的自然回歸。DDR5現貨價格的連續兩月下滑與NAND現貨的持續上漲形成對比,或反映不同產品線在供需再平衡過程中的節奏差異。對裝置製造商而言,儲存成本壓力在二季度仍將居高不下,儘管邊際壓力較一季度有所緩和。 (invest wallstreet)
台積電壟斷的不是晶片製造,而是這個你沒聽說過的技術
當所有人都盯著3奈米、2奈米製程競賽時,一個更致命的壟斷正在悄然形成。黃仁勳手握AI時代的"鏟子",全世界排隊向他買GPU。但很少有人知道,黃仁勳也在排隊——排隊等台積電的"包裝盒"。更荒誕的是:台積電在美國亞利桑那州投資400億美元建了晶片廠,生產出來的晶片依然要裝箱,飛越太平洋送回台灣,完成最後一道工序,再飛回美國。一顆晶片,兩次跨越太平洋,只為了一個環節:先進封裝。一、被忽視的"晶片包裝盒"在半導體行業,有一條不成文的鄙視鏈:晶片設計師最牛,晶圓廠工程師其次,封裝工程師墊底——"就是把晶片裝盒子的"。封裝,長期被視為技術含量最低的環節。但今天,這個"裝盒子"的活,正在改寫AI產業的權力版圖。台積電北美封裝負責人說了句意味深長的話:"封裝曾經是事後想法,但現在它和晶片本身一樣重要。"二、什麼是先進封裝?傳統晶片封裝很簡單:晶圓廠造晶片→切割→加保護層→出貨。一個晶片,一個"盒子"。但AI晶片完全不同。打開一顆Nvidia H100,你看到的不是一塊晶片,而是:2個巨大的GPU核心12塊高頻寬記憶體(HBM)各種互連層和橋接晶片這些小晶片來自不同工廠,但必須像一個整體工作。這就是先進封裝——不是簡單裝盒子,而是奈米級精度的"晶片樂高工程"。台積電的CoWoS技術,把GPU和記憶體緊貼在一起,資料傳輸速度提升10倍,功耗大幅降低。這才是H100性能爆表的真正秘密。三、Nvidia的"包裝盒危機"2023年,一個震撼業內的消息流出:Nvidia預訂了台積電80%以上的CoWoS產能。這意味著什麼?AMD想造MI300?排隊。Google想做TPU?排隊。Amazon、微軟、Meta的定製晶片?統統排隊。台積電的封裝產能,比3奈米產能還緊張。產能緊張到什麼程度?台積電——這家以"絕不外包核心技術"著稱的公司——不得不把部分CoWoS業務外包給第三方封裝廠。全球最大封裝代工廠日月光,2026年先進封裝業務暴增100%。黃仁勳甚至親自出席了日月光新廠開幕式。這在以前不可想像。就像台積電把晶片製造外包給中芯國際一樣荒謬。四、一個荒誕的供應鏈2024年,台積電亞利桑那晶片廠投產。拜登、庫克、黃仁勳都參加了慶祝,宣稱"半導體製造回歸美國"。但沒人提到一個尷尬的事實:這些在美國造的晶片,必須空運回台灣封裝,再運回美國。整個流程:亞利桑那造晶片 → 空運台灣(9000公里)→ 台灣封裝 → 空運回美國(9000公里)→ 交付為什麼不在美國封裝?因為美國根本沒有大規模先進封裝產能。過去50年,封裝產業大規模轉移到亞洲。今天的格局是:台積電:100%在台灣三星:100%在韓國英特爾:大部分在東南亞如果台海有事,全球AI產業瞬間休克。不是因為晶片造不出來,而是造出來的晶片"裝"不了。五、反擊:美國的封裝保衛戰台積電的艱難決定:2024年底,台積電宣佈在亞利桑那建兩座先進封裝廠。這是台積電歷史上第一次在台灣以外大規模封裝。但台積電拒絕透露時間表。業內估計:至少5-10年才能量產。英特爾的"曲線救國":英特爾雖然晶片製造落後,但在美國本土封裝有先發優勢。更關鍵的是,英特爾開始接外部封裝訂單:2024年:亞馬遜、思科、SpaceX2025年:Nvidia投資50億,考慮用英特爾封裝行業分析師一針見血:"想向美國政府表忠心,但直接用英特爾落後製程風險大。最安全的是:台積電造晶片,英特爾做封裝。"英特爾可能通過"封裝"這個後門,重新殺回晶片代工市場。六、終局:誰能打破壟斷?CoWoS技術台積電研發了12年。技術壁壘包括:中介層製造需要先進光刻良率控制極難(任何環節出錯,整個封裝報廢)客戶驗證周期2-3年產能壁壘更可怕:台積電在台灣有5座CoWoS廠,正在建4座新廠(2座台灣+2座美國),總投資超200億美元。競爭對手的機會:英特爾:技術略遜但成本低三星:有HBM自產優勢但封裝不如台積電中國大陸:裝置受美國管制時間線預測:2026-2027:台積電美國封裝廠開工2028-2030:大規模量產2030年前,台積電壟斷無人能撼。結語:看不見的戰場當所有人都在討論誰的製程更先進、GPU性能更強時,真正的瓶頸在一個99%的人沒聽說過的技術:先進封裝。台積電用12年時間,悄悄建構起比晶片製造更難打破的壟斷。黃仁勳可以設計出世界最強GPU,但他必須排隊等台積電的"包裝盒"。AMD、Intel、Google、Amazon都在研發AI晶片,但都繞不開台積電的CoWoS。這就是台積電真正的護城河。不是3奈米、不是2奈米,而是這個你可能從未聽說過的技術:先進封裝。一個值得思考的問題:當AI晶片必須飛越太平洋兩次才能用,當全球90%先進封裝產能集中在地震帶上——我們是否把AI的未來,押在了一個太脆弱的供應鏈上? (平行面)
中國自研2nm GPU來了!
據報導,棣山科技對外披露其2nm高端AI GPU晶片最新研發進展。據悉,該款2nm AI GPU原型晶片採用FinFET/GAA混合製程與Chiplet異構整合架構,搭載公司自主研發的“棣山智核(DS- Core)”,核心電晶體數量達1700億顆,採用2.5D CoWoS-L先進封裝技術。性能表現上,這款晶片FP32單精度算力可達50 TFLOPS,FP16半精度算力達100 TFLOPS,FP4低精度算力高達400 TFLOPS,可靈活適配不同精度需求的人工智慧大模型訓練、推理等高端算力場景;能效比較上一代產品提升40%,典型功耗控制在350W以內,每瓦算力可達142 GFLOPS。同時,研發團隊成功攻克高頻寬記憶體(HBM)封裝互聯、超低延遲片間通訊(<0.25ns/mm)、微流道高效熱管理三大核心技術瓶頸,其中搭載的HBM4記憶體單顆容量達48GB,引腳速率超11Gb/s,記憶體頻寬可達3.2TB/s,相較上一代HBM3E頻寬提升約2.5倍,可滿足大模型訓練時海量資料的高速傳輸需求;微流道熱管理技術可使晶片熱失控風險降低68%,晶片工作溫度穩定控制在85℃以下。此外,該晶片支援NVLink 6相容互連協議,單鏈路頻寬達1.6TB/s,多晶片互聯時可實現無瓶頸協同運算,進一步提升整體算力規模,同時相容主流CUDA軟體生態,可大幅降低下遊客戶技術遷移成本。截至2026年4月13日,棣山科技這款自主研發的2nm高端AI GPU晶片尚未進入正式流片階段,仍未完成從設計方案到實體晶片的關鍵跨越。在2026年舉辦的日本國際半導體裝置及材料展覽會等國內外核心半導體行業展會上,棣山科技對外公開了該款晶片的完整設計方案、核心技術參數及多輪模擬測試資料,重點展示了其在2nm製程適配、Chiplet異構整合、自研智核架構等方面的核心技術突破,讓行業各界及市場主體直觀瞭解到該晶片的設計實力與發展潛力,披露具體的流片啟動時間節點。 (半導體技術天地)
摩爾線程 率先完成MiniMax M2.7大模型適配
4月12日,摩爾線程旗艦級AI訓推一體全功能GPU MTT S5000已完成對新一代大模型MiniMax M2.7的Day-0極速適配,再次驗證了中國國產全功能GPU對前沿AI大模型的快速響應與穩定支撐能力。MiniMax M2.7是業界首個具備深度自我進化能力的大模型,能夠自主建構Agent Harness,通過Agent Teams協作、複雜Skills呼叫及Tool Search Tool等能力完成複雜生產力任務,甚至深度參與自身迭代。在軟體工程領域,M2.7支援端到端完整項目交付、日誌分析排障、程式碼安全審查及機器學習任務;在專業辦公場景,其Excel/PPT/Word高保真編輯與多輪修改能力顯著提升,即使在超長上下文複雜任務中仍保持穩定的高水平skills遵循率。與此同時,該模型對長上下文處理、複雜Agent任務調度及高保真編輯等場景提出了極高的計算效率要求。針對上述挑戰,摩爾線程技術團隊基於MUSA架構完成深度調優,成功在MTT S5000上實現M2.7大模型的高性能推理,核心技術優勢包括:▼超長上下文高吞吐:依託MTT S5000的80GB大容量視訊記憶體、1.6TB/s高頻寬及PD分離架構,配合高效KV Cache管理,支撐MiniMax M2.7長時間、多步驟任務的穩定執行。▼全精度端到端支援:MTT S5000原生支援FP8至FP64全精度計算,可滿足程式碼生成、金融建模等場景對混合精度及高精度計算的要求,確保決策精準可靠。▼高算力低延遲推理:MTT S5000單卡可提供1000 TFLOPS稠密算力,結合vLLM-MUSA定製化調優,實現複雜Agent Harness與高頻工具呼叫場景下的低延遲響應。▼強大生態相容性:深度相容PyTorch、vLLM、SGLang、Triton等主流生態,通過MUSA C++、Triton-MUSA、TileLang-MUSA等抽象層實現新算子“零成本遷移”,確保前沿模型發佈當日完成極速適配。此次Day-0適配是摩爾線程常態化技術響應能力的再次體現。依託 MUSA 架構對主流AI生態的深度相容與持續演進,中國國產全功能GPU算力底座已形成覆蓋前沿模型“極速適配-高效部署”的全鏈路支撐體系,幫助開發者以更快響應、更穩運行、更低遷移成本第一時間接入最新模型能力,加速大模型創新落地與規模化應用。 (深科技)
華為被認可了!
大衛·薩克斯的表態,近期在科技圈引發不小震動。這位川普的科技政策顧問,近日接受了彭博電視台採訪。他現任總統科技顧問委員會主席,話語權足夠份量。薩克斯直言,中國AI晶片設計已落後美國僅1.5到2年。更關鍵的是,他預判華為不久後會對外出口AI晶片。這一動作,或將點燃全球技術堆疊主導權的爭奪戰。薩克斯也承認,華為GPU生產仍受限制,但追趕速度驚人。“華為尚未達到頂尖水平,但未來一定會改變。”他如此判斷。他的擔憂很直接,華為若成重要GPU供應商,美企將承壓。川普政府的核心目標,是讓美國技術堆疊成為全球標準。為此,拜登時期的“擴散規則”已被正式放棄。那項規則曾限制美國GPU出口,還要求買家申請許可證。薩克斯解釋,過度限制盟友,反而會錯失鎖定市場的機會。他認為,阻止最先進半導體流向中國合理,但別傷了盟友。過去的法規,無異於“因擔心風險而自傷科技產業的腳”。薩克斯的履歷也印證了他的行業洞察力。他曾是貝寶前COO,還創辦過被微軟收購的Yammer。2024年底,他被川普任命為白宮AI和加密貨幣負責人。華為這邊,任正非近期也有清醒表態。他坦言,自家GPU確實落後美國頂級產品一代。但華為有自己的應對方式,用數學補物理、群計算補單晶片。這種思路下,華為晶片能達到實用水平,滿足多數AI需求。很多AI工作負載,本就不需要最尖端的硬體支撐。只要華為能以合理價格供貨,搭建成熟生態。完全有能力在部分市場,挑戰輝達和AMD的地位。輝達CEO黃仁勳,也曾公開批評美國的出口管制。他直言這些政策“完全錯誤”,只會適得其反。全球一半AI研究人員是中國人,堵不住創新的腳步。美國的限制,還讓輝達損失了巨額中國市場收入。僅H20晶片禁令,就導致其損失55億美元庫存和150億營收。黃仁勳也認可華為的實力,稱其是“世界級科技公司”。薩克斯的判斷,其實藏著美國的戰略焦慮。放棄過度限制,不是妥協,而是想鎖定盟友市場。遏制中國先進晶片,同時鞏固美國技術的全球主導權。華為若真啟動AI晶片出口,格局會發生微妙變化。國產晶片出海,不僅是營收突破,更是生態突圍。中美AI晶片的差距在縮小,競爭只會愈發激烈。華為能否打破壟斷,關鍵看生態搭建的速度和質量。而美國的政策調整,也會持續影響全球半導體格局。這場技術博弈,沒有旁觀者,每一步都關乎未來走向。 (1 ic芯網)