#Blackwell
🎯台積電2,000元回得去嗎?現在就是「財富重分配」的進場點?Line@連結:https://lin.ee/mua8YUP🎯台積電2,000元回得去嗎?還是會跌破1,700元?這幾天市場最吵的,就是這個問題。但我要先講一句很多人不敢講的真話:真正會讓你後悔的,從來不是高點買貴,而是低點不敢買。還記得台積電衝上2,000元的時候嗎?整個市場都在說一句話:「早知道1,500多買一點。」結果現在回檔、甚至測季線,一堆人反而開始腿軟。這就是投資最經典的人性:漲的時候想追,跌的時候怕死。但冷靜想一件事:AI時代最肥的訂單在哪?答案:只有一家公司吃得到!輝達Blackwell、未來OpenAI的AI晶片、甚至下一代AI伺服器核心,全球能量產的,只剩台積電。所以現在的回檔,本質不是基本面轉差,只是漲多後的技術性校正。但真正恐怖的,其實是未來三年的獲利。法人預估:2026年EPS:93 元2027年EPS:122 元2028年EPS:165 元看懂這組數字,你會發現一件事:這不是成長,這是噴射!如果2028年EPS 165元,市場只給20倍本益比。股價是多少?3,300元!也就是說:現在很多人在怕的1,700~1,800元,未來回頭看,可能只是 歷史上的甜甜價!為什麼台積電能這樣漲?三個關鍵:第一:AI超級循環AI加速器需求年增50%,產能永遠追不上需求。第二:2奈米+A16壟斷先進製程只有一家能做,而且連續四年漲價。第三:CoWoS封裝爆炸成長現在不是找訂單,是客戶排隊搶產能。簡單一句話:台積電不是景氣股,它是AI時代的「算力央行」。所以問題其實不是「台積電能不能回2,000?」真正的問題是:等它未來衝到3,000的時候,你會不會後悔→當初1,800沒多買一點!🔴接下來我們會在粉絲團持續幫大家鎖定+追蹤,若還不知道該如何操作?那建議你務必要鎖定江江在Line @,將有更進一步的訊息給大家了解。https://lin.ee/mua8YUP🔴想了解還未起漲的市場主流,同步了解大盤多空轉折點及學習預測技術分析,江江YT節目都會持續追蹤+預告。https://reurl.cc/02drMk********************************************************有持股問題或想要飆股→請加入Line:https://lin.ee/mua8YUP江江的Youtube【點股成金】解盤:https://reurl.cc/02drMk*********************************************************(本公司所推薦分析之個別有價證券 無不當之財務利益關係以往之績效不保證未來獲利 投資人應獨立判斷 審慎評估並自負投資風險)
輝達Rubin&Blackwell液冷+電源供應商全景分解
近日,全球知名媒體CNBC採訪了全球AI晶片公司輝達,輝達的A輝達人工智慧基礎設施負責人迪翁·哈里斯也介紹了最新一代的AI晶片rubin及rubin整機櫃伺服器的架構細節,同時最重要的深度解析了輝達Rubin&Blackwell的全球供應鏈分佈,上市時間。針對CNBC和輝達的深度對話,零氪將視訊重點內容做了分解。01.輝達Rubin上市時間,定價,客戶預定情況NVIDIA的Rubin是繼Blackwell之後的新一代AI計算平台核心晶片,這款全新的人工智慧系統是由來自世界各地的零部件組成的複雜網路。Rubin伺服器架構由晶片包括72個Rubin和36個VeraCPU組成,性能是Blackwell的10倍。Rubin目前是上市時間是計畫在2026年的Q2底,也就是6-7月左右上市,目前定價還沒有官方定價,但Futurum Group 估計其價格將比 Grace Blackwell 高出約 25%,系統總價將在 400萬美元至 450 萬美元之間。關於客戶方面,目前輝達預計的其他Vera Rubin客戶包括OpenAI、Anthropic,亞馬遜,Meta等北美巨頭,上周,Meta宣佈計畫在2027年前在其資料中心使用Vera Rubin。02.輝達Rubin&Blackwell 全球液冷&電源供應鏈Vera Rubin 由 130 萬個元件構成,來自世界各地的零部件組成的複雜網路,晶片部分主要由台積電製造。其他部件,從液冷元件到電源系統和計算托架,均來自至少20個國家的80多家供應商,其中包括中國、越南、泰國、墨西哥、以色列和美國,其中中國和台灣是輝達最大的供應鏈地區。輝達目前的AI晶片主要代工主要是由台積電代工,包括先進封裝部分,目前輝達是台積電第一大客戶。液冷部分,首先液冷連接器是液冷系統中實現冷板、歧管、CDU 等散熱部件間液路快速、密封連接與斷開的核心器件,保障冷卻液在系統內穩定循環傳輸以帶走裝置熱量。目前輝達的液冷連接器供應商主要是:Danfoss (丹佛斯), Readore, Taicheng, ZJK Cooler Master, Lotes, Jonhon (中航光電), Beehe, Fositek (富世達), Auras, Staubli (史陶比爾), Parker (派克), Lead Wealth, NIDEC, Envicool, Ingrasys (鴻佰/FIT), CEJN, Refas, CPC。目前丹佛斯和 Staubli體量最大。液冷板是負責直接冷卻晶片的核心元件,目前輝達冷板的供應鏈包括:Cooler Master訊強, AVC奇宏科技, Auras 雙鴻),Foxconn 富士康),BOYD, Delta 台達, Pinda, Readore 立敏達, Lead Wealth, Nidec 尼得科, CoolIT, Taicheng (泰碩),主要是台灣的企業居多。Manifold部分,包括機架級 (Rack Manifold) 和伺服器內部 (Inner Manifold) 的流體分配管路,目前輝達的供應商主要是:Cooler Master訊強, Auras, Foxconn, Delta台達, Pinda, Lead Wealth, LiteOn , Readore, AVC, CoolIT, nVent, BOYD, Nidec。Rubin架構的manifold供應鏈合作夥伴,首次公佈的Rubin架構的manifold供應鏈廠商為台灣雙鴻,AVC,台達電子,比亞迪電子,品達,富士康。輝達的冷量分配單元 (CDU) 包括 Sidecar (側掛式), In-Rack (櫃內式) 和 In-Row (列間式) 多種規格。供應商主要是Vertiv (維諦), Motivair, nVent, CoolIT, Foxconn, Quanta (廣達), Delta, Beehe (比赫電氣), Cooler Master, SMC (Nidec), Boyd, LiteOn, LiquidStack, TCT, Schneider Electric (施耐德), Envicool (英維克), Lead Wealth, AVC, Aivres (安擎)。Power shelf 是輝達 機架的核心供電部件,為整機提供穩定的電力分配與供電支援,分適配 GB200 和 GB300 的不同規格且配套有專用安裝支架,目前輝達的Power shelf 主要由Delta, Lite-On, Megmeet (麥格米特), Flex (偉創力), Lead Wealth, GreatWall (長城), KingSlide 等廠商提供,目前Delta, Lite-On佔據主要市場地位。Busbar(母線)是輝達 GB200/GB300 NVL72 系統中實現電力高效、穩定傳輸與分配的核心電力部件,分為 1400A 母線和 12V 內部母線兩類,是機架供電系統的關鍵組成部分。目前輝達的合格供應鏈主要是Foxconn, LiteOn, Interplex, Yuans Tech (元山), Lead Wealth, Rittal (威圖), Delta, Auras, Schneider, Karrie, Legrand (羅格朗).800VHVDC電源系統元件夥伴包括貿聯(BizLink)、台達電子、偉創力(Flex)、通用電氣弗諾瓦(GE Vernova)、Lead Wealth(領裕國際,領益智造子公司,惠州比亞迪電子控股股東)、光寶科技、麥格米特電氣。這些企業正在最佳化高密度PDU和轉換器,確保電源元件的互操作性和可擴展性。資料中心電力系統提供商則涵蓋了ABB、伊頓、GE Vernova、Heron Power、日立能源、三菱電機、施耐德電氣、西門子和Vertiv等行業巨頭。這些公司正開發設施級HVDC和EcoStruxure平台,支援GW級部署。當下NVIDIA的伺服器架構不僅是GPU性能的迭代,更代表AI產業供應鏈正在從單一晶片競爭轉向完整系統能力競爭,未來AI平台將圍繞CPU、GPU、網路、儲存和軟體進行深度協同設計,同時高頻寬儲存(HBM)、高速互聯、電力和資料中心基礎設施正成為關鍵瓶頸;視訊也指出,NVIDIA正通過更主動地管理和整合其上游與關鍵元件供應,包括先進製造、HBM和系統級架構合作,以鎖定核心資源並強化議價能力,這使其供應鏈控制力和護城河持續加深,而需求又高度集中在少數超大規模雲廠和AI企業,進一步強化了其與核心客戶和供應鏈之間的長期繫結關係。 (零氪1+1)
算力用Blackwell,資料靠Anthropic?DeepSeek新模型發佈前遭美圍堵
2026年2月底,全球AI行業正屏息以待中國AI獨角獸DeepSeek即將發佈的新一代旗艦模型(外界普遍預計為V4)。然而,就在新模型即將亮相的前夕,華盛頓和矽谷接連投下兩枚重磅炸彈:美國政府高官指控DeepSeek涉嫌使用被禁運的輝達Blackwell晶片進行訓練,而美國AI巨頭Anthropic則公開指責DeepSeek等中國企業對其進行了“工業級”的資料蒸餾。這一“硬體涉嫌違規獲取、資料涉嫌違規蒸餾”的雙重爭議,不僅讓DeepSeek的新模型未發先火,更將中美在人工智慧領域的科技博弈與生態競爭推向了新的高潮。一、 算力之謎:內蒙古資料中心裡的Blackwell晶片?在算力層面,DeepSeek一向以“極致的工程最佳化”和“在算力受限下實現性能突破”聞名。但據路透社在2026年2月23日的報導,一位川普政府的高級官員透露,DeepSeek即將在下周發佈的新模型,實際上是使用輝達目前最先進、性能最強悍的Blackwell架構晶片訓練而成的。這一指控如果屬實,將直接觸碰美國的出口管制紅線。目前,美國政府嚴禁將Blackwell晶片出口至中國。暗渡陳倉的算力叢集? 美方情報宣稱,這批Blackwell晶片被集中部署在DeepSeek位於內蒙古的龐大計算中心內。至於這些尖端晶片是如何繞過層層封鎖流入中國的,美方並未透露具體細節,但外界猜測可能涉及複雜的跨國空殼公司網路或走私管道。報導進一步指出,美國政府確信DeepSeek在發佈新模型時,會通過技術手段刻意抹除底層硬體的技術特徵,以防止外界從模型結構和輸出中反推出其使用了美國尖端AI晶片的證據。面對這一指控,輝達拒絕置評,而中國駐美大使館則發表聲明予以反駁,堅決反對美方“劃定意識形態界線、泛化國家安全概念、濫用出口管制”。二、 資料之爭:Anthropic的“工業級蒸餾”指控如果說晶片指控是來自美國政府的“硬體圍堵”,那麼資料蒸餾的指控則是來自美國AI同行的“軟體反擊”。就在美政府高官放風的同一天,Claude大模型的開發商、AI巨頭Anthropic在官方部落格中發佈了一項震動業界的指控。Anthropic稱,包括DeepSeek、月之暗面(Moonshot)和稀宇科技(MiniMax)在內的三家中國“AI小老虎”,正利用大量虛假帳戶對Claude發起**“工業級蒸餾攻擊”(Industrial-scale distillation attacks)。Anthropic聲稱,這些企業累計註冊了超過2.4萬個虛假帳戶,與Claude模型進行了高達1600萬次的高頻互動。蒸餾技術(Distillation)是指利用一個成熟、龐大且能力強悍的“教師模型”,來生成高品質的邏輯推理資料,從而訓練一個參數更小、成本更低的“學生模型”。通過這種方式,後發者可以大幅壓縮試錯時間和研發成本,實現“彎道超車”。事實上,不僅是Anthropic,OpenAI和埃隆·馬斯克旗下的xAI近期也頻繁發出類似警告,指責競爭對手在“吸血”美國頂尖模型的推理能力。不過,這一指控在網際網路上也引發了不小的爭議。許多開發者諷刺稱,Anthropic和OpenAI在發展初期同樣是靠無差別抓取全網資料甚至競爭對手的資料起家的,如今卻指責別人“蒸餾”不道德,頗有“雙重標準”的意味。三、 華盛頓的政策撕裂與產業震盪DeepSeek這一系列風波的背後,暴露出了華盛頓在對華科技戰中的深度糾結與政策撕裂。在2025年底,川普總統曾一度批准對華出售上一代H200晶片(附加25%關稅),但對最先進的Blackwell依然保持絕對封鎖。如今“DeepSeek涉嫌使用Blackwell”的消息傳出後,美國內部爆發了激烈的路線之爭:強硬派(對華鷹派): 認為這證明了出口管制漏洞百出。他們主張,既然中國企業能搞到Blackwell並可能用於具有潛在軍事用途的AI開發,美國就必須全面切斷任何等級AI晶片(包括H200)的對華出口,甚至加大對半導體裝置的制裁力度。務實派(如白宮AI負責人David Sacks與輝達CEO黃仁勳): 則持相反觀點。他們認為,一味地死封硬堵反而會倒逼中國企業加速採用華為(昇騰)等國產晶片,最終讓美國半導體巨頭失去全球最大的市場和技術主導權。四、 創新還是捷徑?等待新模型的最終檢驗儘管DeepSeek目前對上述兩項指控保持沉默,但這些爭議無法掩蓋一個事實:DeepSeek在AI底層架構上的創新能力是不可忽視的。無論是此前震驚業界的R1模型,還是其在近期論文中公佈的mHC(流形約束超連接)和Engram(條件記憶)等旨在解決訓練穩定性和視訊記憶體效率的前沿架構,都證明了其擁有一支世界頂級的演算法團隊。即使真的使用了Blackwell算力和Claude的蒸餾資料,如果缺乏卓越的演算法工程能力,也無法將這些資源轉化為驚豔的模型表現。預計DeepSeek的新一代模型就將正式揭開面紗。屆時,這款模型能否在多項基準測試中再次拉平甚至超越美國的頂尖模型,將成為全球科技界矚目的焦點。無論它的成功是源自非凡的演算法創新,還是如美方所指責的“違規硬體與資料捷徑”,DeepSeek的新模型都註定將成為2026年AI歷史上最具爭議、也最具標誌性的里程碑事件。它不僅是一次技術的發佈,更是中美兩大科技陣營在算力封鎖、資料爭奪和開源規則制定上的一次正面交鋒。 (壹號講獅)
【輝達財報】吸金681億美元,輝達業績沒有暴雷,Blackwell全年出貨600萬顆
2月26日,輝達公佈2026財年第四財季(對應自然年2025年第四季度)及全年業績,受益於AI算力需求的擴張,輝達各項財務指標均超出市場預期。在第四財季,輝達實現營收681.27億美元,同比增長73%,環比增長20%,高於分析師普遍預期的662.1億美元。淨利潤達到429.6億美元,同比增長94%,環比增長35%。每股攤薄收益1.76美元,較上年同期的0.89美元增長98%。“爆金幣”的伺服器機架。圖片由AI生成毛利率持續拉升,第四財季為75%,較去年同期的73%提升2個百分點。從全年表現看,2026財年總營收達2159億美元,同比增長65%;淨利潤1200億美元,每股攤薄收益4.90美元,同比增長67%。股東回報方面,輝達在2026財年通過股票回購和現金股息共計返還411億美元,其中第四財季返還41億美元。截至該季度末,輝達仍有585億美元股票回購授權餘額,並宣佈將於2026年4月1日向股東派發每股0.01美元的季度現金股息。第四財季經營活動現金流362億美元,遠高於去年同期的166億美元和上季度的238億美元。自由現金流接近350億美元,較去年同期翻倍。輝達預計,2027財年第一財季營收為780億美元,高於分析師普遍預期的726億美元。輝達股價25日報收於195.56美元,漲幅為1.41%。受財報提振,該股在盤後交易中一度上漲約3%。2026年以來,該公司股價累計上漲約5%,而同期納斯達克指數下跌0.4%。01. 資料中心營收“一騎絕塵”輝達第四財季73%的營收同比增速,較上一財季的53%進一步提升。淨利潤94%的同比增幅也高於前季度的84%,顯示出其盈利能力仍在增強。毛利率表現穩健,輝達CFO科萊特·克雷斯(Colette Kress)在分析師電話會議中解釋稱,毛利率同比提升主要由於存貨準備金減少,環比提升則得益於Blackwell晶片持續爬坡、產品組合最佳化及成本結構改善。各業務類股中,資料中心業務表現最為突出。第四財季,資料中心業務收入623億美元,同比增長75%,環比增長22%,佔公司總營收比重超過91%。超大規模雲服務提供商仍為最大客戶類別,貢獻略高於50%的資料中心收入,同時其他類型客戶的收入增速更快,收入結構持續多元化。網路業務第四財季收入110億美元,同比增長263%,環比增長34%。增長動力來自面向GB200和GB300系統的NVLink計算架構持續應用,以及乙太網路和InfiniBand平台的發展。這部分業務主要用於連接AI伺服器叢集,反映出客戶對大規模算力部署的需求。遊戲業務方面,第四財季收入37億美元,同比增長47%,主要受Blackwell晶片需求驅動。但由於假日季過後管道庫存自然調整,該業務收入環比下降13%。輝達預計供應限制將成為2027財年第一財季及以後遊戲業務的阻力。專業可視化業務第四財季收入13億美元,同比增長159%,環比增長74%,同樣受益於Blackwell晶片需求。汽車業務收入6.04億美元,同比增長6%,環比增長2%,主要受自動駕駛平台持續採用推動。02. BlackweII晶片出貨600萬顆Blackwell系列晶片的產能爬坡是本財季市場關注的重點之一。輝達財報顯示,該產品線的生產和交付進展順利,已成為遊戲和專業可視化業務增長的重要驅動力。下一代產品方面,輝達在此次財報中披露了Rubin平台的相關規劃。該平台包含六款新晶片,與Blackwell平台相比,可將推理token成本降低最高10倍。亞馬遜雲服務、Google雲、微軟Azure和甲骨文雲基礎設施將成為首批部署基於Vera Rubin的廠商。輝達在財報中確認,過去四個季度已出貨600萬顆Blackwell GPU。CEO黃仁勳在去年10月曾表示,從Blackwell到即將推出的Rubin晶片,輝達的GPU銷售額預計將達到5000億美元。03. 巨頭資本支出維持高位輝達資料中心業務的增長與主要客戶的資本支出計畫高度相關。Alphabet、微軟、亞馬遜、Meta四家超大規模雲廠商近期公佈的資本支出預期顯示,2026年合計支出有望接近7000億美元,較2025年增長60%以上,其中大部分投向資料中心和AI處理器。Wedbush Securities分析師在最新發佈的研報中表示:“我們對2026(自然)年度超大規模資本支出的預測已經超過先前預期。由於伺服器和AI基礎設施是未來支出的主要部分,AI投資的增長將在一定程度上超過整體資本支出趨勢。”不過,市場對AI投資回報周期的關注度正在上升。Cantor Fitzgerald分析師在報告中指出,儘管對計算能力的需求“難以滿足”,且輝達業績前景樂觀,“但投資者的擔憂依然存在,主要集中在超大規模資本支出是否見頂”。黃仁勳在財報中重申其對AI投資邏輯的判斷:“計算需求正呈指數級增長,AI智能體的轉折點已經到來。我們的客戶正競相投資於AI計算,這些工廠正在為AI工業革命及其未來發展提供動力。”04. 輝達的“不確定性因素”隨著AI相關投資持續擴大,市場對需求可持續性及潛在泡沫風險的討論增多。投資研究公司Visible Alpha的科技、媒體和電信研究主管梅利莎·奧托(Melissa Otto)表示:“毛利率可能是一個風險因素。問題將圍繞第一財季及以後的毛利率情況。”從供給端看,記憶體成本上升是影響毛利率的潛在變數。受全球記憶體短缺影響,高頻寬記憶體價格出現上漲。輝達在財報中表示,該公司已鎖定今年高頻寬記憶體的配額,短期記憶體成本上升對利潤率影響有限。競爭格局方面,AMD計畫在今年晚些時候推出新的旗艦AI伺服器產品,並已與Meta等輝達主要客戶達成合作。Google則通過自研TPU晶片與Anthropic簽約,後者將在Microsoft Azure上擴展其Claude模型,使用輝達系統提供支援。據悉,Google還在與Meta洽談晶片供應事宜。為應對競爭,輝達近期通過技術授權方式增強推理市場佈局。該公司去年與AI晶片設計公司Groq達成協議,獲得相關技術授權。輝達披露,截至目前已為此支付130億美元,剩餘40億美元將在一年內付清。此外,輝達近期與Meta簽訂協議,將向後者供應數百萬顆Blackwell和Rubin GPU,具體金額未披露。05. 下個季度營收目標780億美元輝達對2027財年第一季度給出如下指引:營收預計為780億美元,上下浮動2%,這個數字高於分析師普遍預期的726億美元。毛利率預計為75.0%,上下浮動50個基點。營運費用預計為77億美元,其中包括19億美元的股票補償費用。從第一財季開始,輝達將把股票補償費用納入非GAAP財務指標,意味著非GAAP下的淨利潤、每股收益等都會受到影響。公司解釋稱,股票補償是吸引和留住世界級人才的薪酬計畫的基礎組成部分。稅率方面,輝達預計2027財年全年稅率在17.0%至19.0%之間,該預測未考慮任何離散項目及稅收環境的重大變化。值得注意的是,輝達在指引中明確表示,未計入來自中國大陸的任何資料中心計算收入。此前,2025年12月,美國政府允許輝達向部分中國大陸客戶銷售H200晶片,為潛在價值數百億美元的市場打開通道。克雷斯在電話會議中披露,該公司已獲得美國政府許可,可向中國大陸客戶運送“少量”H200晶片,但尚未從中獲得任何收入。她補充道:“為了維持在AI計算領域的領導地位,美國必須讓每個開發者都能參與,並成為包括中國大陸在內所有商業企業的首選平台。”不過,美國商務部工業與安全域1月發佈的正式規則對銷售流程附加了條件,獲批難度有所增加。 (騰訊科技)
對標H100!摩爾線程GPU“核彈”:參數曝光!
對標H100!國產GPU“核彈”參數曝光:1000TFLOPS算力,性能直逼Blackwell?摩爾線程AI旗艦級計算卡MTT S5000性能首次曝光,這是摩爾線程2024年推出的、專為大模型訓練、推理及高性能計算而設計的訓推一體全功能GPU智算卡。摩爾線程在其官網中,首次公佈了S5000的硬體參數:支援FP8到FP64的全精度計算,其單卡AI算力(FP8)最高可達1 PFLOPS,視訊記憶體容量為80GB,視訊記憶體頻寬達到1.6TB/s,卡間互聯頻寬為784GB/s。業內人士表示,MTT S5000實測性能對標H100,在多模態大模型微調任務中,部分性能甚至超越H100。在晶片架構層面,S5000採用第四代MUSA架構“平湖”,專為大規模AI訓練最佳化,依託MUSA全端軟體平台,原生適配PyTorch、Megatron-LM、vLLM及 SGLang等主流框架,讓使用者能夠以“零成本”完成程式碼遷移,相容國際主流CUDA生態。在計算精度方面,S5000作為國內一批最早原生支援FP8精度的訓練GPU,配置了硬體級FP8 Tensor Core加速單元。相比傳統的BF16/FP16,FP8可將資料位寬減半,視訊記憶體頻寬壓力降低50%,理論計算吞吐量翻倍。其FP8引擎全面支援DeepSeek、Qwen等前沿架構,可提升30%以上訓練性能。基於S5000建構的誇娥萬卡叢集已經落地,其浮點運算能力達到10Exa-Flops,在Dense模型訓練中MFU達60%,在MoE模型中維持在40%左右,有效訓練時間佔比超過90%,訓練線性擴展效率達95%。依託原生FP8能力,它能夠完整復現頂尖大模型的訓練流程,其中Flash Attention算力利用率超過95%,多項關鍵指標均達到國際主流水平。在叢集通訊層面,S5000採用獨創的ACE技術,將複雜通訊任務從計算核心解除安裝,實現計算與通訊的零沖突平行,大幅提升模型算力利用率(MFU)。實測顯示,從64卡擴展至1024卡,系統保持90%以上的線性擴展效率,訓練速度隨算力增加幾乎同步倍增。2026年1月,智源研究院基於S5000千卡叢集,完成了前沿具身大腦模型RoboBrain 2.5的端到端訓練與對齊驗證。結果顯示,與輝達H100叢集的訓練結果高度重合,訓練損失值(loss)差異僅為0.62%。除了訓練,S5000在推理場景同樣表現優異。2025年12月,摩爾線程聯合矽基流動,基於S5000完成了對DeepSeek-V3 671B滿血版的深度適配與性能測試,實測單卡Prefill吞吐超4000 tokens/s,Decode吞吐超1000 tokens/s,這一成績刷新了國產GPU的推理紀錄。 (芯榜)