#B30 | 熱門關鍵字 | 鉅亨號

8月24日消息，據《華爾街日報》最新的報導指出，人工智慧（AI）晶片廠商輝達（NVIDIA）正為中國市場開發一款基於最新 Blackwell 架構的定製版AI晶片B30，性能將達到Blackwell GPU的80%。Blackwell GPU系列包括B100、B200、B300等型號，報導所指的“標Blackwell GPU”可能為B100。報導稱，輝達已經向美國政府提交了B30晶片的對華出口許可申請，以批准向中國出口。這些談判於今年早些時候開始，但是最終能否獲得許可仍不確定。此前在與黃仁勳會晤批准H20對華出口許可後，川普接受媒體採訪時曾表示，他不會允許Blackwell晶片在沒有大幅降級的情況下銷往中國。川普說，如果 Blackwell 的性能比該公司的頂級產品性能低至少 30%，他將允許輝達出貨。“我有可能就‘以消極方式得到一些增強’的Blackwell GPU達成協議，”川普對記者說。“換句話說，從中扣除 30% 到 50%。”他還提到，黃仁勳計畫再次拜訪他，以就Blackwell晶片的出口許可證進行談判。川普的此番言論，似乎也為後續輝達B30獲批埋下了伏筆。畢竟，輝達H20在重新獲批後，如果在中國市場銷售情況不佳，即使川普政府可以分享15%的銷售額，但是恐怕也拿不到多少錢。如果川普政府想要從輝達在華貿易中獲取更多的銷售分成，那麼就很有可能會批准更具競爭力的B30的對華出口。當然，B30的性能相比頂級的B300必然也是需要大幅削減的，特別是在HBM容量和記憶體頻寬方面，但至少應該會比H20性能更強。此前路透的報導稱，輝達最新的對華提供的Blackwell 架構GPU是基於單晶片版本的B300（即B300A）打造，因此型號或為“B30A”。根據資料顯示，B300A基於台積電4nm製程，CoWoS-L 先進封裝，擁有144GB HBM3E，功耗為600W。路透社的報導還指出，輝達希望最早在下個月向中國客戶提供樣品進行測試。 (芯智訊)

科技

2025/08/25

•

輝達最新特供B30晶片！等待美國審批！

輝達已向美國政府提交專為中國市場設計的B30晶片審批申請。該晶片基於最新Blackwell架構開發，性能約為標準版的80%，旨在符合美國對華晶片出口管制要求。據瞭解，B30晶片是輝達繼H20之後推出的又一款"特供版"AI加速器。與標準版Blackwell GPU相比，B30在算力參數和互聯頻寬等方面進行了調整，使其符合當前出口限制標準。公司首席執行官黃仁勳表示："審批結果尚不確定，我們正積極配合監管程序。"行業資料顯示，2024年第二季度輝達在中國AI加速器市場的份額已降至65%，較去年同期下降25個百分點。華為昇騰910B、寒武紀MLU370等國產晶片正快速搶佔市場份額，國產化率已提升至35%。"B30的審批面臨較大不確定性，"半導體行業分析師指出，"美國商務部正在評估其是否存在被用於軍事領域的風險。"據悉，審批過程可能需要數月時間，期間輝達將無法向中國客戶供應該產品。值得注意的是，中國正在加速推進AI晶片國產替代。多家雲端運算企業表示，已將國產晶片採購比例提升至50%以上。華為昇騰晶片在推理場景的性能已接近國際主流水平，訓練效率也在快速提升。市場研究機構TrendForce預測，若B30未能獲得出口許可，輝達在中國資料中心市場的份額可能進一步下滑。到2025年，國產AI晶片的市場佔有率有望突破50%。"中國企業正在加快自主創新步伐，"中國人工智慧產業發展聯盟專家表示，"無論外部環境如何變化，我們都將堅持走自主可控的發展道路。"業內人士指出，全球AI晶片市場正面臨深刻重構。在技術自主和供應鏈安全雙重驅動下，中國AI晶片產業已進入快速發展期，正在從"跟跑"向"並跑"轉變。 (晶片行業)

美股

2025/06/06

•

輝達將為中國新特供晶片B30曝光深度分析！

據報導，NVIDIA正在為中國市場研發一款名為“B30”的降規版AI晶片，這款晶片將首度支援多GPU擴展，允許使用者通過連接多組晶片來打造更高性能的計算叢集。B30晶片預計將採用最新的Blackwell架構，使用GDDR7視訊記憶體，而非高頻寬記憶體（HBM），也不會採用台積電的先進封裝技術。採用GB20X晶片，也就是RTX 50系列的晶片，其售價預計在6500美元至8000美元之間，遠低於H20晶片的1萬至1.2萬美元。不少人認為“多GPU擴展”能力指的是NVLink，但NVIDIA已在其消費級GPU晶片中已經取消了NVLink支援，因此B30是否支援NVLink目前還不能確定。有媒體稱B30晶片的多GPU互聯功能可能基於NVIDIA的ConnectX-8 SuperNICs技術，這一技術曾在Computex 2025上展示，用於連接RTX Pro 6000 GPU。當然NVIDIA可能已經修改了現有的GB202晶片——即RTX 5090上使用的晶片，並啟用了NVLink支援。NVIDIACEO黃仁勳曾多次公開表示，中國是全球最大的AI市場之一，擁有全球一半的AI研究人員，拿下中國市場將引領全球AI發展。但無奈的是美國的禁令使得NVIDIA在中國市場的份額受到限制，NVIDIA只能不斷調整晶片設計，以符合美國的出口管制規定。一、技術架構與性能參數對比NVIDIA B30 與 H20 的核心技術參數對比如下：關鍵差異解析：視訊記憶體與頻寬的戰略取捨H20 憑藉 96GB HBM3 視訊記憶體和 4.0TB/s 頻寬，在大模型推理中可直接載入全量參數（如 DeepSeek-R1 671B），避免資料分片導致的延遲。而 B30 採用 GDDR7 視訊記憶體，雖通過動態壓縮技術將有效頻寬提升至 1.2TB/s，但在處理高精度 FP16 計算時仍存在瓶頸。例如，H20 在 4096 長文字輸入場景下的吞吐量達 961.45 token/s（192 並行），而 B30 受限於視訊記憶體頻寬，同場景性能僅為 H20 的 60%。算力與能效的博弈B30 的 FP32 算力（200 TFLOPS）是 H20（44 TFLOPS）的 4.5 倍，在科學計算和傳統訓練任務中更具優勢。但 H20 的 FP16 稀疏算力（148 TFLOPS）和 FP8 支援（296 TFLOPS）使其在生成式 AI 推理中效率更高。例如，H20 在 ResNet-50 訓練中的能效比（TOPS/W）為 H20 的 82%，但 B30 通過降低功耗（250W vs 400W）實現單位成本下降 58%。互聯技術的代際差距H20 的 NVLink 900GB/s 互聯頻寬是 B30 ConnectX-8 方案（100GB/s）的 9 倍，在多卡叢集中表現出顯著優勢。測試顯示，8 卡 H20 叢集的分佈式訓練通訊效率達 NVLink 理論值的 92%，而 B30 叢集在 16 卡以上時延遲飆升，效率下降至 70%。這使得 H20 更適合千億參數模型訓練，而 B30 在中小型叢集中性價比更高。二、市場定位與戰略意圖對比價格策略與生態繫結B30 以 6500-8000 美元的售價直接對標華為昇騰 910B（約 5000 美元），通過 CUDA-X 軟體棧的深度最佳化實現主流框架無縫遷移。例如，百度飛槳團隊針對 B30 視訊記憶體限制開發的動態分配演算法，使 Transformer 模型推理速度提升 25%。而 H20 憑藉成熟的 CUDA 生態和 NVLink 互聯，仍佔據高端推理市場，但其 1.2 萬 - 1.5 萬美元的售價導致部分企業轉向國產替代方案。合規性與技術封鎖的角力B30 通過精確校準參數（如算力密度 69.8 TFLOPS/mm²、互聯頻寬 590GB/s）完全符合美國出口管制要求，而 H20 因 FP32 算力（44 TFLOPS）和視訊記憶體頻寬（4.0TB/s）接近限制閾值，面臨被禁風險。這種 “特供” 策略使 NVIDIA 在中國市場維持 13% 的營收佔比（2024 年 H20 銷售額 170 億美元），同時通過技術標準割裂絞殺國產晶片生存空間。性能與成本的市場選擇在訓練市場，昇騰 910B 憑藉 376 TFLOPS 的 FP16 算力和自研光互連技術，叢集性能已超越 H20 15%。而 B30 在推理市場通過多卡擴展（100 塊 B30 叢集達 H20 叢集 85% 性能，成本僅 60%）擠壓寒武紀思元 590 等國產晶片的市場份額。但 H20 的 141GB 版本憑藉超高視訊記憶體容量，仍在醫療影像分析等垂類場景中不可替代。三、技術挑戰與產業博弈視訊記憶體頻寬的致命短板B30 的 GDDR7 視訊記憶體頻寬（1.7TB/s）僅為 H20 HBM3（4.0TB/s）的 42.5%，導致其在處理高精度計算時效率低下。例如，在 Stable Diffusion 圖像生成任務中，B30 的單卡吞吐量僅為 H20 的 55%，而多卡叢集因互聯延遲增加，整體效率進一步下降至 75%。國產替代的技術突破華為昇騰 910B 通過 3D Fabric 封裝技術實現 376 TFLOPS FP16 算力，性能顯著優於 B30，且支援 PyTorch 框架 95% 的相容性。寒武紀思元 590 則以 2TB/s 視訊記憶體頻寬（超越 B30）和低 40% 的價格，在邊緣計算領域實現突破。此外，國產晶片通過訓推分離架構，在金融風控等定製場景中逐步替代進口。地緣政治與技術標準美國最新出口管制將 “先進的中華人民共和國晶片” 列為重點監管對象，試圖通過技術標準割裂維持優勢。B30 的推出本質是美國技術封鎖的 2.0 版本，通過 “特供” 晶片維持依賴，同時絞殺國產晶片生存空間。中國則通過 “東數西算”“信創工程” 等政策推動全端國產化，建構自主算力生態。四、未來展望與行業啟示B30 與 H20 的對比折射出中美 AI 博弈的複雜性：短期：B30 憑藉價格和生態優勢在推理市場佔據一定份額，但訓練市場仍由國產晶片主導。H20 因視訊記憶體容量和互聯性能，在垂類大模型推理中不可替代。長期：量子計算、光子晶片等顛覆性技術可能重塑競爭格局。中國在光子晶片專利儲備量已佔全球 34%，若實現商用，將徹底打破 NVIDIA 的技術壟斷。企業策略：需在性能、成本、合規性之間找到平衡點。例如，阿里雲採用 H20 多卡並聯方案（4 卡叢集算力≈3 卡原版），部分彌補單卡性能損失；騰訊則通過最佳化 DeepEP 通訊框架，在 H20 叢集中實現 RoCE 網路環境下性能翻倍。總之，B30 與 H20 的技術妥協與市場策略，不僅是 NVIDIA 在出口限制下的生存之道，更是中國 AI 產業轉型升級的試金石。其對比分析為中國晶片產業突破技術封鎖提供了鏡鑑，也為全球科技產業鏈重構提供了新的思考維度。 (AI雲原生智能算力架構)

科技