#小晶片
美國再拒輝達AI晶片對華銷售!
美國政府再次收緊對華AI晶片出口的“天花板”。據The Information報導,美國政府已通知聯邦機構,將不允許輝達向中國銷售其最新開發的“降級版”AI晶片B30A。該晶片基於輝達Blackwell架構,性能據稱超過此前的H20型號,公司此前已向部分中國客戶提供樣品。面對這一否決,輝達正著手修改晶片設計,希望美國政府重新考慮立場。但這一努力能否改變結果,仍是未知數。輝達在中國市場的處境已發生根本性轉變。公司發言人表示,輝達在中國“高度競爭的資料中心計算市場中份額為零”,未將其納入公司業績指引。這一數字與2022年時95%的市場主導地位形成鮮明對比。與此同時,中國政府正積極推動本地企業採購國產AI晶片,近期更出台政策要求使用國家資金的新建資料中心項目必須採用國產AI晶片,華為昇騰等本土廠商正加速填補市場空白。輝達首席執行長黃仁勳在台灣地區一家電視台的直播中明確表示,目前“沒有計畫向中國發貨任何產品”。他將市場重新開放的決定權指向中方:“這取決於中國何時希望輝達產品回歸以服務中國市場,我期待他們改變政策。”目前,輝達正面臨中美雙方政策紅線的雙重擠壓:一方面是美國政府持續收緊對華先進晶片出口許可,另一方面是中國政府加速推進自主算力替代。B30A的修改能否獲得美國批准、中國客戶是否會接納,仍有待觀察。 (晶片行業)
何小鵬喊話自研晶片年出貨百萬顆!四款新車排隊上,要月產千台機器人
小鵬交出最好年報,何小鵬把出海智駕目標都公佈了。何小鵬擬砸25億加碼物理AI研發,新車出海機器人晶片目標都公佈了。車東西3月20日消息,就在剛剛,小鵬汽車董事長、CEO何小鵬在電話會議上透露了小鵬汽車今年在物理AI、人形機器人、圖靈晶片及出海的一系列目標。他指出,小鵬汽車正處在物理AI應用的歷史性轉折點,預計今年在物理AI方面的研發投入,將從去年的45億元提升至70億元。何小鵬進一步展開介紹了各具體業務的目標,第二代VLA方面,小鵬計畫在今年底將車端模型參數量從數十億級提升至200億級以上,使平均接管里程提升25倍,安全接管里程提升50倍。此外,小鵬的VLA2.0技術堆疊已經在機器人上成功跑通,搭載三顆圖靈AI晶片的全新一代IRON機器人將會在2026年底量產,年底的月產能目標是上千台。何小鵬還說:“屆時,物理AI agent的銷量榜單,將會比10年前的汽油車銷量榜和今天的新能源車銷量榜更加重要,我們也有信心成為全球物理AI智能體的領跑者。”官方對第二代VLA模型預期很高,這背後是小鵬自研圖靈晶片的加持。何小鵬透露,自圖靈晶片2025年三季度量產上車以來,累計出貨量已超過20萬片,預計今年全年出貨量目標接近100萬片,有望成為中國大算力端側AI晶片的出貨量第一名,自今年二季度起,小鵬旗下車型將全部切換至自研的圖靈晶片。會上,何小鵬還強調了對出海的看重,並提出了一系列海外目標,包括銷量同比翻倍,海外收入佔比進一步提升至20%以上,海外門店擴至680家,自營超充網路“走出去”,覆蓋10大核心市場等。小鵬還為出海準備了充足“彈藥”,今年二季度將正式發佈旗艦大六座SUV小鵬GX,年內推4款全球化新車。就在今天,小鵬汽車交出了2025年年報,總收入、毛利率、總交付量均創下歷史新高。▲小鵬2025年全年財務資料具體來看,小鵬2025年交付量達42.94萬輛,同比增長125.9%;總收入767.2億元,同比增長87.7%,較前一年增加近360億元;毛利率提升至18.9%;淨虧損縮小至11.4億元,全年研發支出達94.9億元,同比增長47.0%。值得特別注意的是,小鵬汽車更是在2025年四季度實現業績重大突破,毛利率達21.3%,淨利潤轉正至3.8億元。截至2025年底,小鵬汽車現金及現金等價物、受限制現金、短期投資及定期存款為人民幣476.6億元,同比增加57億元,用小鵬汽車副董事長及聯席總裁顧宏地的話來說,“這為我們堅定投入物理AI研發提供了堅實的保障。”01. 何小鵬10問連放狠話明年年初實現Robotaxi無安全員在今晚舉行的小鵬汽車財報電話會議上,小鵬汽車董事長兼CEO何小鵬對2026年度小鵬汽車的發展重點以及未來規劃做出了詳細回應。▲小鵬汽車董事長兼CEO何小鵬以下是何小鵬本次電話會的主要內容,車東西在不改變原意的基礎上進行了編輯:Q1: 小鵬VLA2.0今年會有什麼大的升級計畫?何小鵬:後面的每一個季度,我們都有至少一個大版本的OTA。▲小鵬第二代VLA架構比如二季度OTA升級中,第二代VLA會從原來僅覆蓋高速城區的主要路段,擴展至覆蓋更多的小路、停車場、園區,也就是說從有導航的公共道路的自動駕駛變成沒有導航、沒有規則的內部道路的自動駕駛。我們今年還會做非常多的能力升級,比如將車端模型從數十億等級提升到超過200億等級,我們希望安全的接管里程能夠在今年的基礎上再提高5到10倍。在自動駕駛之外,我們還會帶來多處升級,例如加入了多語言,本地化的支援力度增加,實現智能座艙與自動駕駛的整合。Q2: 小鵬VLA2.0對銷售轉化及使用者粘性將會帶來什麼樣的影響?何小鵬:從3月初開始宣傳第二代VLA之後,門店的試駕量環比翻倍,Ultra和Ultra SE版本的銷量佔比提升了不止一倍。當真正全量推送以及OTA之後,我期望第二代VLA會帶來更高的客流並且拉高單車的均價。說到使用粘性,我只能分享一個我自己的case。用了第二代VLA之後,我再使用其他的智能駕駛版本,就發現我已經覺得無論是使用其他的車型的自動駕駛還是專業的司機幫我開車,都比不過VLA的絲滑安心。我覺得高等級的自動駕駛,一定在使用者的日常生活中存在99%到100%的使用需求。我的司機最近已經兩次問我,專業的司機什麼時候會開始被淘汰的問題了。另外,我補充一下,第二代VLA因為是一個全新的範式,我們最需要先解決安全的問題。可能會出現很多的短板,因為我們的VLA不像以前,現在基本上完全不使用規則,我相信在短板可以彌補的情況下,後面會花非常多的時間來進行長板的增強和全球化的部署。Q3: 小鵬Ultra車型及VLA2.0在海外市場的部署計畫是怎麼樣?智駕出海對於海外銷售會有什麼樣的影響?智駕在海外是否有獨立收費的機會?何小鵬:我們已經啟動了第二代VLA相關的研發測試準備工作了,預計在今年年底到明年逐步在不同的區域開啟第二代VLA的交付。第二代VLA在海外有非常大的泛化優勢。我們在多個市場的測試中發現,沒有任何的海外資料參考,僅僅靠我們的第二代VLA就已經能夠做到非常好的智駕效果。小鵬的第二代VLA相比友商FSD,在小路的博弈能力是特別好的,在歐洲、東南亞我們的優勢特別明顯。所以我非常堅信,第二代VLA能夠更快速、更低成本、更優良地在海外提供高品質、高安全的智駕。我們現在的硬體已經做好了準備,我們也的確正在考慮智駕軟體在海外的一些更好的商業收費機會,我相信一定會將好的技術轉換成更好的商業。▲大眾將首發小鵬第二代VLAQ4: 小鵬在機器人研發、規模量產和供應鏈上,有那些競爭優勢?何小鵬:我們實際上正在使用一種非常具有挑戰性的全新方法,用一種比研發Robotaxi難度高10倍以上的方式,去做機器人的高品質量產,今年年底的月產能目標是上千台。▲小鵬全新一代IRON機器人跟汽車的一個很大的不同是機器人在軟體上所產生的價值,一開始就起碼是50%,而汽車可能最開始只有10%、15%,後面會逐步放大。我覺得汽車跟機器人是同源的,所以無論在研發、量產、供應鏈、品質,還是在產供銷服務全球化上,我相信都會有很多類似性。小鵬跟很多汽車公司不一樣,因為我們全端自研、跨域融合,小鵬的機器人從手關節到腳到身體,小鵬基本上全部都會研發,或者是自研,或者聯合研發。這些是小鵬和其他機器人公司及汽車公司的差異所在。Q5: 如何看待未來機器人的成本跟售價,成本的下降應該有什麼樣的指引?何小鵬:我覺得機器人的成本邏輯跟汽車的成本邏輯是不一樣的。我覺得機器人的成本有三個:硬體成本、研發成本、營運成本。其中硬體成本可能跟汽車接近,但是研發成本會遠高過汽車,特別是在過去汽車習慣跟Tier1合作,可以把別人的軟體跟硬體解決方案拿過來,那是在規則時代。但是在AI時代裡面,不是一個規則,它不能這樣直接拿過來。此外,人形機器人有通用跟專用之分,需要結合不斷新增的資料持續訓練模型,這會導致大量的營運成本,我認為規模量產型機器人會讓硬體成本不斷下降,但是軟體跟營運的成本會持續提高。Q6: 機器人在量產之後有那些應用場景?何小鵬:我們跟絕大部分公司不一樣,我們首先不是面向科研市場,我們最開始是期望進入商業,再進入工業,然後再進入家庭這三個場景,取決於我們對於技術能力的變化。▲小鵬全新一代IRON服務場景進入商業需要很安全的運動能力,我相信這個能力我們目前是行業的絕對第一。進入工業需要很好的操作能力,我們第二步會實現。進入家庭我認為是一個更困難的能力,我們在第三步會實現。Q7: 到目前為止以及接下來的幾年,AI算力規模大概需要多大?何小鵬:我覺得關於資料規模的事情,今天沒有人可以在物理AI領域給出一個清晰、長遠的判斷。我們現在是數萬卡的規模,我相信一定要達到數萬卡的規模。物理AI世界需要的資料量,我認為汽車大概是數字AI的1000倍,而機器人大概是汽車的1000倍。我們將來會用新的方法來解決物理AI的算力問題。Q8: 是不是所有的算力投資都算在研發裡面,還是說有一部分會劃分到資本開支裡邊?何小鵬:因為這個問題涉及到長期投入,只能相對框架性地回答您。在未來的數年裡面,我相信我們的汽車上的研發會穩定,投入會逐步收斂,AI上的投入會逐步向上,會越來越有效能。我們所有這些投入均一次性計入研發支出,未計入資本開支。Q9: Robotaxi目前的研發測試進度如何?今年有那些重要的里程碑節點,包括有安全員載客、無安全員載客的營運目標,預計在什麼時候跑通?何小鵬:我們認為大概在1到3年後,會實現軟體層的完全自動駕駛的能力,包括中國,包括全球。我們在硬體上關於Robotaxi的進展現在非常順利,我們正在去解決政策的問題。因為政策要求從獲取測試牌照,到實現有安全員、無安全員的營運落地,需分步驟推進。▲小鵬將於2026年推出三款Robotaxi我們需要在Robotaxi的全球化營運上去做一些少量的研發,今年下半年我們會開展有安全員的載客測試,明年年初希望能夠實現無安全員的Robotaxi商業化營運,並且在更後面我們會開放我們的整個體系,讓更多來自中國、全球的合作夥伴,用我們的平台和技術。Q10: Robotaxi業務未來規模拓展的策略怎麼看?小鵬汽車會有那一些車型計畫進入這個Robotaxi業務?何小鵬:Robotaxi在將來的規模拓展,取決於社會的接受度和政策的允許度。我認為在未來的兩年到也許三四年裡面,會在部分的國家跟區域優先,然後快速成長。至於未來是什麼樣的車型會開啟Robotaxi業務?我覺得這個問題也許再過2到3年我們會來思考,到底是以車來驅動Robotaxi,還是以機器人來驅動Robotaxi的業務。我覺得可以再讓子彈飛一下,大家會看到更清晰的結果。02. 季報年報業績創新高毛利率超蔚來理想小鵬汽車能夠喊出這些目標,可見底氣很足,而這也是由於小鵬汽車交出了一份最好的年報。具體來看,2025年小鵬汽車總收入為人民幣767.2億元,較2024年408.7億元的總收入上升87.7%。其中,2025年其汽車銷售收入為683.8億元,較2024年的358.3億元上升90.8%。▲小鵬汽車近3年營收及交付量變化毛利率方面,小鵬汽車2025年度毛利率為18.9%,超過了理想(18.7%)、蔚來(13.6%),汽車毛利率為12.8%,相較而言,2024年小鵬毛利率為14.3%,汽車毛利率為8.3%。淨虧損方面,其2025年全年淨虧損為人民幣11.4億元,2024年這一數字為57.9億元。2025年非公認會計原則小鵬汽車普通股股東應佔淨虧損為人民幣4.6億元,相較2024年的55.5億元大幅減虧。值得一提的是,2025年全年財務資料實現突破,與小鵬汽車在2025年第四季度的業績猛增密切相關。2025年第四季度,小鵬汽車總收入為人民幣222.5億元,較2024年第四季度增長38.2%,並較2025年第三季度增長9.2%,創下單季度歷史新高。▲小鵬汽車近5個季度營收及交付量變化同期,其毛利率為21.3%,創下單季度歷史新高,較2024年第四季度增長6.9個百分點,實現連續4個季度增長。而這也得益於小鵬汽車同期的銷量爆發,2025年第四季度,小鵬汽車總交付量為11.62萬台,較2024年同期的9.15萬輛增長27.0%,創下單季度交付量歷史新高。對於2025年取得的業績,小鵬汽車董事長及CEO何小鵬表示:“我相信小鵬汽車正處在物理AI應用的歷史性轉折點,我們不僅要擴大AI汽車的全球市場份額,完成L2+輔助駕駛向L4自動駕駛的跨越,讓第二代VLA走向海外,還要實現高階人形機器人的規模量產。”2025年財務表現亮眼,而今天,小鵬汽車也為今年第一個季度立下了銷量和業績目標。小鵬汽車預計,2026年第一季度汽車總交付量將介於6.1萬台至6.6萬台,總營收將介於122億元至132.8億元。03. 結語:小鵬汽車加快戰略轉型從2025年年報及最新電話會議披露的資訊來看,小鵬汽車正處在物理AI應用的歷史性轉折點。通過多年的規模研發投入,小鵬已建構晶片、大模型、資料、EA架構和AI Infra在內的全端自研體系,並推進自動駕駛與智能座艙融合以及動力與底盤的跨域融合,在這一過程中正逐步收穫更多碩果。隨著新一代VLA架構、多款新車及機器人產品的相繼落地,小鵬汽車有望在智能出行與具身智能領域建構更為完整的業務生態,其未來發展潛力值得持續觀察。 (車東西)
摩根士丹利:AI晶片價值鏈-中國vs美國
一、產業鏈環節“Farmer-Egg-Chicken-Hen house”比喻來拆解AI晶片價值鏈:- Farmer(農戶):對應CSP/AIDC環節,即雲服務/AI資料中心,是AI算力的需求方與應用端,直接承載大模型、AI應用。- Egg(雞蛋):對應AI chip designers環節,即AI晶片設計公司,是算力的核心“種子”,負責晶片架構與功能設計。- Chicken(雞):對應Foundry/OSAT環節,即晶圓代工/封測企業,是晶片的製造與封裝環節,負責將設計圖紙變為實體晶片。- Hen house(雞舍):對應WFE/EDA環節,即半導體裝置/EDA工具,是晶片產業的底層基礎設施,是製造與設計的“生產工具”。二、中美AI晶片價值鏈代表企業1. 中國側(自主供應鏈)- Farmer(應用端):以字節跳動、騰訊、百度、阿里為代表,還包括MINIMAX、智譜AI、深度求索等國內主流雲服務與大模型公司。- Egg(晶片設計):海思、摩爾線程、寒武紀、中科海光、崑崙芯、平頭哥、燧原科技等國產AI晶片設計廠商。- Chicken(製造封測):中芯國際、上海華力、通富微電、長電科技等國內晶圓代工與封測企業。- Hen house(裝置/EDA):北方華創、中微公司、拓荊科技、華大九天等國產半導體裝置與EDA工具企業。2. 美國側(全球主導鏈)- Farmer(應用端):Google、OpenAI、Anthropic、Meta、亞馬遜、甲骨文等全球頂尖雲服務與AI公司。- Egg(晶片設計):NVIDIA、AMD、博通、聯發科等全球AI晶片設計龍頭,其中NVIDIA是絕對核心。- Chicken(製造封測):台積電、三星、日月光等全球頂級晶圓代工與封測企業,台積電主導先進製程。- Hen house(裝置/EDA):ASML、應用材料、KLA、新思科技、楷登電子等全球半導體裝置與EDA的核心供應商,ASML的EUV光刻機是關鍵瓶頸。三、“脫鉤”趨勢的核心體現1. 中國側:從底層裝置(Hen house)→製造(Chicken)→設計(Egg)→應用(Farmer),逐步建構自主可控的AI算力供應鏈,減少對西方技術的依賴。2. 美國側:強化自身生態閉環,同時限制對中國的高端技術輸出,推動算力供應鏈的區域化分割,保持在高端環節的絕對主導。3. 本質:中美在AI算力這一核心生產力上的產業鏈競爭與自主化,全球AI晶片供應鏈正從“全球化分工”走向“雙循環、區域化”的格局。(海外君)
《戰亂與通膨夾擊:油價和貴金屬狂飆,LED與感測器半導體產品喊漲》2026年全球科技產業鏈正深陷地緣政治衝突、航運與原物料通膨交織的「完美風暴」。隨著美國和伊朗戰爭風險提升、黃金、白銀、銅等關鍵金屬類原料價格不斷創歷史新高,犧牲極大量的成本正在殘酷地席捲供應鏈。為了在成本海嘯中求生,從LED照明顯示、感測半導體元件,到各大半導體晶片製造商,已經全面放棄過去的「價格戰」,引爆大規模的漲價潮。能源危機與避險情緒同步點燃了貴金屬市場的暴漲:現貨黃金一度飆破5,000美元/盎司,白銀史上首次站上93美元/盎司大關(年內漲幅逾27%),國際銅價突破13,000美元/噸,而受地緣政治直接影響的鋁價也衝上了四年來的新高。特別是LED產業首當其衝,媒體報導,台灣LED導線架大廠長科(6548)近期對客戶端發出價格調整通知函,因貴金屬金、銀以及銅價持續大幅攀升,4月1日起出貨的訂單再漲價。市場指出,黃金價格與白銀價格的暴漲超出企業承受範圍,自 2026 年 1 月 1 日起,LED導線架全系列產品皆調漲15%至25%。中國大陸在今年開春以來更有超過50家的LED相關企業發出漲價通知,包括洲明科技、華普永明、崧盛股份、奧拓電子等多家龍頭企業紛紛宣布提價,漲幅均落在5%至15%之間。而黃金、銀、銅等貴金屬是LED封裝、PCB板及線材等核心部件的關鍵材料,這些貴金屬的暴漲,直接壓垮LED產業成本防線。在感測半導體及自動化方面,日本大廠歐姆龍(Omron)也將感測半導體元件、繼電器、PLC等產品自即日起調漲5%至50%;晶圓代工廠力積電也已於年初調漲感測半導體元件與驅動IC的價格,8吋功率元件代工報價調。晶圓代工大廠台積電則宣布調漲7奈米以下先進製程3%至10%的價格,中芯國際則對8吋BCD製程平台調漲約10%。從能源的飆漲,到貴金屬屢創新高價,這次原物料大危機不只有讓科技業重新擬訂價格策略,也逼供應鏈加速優化轉型。學者專家認為,只要美伊戰爭沒有平息的曙光,終端消費市場(像是PC、智慧型手機、車用電子等)也將勢必面臨產品售價的全面調漲。
“儲存狂潮”何時見頂?這是最有效的“領先指標”
自2023年1月以來,受AI計算需求推動,儲存晶片股持續大漲,前三大儲存製造商股價平均上漲699%。然而,隨著股價不斷攀升,市場最關心的已不是“還能漲多少”,而是“該盯什麼訊號判斷拐點”。3月16日,瑞銀全球研究團隊發佈研報《全球 I/O 儲存半導體》,回顧了過去20年儲存行業的周期規律,並對當前的領先指標進行了重新評估。瑞銀指出,在AI計算的推動下,儲存行業的底層邏輯已經發生根本性改變,傳統的估值和預測模型可能不再適用。而營業利潤則成為更好的領先指標。行業“底層邏輯”變了:AI把供需關係推向新均衡瑞銀將本輪行情的關鍵歸因於“AI算力時代,儲存價值上移”。報告指出,價值重估背後有兩條供給側約束在累積:HBM佔用越來越多DRAM晶圓產能,帶來“嚴重DRAM短缺”;這一緊張還會被“trade ratio”放大:即HBM DRAM die尺寸相對DDR持續變大,單位HBM對產能的“消耗”更高。在此基礎上,瑞銀提出一個對投資者更敏感的結論——回報率中樞上移。報告直言:“我們認為ROE已經結構性重設”,並預計三星/SK海力士/美光在2026-2030E平均ROE為36%,顯著高於過去十年15%。這意味著:用舊周期範本去找頂部,可能會更頻繁失靈。傳統指標失靈:“二階導數”不再可靠過去,投資者通常喜歡用“二階導數”——即儲存合約價格(ASP)環比或同比加速最快的季度——來預測股價的頂部。然而,瑞銀的復盤結果顯示,這個指標的可靠性正在下降。在過去20年的10次“股價見頂”中,只有50%的情況下,股價與DRAM ASP環比變化在同一季度或相近季度見頂。例如,在2009年第四季度(全球金融危機後的復甦期)、2013年第二季度(行業整合後的周期)以及2017年第一季度(傳統周期),ASP環比變化的峰值分別比股價見頂早了3個、5個和5個季度。瑞銀指出,雖然實際ASP與股價的同步性稍好(60%的情況下在同一季度見頂),但整體來看,“二階導數”在當前複雜的市場環境下,已經很難作為精準的“逃頂”訊號。尋找新錨點:營業利潤是更好的領先指標既然傳統指標失靈,投資者該看什麼?瑞銀給出的答案是:營業利潤(OP)。營業利潤不僅反映了價格變化,還綜合了位元增長(bit growth)和單位成本下降(cost reduction per bit)的因素。因此,它更接近行業真實景氣度的“終值”。報告分析顯示,在過去20年中,股價在90%的情況下與營業利潤同時或提前見頂。特別是在2012年之前,股價與營業利潤的見頂時間幾乎是同步的。而在此之後,股市的預期性變得更強,股價通常會比營業利潤提前一到兩個季度見頂(大多數情況下提前一個季度)。不過,瑞銀也提醒投資者,預測營業利潤何時見頂並非易事。原因仍在於AI帶來的供需結構變化可能讓盈利節奏更難預測,尤其當HBM持續擠佔DRAM產能時,價格、供給、利潤的聯動關係會更複雜,利潤峰值的“預估時間點”也可能快速漂移。因此,營業利潤可以作為一個重要的觀察指標,但絕不是“萬能藥”。AI重塑行業:ROE結構性重設,上漲行情有望延續至2027年瑞銀強調,當前的儲存周期與以往有著本質的不同。AI計算時代的到來,使得價值向儲存領域發生了根本性的轉移。隨著HBM(高頻寬記憶體)佔據越來越多的DRAM晶圓產能,DRAM短缺問題日益嚴重。此外,HBM DRAM的晶片尺寸不斷增大,進一步加劇了產能的緊張。基於這些因素,瑞銀認為儲存行業的淨資產收益率(ROE)已經發生了結構性重設。報告預測,2026年至2030年,三星、SK海力士和美光的平均ROE將達到36%,遠高於過去十年的15%。因此,報告對儲存股的後市依然保持樂觀。報告預計,儲存行業的營業利潤將在2027年第三季度見頂。在其他條件不變的情況下,這意味著儲存股的上漲行情有望持續到2027年第二季度。瑞銀繼續首選買入SK海力士,同時對三星、美光(MU)和南亞科技均維持“買入”評級。 (追風交易台)
監管批准字節跳動、阿里巴巴、騰訊等公司哦買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻
監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻/比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始/小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%監管剛批了40萬塊H200,黃仁勳轉頭宣佈:我已經開始重新生產了!今年1月,監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片,總價值約100億美元。這是中美晶片博弈裡罕見的"開綠燈"時刻——美國出口管制繞了一大圈,監管蓋了章,DeepSeek也在其中拿到了有條件購買許可。(來源:Reuters、《華爾街日報》)與此同時,中國官方發言人回應說"不瞭解具體情況"——100億美元的訂單,官方說不知道,這已經是一種態度了。更快的是輝達這邊。2026年3月17日,CEO黃仁勳在GTC大會上直接宣佈:已收到來自"眾多客戶"的訂單,H200中國版正在重啟生產。幾周前訂單來了,幾周內工廠開動。禁令、解禁、重啟,這條鏈條走完只用了不到兩個月。100億美元擺在那裡,到底是管制有效,還是管制本身就是一筆生意?(來源:Axios、CNBC)不是降級版!輝達Groq晶片5月入華,這次連"特供"都省了輝達去年底以約200億美元收購了推理晶片公司Groq,現在這顆晶片要直接賣給中國了。據Reuters消息,輝達正在為中國市場準備一款Groq晶片,預計5月上市,面向AI推理業務——也就是模型跑起來之後回答問題、執行任務那個環節。更關鍵的是,知情人士明確透露:這款晶片不是降級版,也不是專為中國特供的閹割版本。(來源:Reuters)之前H20是專門為中國"定製"的縮水版,這次連縮水都免了。這個時間點很微妙。H200剛剛重啟生產,Groq非降級版緊跟著入場,輝達在中國市場一口氣佈局兩條產品線。可美國出口管制的框架還掛在那裡,Groq晶片究竟走的是那個口子,目前沒有官方解釋。監管還沒表態,晶片已經在路上——黃仁勳每次在華盛頓和監管之間走鋼絲,都比上次走得更穩一點。(來源:Reuters)五角大樓要讓AI公司進軍事機密庫訓練模型,這件事比你想像的更炸這件事3月17日才被MIT Technology Review報導出來,五角大樓正在討論一個計畫:為AI公司建立安全隔離環境,讓它們用機密軍事資料訓練專屬的軍用版模型。不是部署,是訓練。意味著OpenAI、Anthropic或者Google的工程師,理論上可以接觸到美軍的機密資料集來"喂"模型。這是一個史無前例的方向,之前從來沒有商業AI公司被允許碰這類東西。(來源:MIT Technology Review)背景是:OpenAI已經與五角大樓簽了在機密網路中部署AI系統的協議,國防部也在今年1月發佈了AI戰略備忘錄。問題是,訓練和部署是兩件性質完全不同的事。部署是讓AI用軍事資訊,訓練是讓軍事資訊變成AI的一部分——這兩者之間的資料安全邊界,目前沒有任何明確的技術標準或法律框架來界定。Hegseth已經警告Anthropic必須配合軍方,OpenAI也大方接單。但誰來決定這些模型最終學到了什麼、記住了什麼,答案目前是:沒人知道。(來源:MIT Technology Review、PBS)GPT-5.4 mini和nano來了——OpenAI說這是"最強小模型",速度快了2倍多OpenAI正式發佈GPT-5.4 mini和GPT-5.4 nano,主打Agent、程式碼生成、多模態工作流,定位是"以極低成本提供接近GPT-5.4水準的性能"。GPT-5.4 mini相比上一代GPT-5 mini,在程式設計、推理、多模態理解、工具呼叫上全面提升,速度快了2倍以上;兩款模型都支援40萬token的超長上下文窗口(大約30萬個漢字),專門針對需要大量子任務串聯的Agent場景做了最佳化。(來源:OpenAI、ZDNET)這對開發者來說是實打實的降本消息——頂級性能的七成,花頂級價格的一個零頭。但OpenAI這一步的棋感,很微妙。GPT-5.4 mini是給API用量大、成本敏感的企業用的,nano是面向更高頻的輕量場景。兩款小模型同時推,等於在Agent賽道上把價格門檻砸穿——競爭對手做的那套"小模型夠用論",OpenAI直接親自驗證了。Anthropic、Google同樣有自己的"小強模型",但現在面對的問題是:你的小模型,是不是真的比OpenAI的小模型更小、更便宜、還更好用?(來源:OpenAI、ZDNET)阿里、騰訊都搶了,百度終於把"小龍蝦"塞進了小度音箱中國AI圈這陣子有個新詞叫"養龍蝦"——OpenClaw是一個開源AI Agent框架,因為logo像龍蝦,被叫爆了。騰訊最先動,做了QClaw接入微信和QQ;阿里隨後跟上。3月17日,百度宣佈將OpenClaw整合進旗下小度(Xiaodu)智能音箱,讓小度變成一個語音控制的Agent遙控器,用一句話就能觸發跨應用的複雜任務。(來源:Bloomberg)三大廠同台,百度靠的是硬體入口:小度的螢幕和麥克風,是其他兩家沒有的物理觸點。但有趣的是,在這場搶跑裡,百度的AI雲收入剛剛同比增長38%,OpenClaw的整合宣佈同一天發佈,時機選得極準——用一個熱詞捆綁一個財報數字,這是一種很熟練的敘事操作。問題是,把Agent塞進音箱和塞進聊天框,那個更容易讓使用者真的用起來?目前沒有任何資料,三家都在同一起跑線上等答案。(來源:Bloomberg)阿里巴巴發佈"悟空"平台,讓AI幫企業打工——現在還在內測阿里巴巴正式推出企業級AI平台"悟空(Wukong)",目前處於封閉測試階段。悟空的核心邏輯是協調多個AI Agent配合工作,處理文件編輯、表格操作、商業研究等複雜企業任務——不是一個聊天機器人,而是一套能"自己分工幹活"的Agent調度系統。(來源:Reuters)時間節點同樣刻意:剛好在中國agent熱潮爆發的那個當口,騰訊在聊,百度在跟,阿里這次選擇先做企業端。悟空和同期宣佈的"Token Hub"是阿里AI戰略的兩面。Token Hub是整合阿里所有AI研究、消費者產品、AI應用的新業務集團,由CEO吳泳銘(Eddie Wu)親自掛帥,核心命題是AI變現。(來源:Bloomberg)悟空是變現的產品抓手,Token Hub是整合內部資源的組織容器——從架構上看,這是阿里把AI從"成本中心"推向"利潤中心"的一次整體操刀。但封閉內測的悟空究竟什麼時候能開放,阿里沒說。(來源:Reuters)Manus突然下載到我電腦裡了!"My Computer"讓AI Agent徹底告別雲端2026年3月16日,Manus正式發佈桌面應用,核心功能叫"My Computer"——可在Windows和macOS上運行,讓AI Agent直接訪問你的本地檔案、瀏覽器、應用程式,以及在你電腦空閒時自動幹活。這是Manus從雲端走向本地的關鍵一步。之前Manus能做的事,都發生在遠端沙盒裡;現在它可以直接讀你的項目資料夾、開你本地的IDE、在你不看螢幕的時候繼續工作。(來源:Manus官網、9to5Mac)這不是"助手",更像一個在你電腦裡常駐的無聲員工。這件事最讓人不安的地方,恰恰是它最吸引人的地方——AI終於能碰你真實的本地資料了。雲端Agent和本地Agent的最大區別,就是這道"能不能接觸到你實際工作環境"的門檻。Manus選擇在這個時間點把門踢開,意味著Agent賽道的戰場從"在雲上幫你查資料",正式移到了"在你的電腦裡幫你幹活"。Cursor在程式碼領域已經打通了這一層,現在Manus要在更寬泛的通用任務上複製這條路——誰先讓使用者真的放心把電腦交出去,誰就贏了。(來源:Manus官網)比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始輝達在GTC 2026大會上宣佈:比亞迪、吉利、五十鈴、日產四大車企將採用其DRIVE Hyperion自動駕駛平台,支援Level 4等級無人駕駛車輛。同時,Uber與輝達擴大合作,計畫2027年上半年率先在洛杉磯和舊金山推出全端Robotaxi服務,並於2028年擴展至覆蓋四大洲的28個城市。(來源:Nvidia官方、The Verge)一次發佈會,輝達同時繫結了整車製造端和出行營運端——中美日的車企,全進了這張網。這個陣容有點意思。比亞迪和吉利是中國新能源頭部,五十鈴是日本商用車代表,日產是傳統燃油巨頭——四種不同背景的車企,同時選了輝達的同一套平台,這本身就是一種背書。Waymo已經在舊金山和鳳凰城跑了好幾年,Cruise折戟,特斯拉Full Self-Driving還在講故事;輝達這次的策略不是自己造車,而是把自己做成Robotaxi時代的"底盤供應商"。2027年不到兩年,洛杉磯的街上會不會真的有Uber+輝達的無人車跑起來,值得盯著看。(來源:Reuters、The Verge)騰訊QClaw內測,14億微信使用者的手機裡快要住進一隻"AI龍蝦"了騰訊正在內測一款名為QClaw的產品——這是OpenClaw的微信/QQ雙端一鍵啟動包,讓使用者直接在微信聊天框裡調起AI Agent,完成本來需要跨多個App切換才能做完的任務。(來源:新浪科技、知乎)微信12億活躍使用者,QQ幾億年輕使用者,QClaw一旦全面上線,等於給OpenClaw這套開源框架接上了一個全球最大的流量入口。騰訊之前在AI產品上一直給人"慢半拍"的感覺,這次的動作算是把入口優勢打出來了。但QClaw目前只是內測,預計"近期上線"——沒有正式發佈日期。在這條賽道上,阿里的悟空也在等開放,百度小度已經宣佈整合,OpenClaw在中國的生態正在被三大廠同時圈地。微信入口的流量是真實的,但Agent能不能在14億人的聊天框裡真正活下來,取決於它能不能在一個"對話"介面裡把任務做得比人工快。這一步,騰訊比阿里和百度都更有條件驗證——問題只是它動不動得快。(來源:36氪、財富號)小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%2026年3月16日,小米MiMo大模型負責人羅福莉與監管大學研究團隊聯合發佈ARL-Tangram系統,這是一套針對Agent強化學習的統一資源管理框架,核心數字是:將強化學習訓練步驟持續時長縮短至多1.5倍,節省高達71.2%的外部算力資源,同時在真實世界Agent任務上平均ACT提升4.3分。(來源:IT之家、新浪財經)簡單說,同樣的訓練效果,花的錢不到原來的三成。這在當下算力極度緊缺、訓練成本居高不下的背景下,是非常實際的突破。但這篇論文更值得注意的,是它的位置。羅福莉是小米內部MiMo模型的負責人,ARL-Tangram發的不是產品,是學術論文——小米在用學術成果的方式宣示自己在大模型基礎研究上有真正的積累。三月的AI圈到處是"發佈會",小米選擇發一篇論文。在大廠裡,這種動作通常意味著:接下來會有更大的東西落地。算力成本降了70%,下一步的問題是,這個效率用在那裡?(來源:搜狐、IT之家)Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻2026年3月16日,月之暗面三位聯合創始人楊植麟、吳育昕、周昕宇與數十名研究員聯署,發佈了一篇純架構層面的技術報告。他們重新設計了大模型的核心結構——殘差連接(Residual Connection),這個元件自2015年引入Transformer以來,超過10年幾乎沒有人動過。Kimi的方案讓每一層能夠選擇性地關注此前各層的輸出,而不是統一求和,實驗結果是48B參數規模的模型訓練效率提升1.25倍。(來源:新浪財經、澎湃新聞)論文發出後,馬斯克本人評價"令人印象深刻",前OpenAI研究科學家Andrej Karpathy同樣給予好評。這篇報告的戲劇性,不在於那1.25倍的效率提升,而在於它選擇攻擊的目標——一個10年沒人敢改的基礎元件。大多數模型創新發生在訓練方法、資料配比、規模擴展上;動架構本身,是風險最高也最難被外界驗證的路。三位聯合創始人都署名,不像是一篇普通論文,更像是一份聲明:Kimi在做自己的事,而不是跟在別人後面堆參數。馬斯克和Karpathy的背書,給了這篇論文在國際AI圈的能見度——但它能不能真正改變下一代模型的架構選擇,還需要時間驗證。 (AI Daily Insights)
【GTC 2026】傳輝達Groq LPU將對華出口!
3月18日消息,據路透社報導,兩位知情人士透露,人工智慧(AI)晶片大廠輝達正準備推出一款可向中國市場出口和銷售的Groq語言處理單元(LPU)版本,預計將於今年5月上市。在近日的GTC 2026大會上,輝達高調發佈了基於Groq技術的Groq 3語言處理單元(LPU),將其定位為Vera Rubin GPU的“推理協處理器”,引發了市場的極大關注。與大多數依賴HBM(高頻寬記憶體)作為工作記憶體層的AI加速器不同,每個Groq 3 LPU晶片整合了500MB的片上SRAM(靜態隨機存取儲存器)。雖然其容量遠低於Rubin GPU上的288GB的HBM4,但是其可提供高達150TB/s的頻寬,對於頻寬極度敏感的AI解碼操作,Groq 3 LPU的頻寬是傳統HBM的近7倍。輝達超大規模計算副總裁Ian Buck表示,對於需要極致低延遲的token生成任務,LPU的頻寬優勢無可替代。”那麼,輝達最新推出的這款LPU是否能夠對華出口呢?2026年1月,美國為了讓輝達老的AI晶片能夠對華出口,放寬了相關出口管制的硬體參數限制,已經修改為:TPP(總處理性能)低於21000(3A090.a和3A090.b中所定義)且“總DRAM頻寬”低於6500 GB/s(如第748部分補充2第(dd)(1)段註釋中所定義的)的高級計算商品。美國的AI晶片出口管制的核心紅線是算力密度(TPP)和互聯頻寬。但LPU的架構與AI GPU完全不同:它不擅長高平行浮點運算(訓練任務),而是專攻低延遲推理。雖然其片上SRAM頻寬極高,但容量極小(單晶片僅500MB),無法獨立運行兆參數級大模型。如果看FP8精度下的理論峰值算力,可能遠低於H100/B200等晶片。這意味著,Groq LPU的算力密度可能並不觸及現行美國針對AI晶片出口管制的性能閾值。路透社的報導也指出,輝達正在為中國市場準備的Groq LPU晶片並非降級版本,也不是專門為中國市場打造的“特供版”。但是,在輝達的規劃中,Groq LPU是作為Rubin GPU的“協處理器”存在的。黃仁勳給出的配比建議是:約25%部署Groq LPU,其餘75%部署Vera Rubin。LPU負責解碼階段的低延遲生成,Rubin GPU負責預填充階段的海量計算。這意味著,即使LPU本身可以進入中國,它也無法與Vera Rubin組成完整的混合推理系統——這將顯著影響其在中國市場的實用價值。不過,消息人士稱,輝達計畫對華出口的LPU新版本可以適配其他GPU系統——這意味著它可能在介面、互聯協議或系統整合層面進行了調整,以適應中國市場的伺服器生態。另一種可能是,輝達將Groq LPU以板卡或系統的形式出口,通過整體系統的性能參數來滿足管制要求。消息人士稱“新版本可以適配其他系統”,也暗示了其可能在系統整合層面進行了調整。雖然目前輝達在AI訓練晶片市場依然佔據著主導地位,但是由於美國出口管制政策的限制,使得其在中國AI晶片市場的份額已持續降低至冰點。同時,在中國的AI推理晶片市場,輝達更是面臨著寒武紀、HW、阿里平頭哥、百度崑崙芯等眾多本土廠商的激烈競爭。如果輝達無法將Groq LPU帶入中國,可能將這部分市場份額拱手讓人。這種商業壓力也促使輝達尋找合適的產品及合規的出口路徑,重新回到中國AI晶片市場。 (芯智訊)