監管批准字節跳動、阿里巴巴、騰訊等公司哦買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻
監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻/比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始/小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%
監管剛批了40萬塊H200,黃仁勳轉頭宣佈:我已經開始重新生產了!
今年1月,監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片,總價值約100億美元。這是中美晶片博弈裡罕見的"開綠燈"時刻——美國出口管制繞了一大圈,監管蓋了章,DeepSeek也在其中拿到了有條件購買許可。(來源:Reuters、《華爾街日報》)與此同時,中國官方發言人回應說"不瞭解具體情況"——100億美元的訂單,官方說不知道,這已經是一種態度了。
更快的是輝達這邊。2026年3月17日,CEO黃仁勳在GTC大會上直接宣佈:已收到來自"眾多客戶"的訂單,H200中國版正在重啟生產。幾周前訂單來了,幾周內工廠開動。禁令、解禁、重啟,這條鏈條走完只用了不到兩個月。100億美元擺在那裡,到底是管制有效,還是管制本身就是一筆生意?(來源:Axios、CNBC)
不是降級版!輝達Groq晶片5月入華,這次連"特供"都省了
輝達去年底以約200億美元收購了推理晶片公司Groq,現在這顆晶片要直接賣給中國了。據Reuters消息,輝達正在為中國市場準備一款Groq晶片,預計5月上市,面向AI推理業務——也就是模型跑起來之後回答問題、執行任務那個環節。更關鍵的是,知情人士明確透露:這款晶片不是降級版,也不是專為中國特供的閹割版本。(來源:Reuters)之前H20是專門為中國"定製"的縮水版,這次連縮水都免了。
這個時間點很微妙。H200剛剛重啟生產,Groq非降級版緊跟著入場,輝達在中國市場一口氣佈局兩條產品線。可美國出口管制的框架還掛在那裡,Groq晶片究竟走的是那個口子,目前沒有官方解釋。監管還沒表態,晶片已經在路上——黃仁勳每次在華盛頓和監管之間走鋼絲,都比上次走得更穩一點。(來源:Reuters)
五角大樓要讓AI公司進軍事機密庫訓練模型,這件事比你想像的更炸
這件事3月17日才被MIT Technology Review報導出來,五角大樓正在討論一個計畫:為AI公司建立安全隔離環境,讓它們用機密軍事資料訓練專屬的軍用版模型。不是部署,是訓練。意味著OpenAI、Anthropic或者Google的工程師,理論上可以接觸到美軍的機密資料集來"喂"模型。這是一個史無前例的方向,之前從來沒有商業AI公司被允許碰這類東西。(來源:MIT Technology Review)背景是:OpenAI已經與五角大樓簽了在機密網路中部署AI系統的協議,國防部也在今年1月發佈了AI戰略備忘錄。
問題是,訓練和部署是兩件性質完全不同的事。部署是讓AI用軍事資訊,訓練是讓軍事資訊變成AI的一部分——這兩者之間的資料安全邊界,目前沒有任何明確的技術標準或法律框架來界定。Hegseth已經警告Anthropic必須配合軍方,OpenAI也大方接單。但誰來決定這些模型最終學到了什麼、記住了什麼,答案目前是:沒人知道。(來源:MIT Technology Review、PBS)
GPT-5.4 mini和nano來了——OpenAI說這是"最強小模型",速度快了2倍多
OpenAI正式發佈GPT-5.4 mini和GPT-5.4 nano,主打Agent、程式碼生成、多模態工作流,定位是"以極低成本提供接近GPT-5.4水準的性能"。GPT-5.4 mini相比上一代GPT-5 mini,在程式設計、推理、多模態理解、工具呼叫上全面提升,速度快了2倍以上;兩款模型都支援40萬token的超長上下文窗口(大約30萬個漢字),專門針對需要大量子任務串聯的Agent場景做了最佳化。(來源:OpenAI、ZDNET)這對開發者來說是實打實的降本消息——頂級性能的七成,花頂級價格的一個零頭。
但OpenAI這一步的棋感,很微妙。GPT-5.4 mini是給API用量大、成本敏感的企業用的,nano是面向更高頻的輕量場景。兩款小模型同時推,等於在Agent賽道上把價格門檻砸穿——競爭對手做的那套"小模型夠用論",OpenAI直接親自驗證了。Anthropic、Google同樣有自己的"小強模型",但現在面對的問題是:你的小模型,是不是真的比OpenAI的小模型更小、更便宜、還更好用?(來源:OpenAI、ZDNET)
阿里、騰訊都搶了,百度終於把"小龍蝦"塞進了小度音箱
中國AI圈這陣子有個新詞叫"養龍蝦"——OpenClaw是一個開源AI Agent框架,因為logo像龍蝦,被叫爆了。騰訊最先動,做了QClaw接入微信和QQ;阿里隨後跟上。3月17日,百度宣佈將OpenClaw整合進旗下小度(Xiaodu)智能音箱,讓小度變成一個語音控制的Agent遙控器,用一句話就能觸發跨應用的複雜任務。(來源:Bloomberg)三大廠同台,百度靠的是硬體入口:小度的螢幕和麥克風,是其他兩家沒有的物理觸點。
但有趣的是,在這場搶跑裡,百度的AI雲收入剛剛同比增長38%,OpenClaw的整合宣佈同一天發佈,時機選得極準——用一個熱詞捆綁一個財報數字,這是一種很熟練的敘事操作。問題是,把Agent塞進音箱和塞進聊天框,那個更容易讓使用者真的用起來?目前沒有任何資料,三家都在同一起跑線上等答案。(來源:Bloomberg)
阿里巴巴發佈"悟空"平台,讓AI幫企業打工——現在還在內測
阿里巴巴正式推出企業級AI平台"悟空(Wukong)",目前處於封閉測試階段。悟空的核心邏輯是協調多個AI Agent配合工作,處理文件編輯、表格操作、商業研究等複雜企業任務——不是一個聊天機器人,而是一套能"自己分工幹活"的Agent調度系統。(來源:Reuters)時間節點同樣刻意:剛好在中國agent熱潮爆發的那個當口,騰訊在聊,百度在跟,阿里這次選擇先做企業端。
悟空和同期宣佈的"Token Hub"是阿里AI戰略的兩面。Token Hub是整合阿里所有AI研究、消費者產品、AI應用的新業務集團,由CEO吳泳銘(Eddie Wu)親自掛帥,核心命題是AI變現。(來源:Bloomberg)悟空是變現的產品抓手,Token Hub是整合內部資源的組織容器——從架構上看,這是阿里把AI從"成本中心"推向"利潤中心"的一次整體操刀。但封閉內測的悟空究竟什麼時候能開放,阿里沒說。(來源:Reuters)
Manus突然下載到我電腦裡了!"My Computer"讓AI Agent徹底告別雲端
2026年3月16日,Manus正式發佈桌面應用,核心功能叫"My Computer"——可在Windows和macOS上運行,讓AI Agent直接訪問你的本地檔案、瀏覽器、應用程式,以及在你電腦空閒時自動幹活。這是Manus從雲端走向本地的關鍵一步。之前Manus能做的事,都發生在遠端沙盒裡;現在它可以直接讀你的項目資料夾、開你本地的IDE、在你不看螢幕的時候繼續工作。(來源:Manus官網、9to5Mac)這不是"助手",更像一個在你電腦裡常駐的無聲員工。
這件事最讓人不安的地方,恰恰是它最吸引人的地方——AI終於能碰你真實的本地資料了。雲端Agent和本地Agent的最大區別,就是這道"能不能接觸到你實際工作環境"的門檻。Manus選擇在這個時間點把門踢開,意味著Agent賽道的戰場從"在雲上幫你查資料",正式移到了"在你的電腦裡幫你幹活"。Cursor在程式碼領域已經打通了這一層,現在Manus要在更寬泛的通用任務上複製這條路——誰先讓使用者真的放心把電腦交出去,誰就贏了。(來源:Manus官網)
比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始
輝達在GTC 2026大會上宣佈:比亞迪、吉利、五十鈴、日產四大車企將採用其DRIVE Hyperion自動駕駛平台,支援Level 4等級無人駕駛車輛。同時,Uber與輝達擴大合作,計畫2027年上半年率先在洛杉磯和舊金山推出全端Robotaxi服務,並於2028年擴展至覆蓋四大洲的28個城市。(來源:Nvidia官方、The Verge)一次發佈會,輝達同時繫結了整車製造端和出行營運端——中美日的車企,全進了這張網。
這個陣容有點意思。比亞迪和吉利是中國新能源頭部,五十鈴是日本商用車代表,日產是傳統燃油巨頭——四種不同背景的車企,同時選了輝達的同一套平台,這本身就是一種背書。Waymo已經在舊金山和鳳凰城跑了好幾年,Cruise折戟,特斯拉Full Self-Driving還在講故事;輝達這次的策略不是自己造車,而是把自己做成Robotaxi時代的"底盤供應商"。2027年不到兩年,洛杉磯的街上會不會真的有Uber+輝達的無人車跑起來,值得盯著看。(來源:Reuters、The Verge)
騰訊QClaw內測,14億微信使用者的手機裡快要住進一隻"AI龍蝦"了
騰訊正在內測一款名為QClaw的產品——這是OpenClaw的微信/QQ雙端一鍵啟動包,讓使用者直接在微信聊天框裡調起AI Agent,完成本來需要跨多個App切換才能做完的任務。(來源:新浪科技、知乎)微信12億活躍使用者,QQ幾億年輕使用者,QClaw一旦全面上線,等於給OpenClaw這套開源框架接上了一個全球最大的流量入口。騰訊之前在AI產品上一直給人"慢半拍"的感覺,這次的動作算是把入口優勢打出來了。
但QClaw目前只是內測,預計"近期上線"——沒有正式發佈日期。在這條賽道上,阿里的悟空也在等開放,百度小度已經宣佈整合,OpenClaw在中國的生態正在被三大廠同時圈地。微信入口的流量是真實的,但Agent能不能在14億人的聊天框裡真正活下來,取決於它能不能在一個"對話"介面裡把任務做得比人工快。這一步,騰訊比阿里和百度都更有條件驗證——問題只是它動不動得快。(來源:36氪、財富號)
小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%
2026年3月16日,小米MiMo大模型負責人羅福莉與監管大學研究團隊聯合發佈ARL-Tangram系統,這是一套針對Agent強化學習的統一資源管理框架,核心數字是:將強化學習訓練步驟持續時長縮短至多1.5倍,節省高達71.2%的外部算力資源,同時在真實世界Agent任務上平均ACT提升4.3分。(來源:IT之家、新浪財經)簡單說,同樣的訓練效果,花的錢不到原來的三成。這在當下算力極度緊缺、訓練成本居高不下的背景下,是非常實際的突破。
但這篇論文更值得注意的,是它的位置。羅福莉是小米內部MiMo模型的負責人,ARL-Tangram發的不是產品,是學術論文——小米在用學術成果的方式宣示自己在大模型基礎研究上有真正的積累。三月的AI圈到處是"發佈會",小米選擇發一篇論文。在大廠裡,這種動作通常意味著:接下來會有更大的東西落地。算力成本降了70%,下一步的問題是,這個效率用在那裡?(來源:搜狐、IT之家)
Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻
2026年3月16日,月之暗面三位聯合創始人楊植麟、吳育昕、周昕宇與數十名研究員聯署,發佈了一篇純架構層面的技術報告。他們重新設計了大模型的核心結構——殘差連接(Residual Connection),這個元件自2015年引入Transformer以來,超過10年幾乎沒有人動過。Kimi的方案讓每一層能夠選擇性地關注此前各層的輸出,而不是統一求和,實驗結果是48B參數規模的模型訓練效率提升1.25倍。(來源:新浪財經、澎湃新聞)論文發出後,馬斯克本人評價"令人印象深刻",前OpenAI研究科學家Andrej Karpathy同樣給予好評。
這篇報告的戲劇性,不在於那1.25倍的效率提升,而在於它選擇攻擊的目標——一個10年沒人敢改的基礎元件。大多數模型創新發生在訓練方法、資料配比、規模擴展上;動架構本身,是風險最高也最難被外界驗證的路。三位聯合創始人都署名,不像是一篇普通論文,更像是一份聲明:Kimi在做自己的事,而不是跟在別人後面堆參數。馬斯克和Karpathy的背書,給了這篇論文在國際AI圈的能見度——但它能不能真正改變下一代模型的架構選擇,還需要時間驗證。 (AI Daily Insights)