#Gemini
Google跪了?400億砸向死敵!AI御三家終結,OpenAI孤立無援
Google豪擲400億美元加注Anthropic,自家Gemini正面對壘的「敵人」。當Claude年化收入一年暴漲30倍衝到300億,當算力成為AI下半場唯一硬通貨,與其用Gemini硬剛,不如把對手變成TPU最大買家。剛剛,Google開出了AI史上又一張「巨額支票」。將向Anthropic投入最高400億美元!100億美元立即到帳,按Anthropic 3800億美元的最新估值入股。剩下的300億美元繫結業績里程碑——只要Anthropic撞線,錢就到。更狠的是算力。Google雲承諾,未來五年向Anthropic交付5GW的計算能力,從2027年開始陸續上線。Anthropic的TPU使用規模會指數級擴張。這個數字什麼概念?相當於Google把整個DeepMind從成立到現在燒掉的錢,一次性再投一遍——但這次不是投自己人,是投外人。耐人尋味的是,Google手裡明明有DeepMind,有Gemini,有全球最大的TPU叢集。一個自家模型陣容已經夠豪華的公司,卻選擇用400億去加注別人家的Claude。Gemini模型對標的就是Claude。理論上,Anthropic是Google的直接對手。可現在,Google成了Anthropic的最大金主之一。有外媒稱這是Google的最新AI豪賭這套打法在AI圈很罕見:一家科技巨頭,明明手裡握著自家的旗艦模型,卻反手把巨額資金和算力傾倒給對面陣營。放在十年前的矽谷,這叫「認輸」。網友玩梗神圖御三家落幕,Anthropic陣營成型過去兩年,AI第一梯隊一直被定義為「御三家」。OpenAI、Google、Anthropic,三足鼎立,各自為王;當然還有馬斯克的xAI也在攪局。OpenAI靠GPT和ChatGPT先發佔位,背後站著微軟。Anthropic靠Claude在企業市場撕開口子,最初接受Amazon和Google兩邊的資金但保持獨立姿態。到了2026年4月這一周,這個敘事徹底散了。把Anthropic過去半年的金主清單列出來,會發現一個荒謬的現實:亞馬遜:50億美元現金 + 上限250億美元 + 5GW Trainium算力 + 1000億美元AWS採購合同;Google:100億美元現金 + 上限400億美元 + 5GW TPU算力;輝達:上限100億美元 + 1GW GPU供給;微軟:上限50億美元 + Anthropic向Azure採購300億美元算力。四家矽谷頂級玩家,全部在Anthropic的股東名冊上。僅僅4天前,4月20日,亞馬遜剛宣佈對Anthropic追加50億美元投資,並承諾總投資上限250億美元,外加Anthropic未來10年向AWS採購超過1000億美元的Trainium算力。Anthropic在4天內連收兩單「百億級」輸血。最戲劇性的是微軟。微軟手裡握著OpenAI最大外部股東的身份,轉頭還要給OpenAI的死敵投錢。這是「避險」的極端版本——OpenAI主導的Azure,居然也是Anthropic的一份算力供給。加在一起,Anthropic拿到了11GW以上的累積算力承諾,三套不同體系的晶片同時供給,任何一家斷供都不致命。剩下的OpenAI呢?它的核心算力來自Stargate項目——5000億美元的龐大基建計畫,落地周期長達數年。微軟不再是Stargate的獨家供應方,OpenAI還要找Oracle、軟銀、阿聯多方拼算力。格局已經從「三家分天下」,變成了「Anthropic vs OpenAI」的兩強對壘。御三家的說法,作古了。儘管Google在AI模型領域是直接競爭對手,但它也是Anthropic的關鍵基礎設施供應商。Anthropic嚴重依賴Google雲提供晶片和基礎設施,包括使用Google的張量處理單元(TPU)——這些專為AI工作負載設計的專用晶片,被視為輝達熱門處理器的最佳替代品之一。Google的算盤:與其硬剛,不如借力Google願意往死敵身上砸400億,看三個數字就懂。第一個:Anthropic 2026年3月的年化收入(ARR)突破300億美元。2025年初Anthropic的ARR還只有10億美元規模。一年時間,30倍。Claude Code從程式設計師社區出圈,企業管道全面開放,B端客戶從初創公司到財富500強一把抓。第二個:Anthropic在二級市場的隱含估值已經飆到1兆美元。這是Bloomberg和Tom's Hardware援引的二手市場資料。Anthropic的二級市場估值,已經壓過了OpenAI在AI業務部分的估值。第三個:Google今年的資本開支規劃是1850億美元(1750億到1850億之間)。這筆錢大部分要砸在資料中心、TPU生產、電力上。如果TPU沒有大客戶去消化,那就是最貴的庫存。Anthropic既是B端使用Claude企業客戶的導流入口,也是GoogleTPU產能的最佳壓艙石,一舉兩得。放在一起看,Google把對Anthropic的入股,做成了「輸不起就買進來」的避險操作。如果Anthropic真的贏了AI企業市場,Google至少能拿股權回報;如果Gemini跑出來了,Google兩頭贏;如果Gemini沒贏,那至少TPU出貨穩了,AI業務也能借Anthropic站穩腳跟。Gemini發佈兩年多,在企業級AI市場的開發者份額一直被Claude壓制。Claude Code在程式設計師群體裡的滲透率直接碾壓Gemini的同類產品。Google內部一直在重組Gemini團隊,但效果有限。繼續硬剛,不如借力打力。算力,AI產業新的護城河這場連環投資,背後真正的主角是算力。Anthropic在公開聲明裡點出了關鍵詞:infrastructure strain(基礎設施壓力)。這個表述來自Anthropic 官方部落格(2026年4月20日,與亞馬遜合作公告),原文是:我們的運行率收入現已超過300億美元,從2025年底的約90億美元增長。這種速度的增長給我們的基礎設施帶來了不可避免的壓力(inevitable strain);特別是我們前所未有的消費者增長,影響了free、Pro、Max等等級的可靠性和性能。Claude在企業、開發者、消費端的需求暴漲,自己的算力快撐不住了,必須找外援。把數字加起來看:亞馬遜承諾5GW的Trainium算力,Google承諾5GW的TPU算力,輝達供應最高1GW的GPU。合計11GW以上的累積算力承諾。這相當於10個核電站的發電量。OpenAI宣佈的Stargate項目目標也是10GW算力,但要數年內才能落地。Anthropic用了一周時間,就把同等量級的算力鎖在了手裡。OpenAI走的是另一條路:押注Stargate的5000億美元長期基建。這條路最大的問題在於落地周期。Stargate全面達產要等到2029年前後,而第一座Texas資料中心截至2026年4月,物理進度依然緩慢。算力,已經從基礎設施成本變成了AI公司的核心戰略資源。誰先鎖住算力,誰就有底氣推下一代模型。最尷尬的角色,其實是OpenAI過去兩年,OpenAI一直在試圖擺脫對微軟的依賴。奧特曼到處找錢,從阿布扎比到軟銀,融資規模一輪比一輪大。原因很簡單——微軟既是投資人又是競爭對手,Azure上跑著OpenAI的模型,也跑著微軟自己的Copilot。這種關係從第一天起就彆扭。現在Google用400億把Anthropic徹底鎖死,OpenAI的處境更微妙了。微軟還會像以前那樣全力支援嗎?還是說,微軟也會開始找自己的「Anthropic」?熟悉科技史的人會想起一個幾乎一模一樣的劇本。2000年代初,英特爾和AMD打得不可開交,但真正改變格局的不是誰的晶片更快,而是誰繫結了更多的生態夥伴。英特爾贏了,不是因為技術碾壓,是因為它把整個PC產業鏈都拉進了自己的陣營。Google現在干的是同一件事。它不再試圖用Gemini單挑Claude和GPT,而是把Anthropic拉進自己的算力生態,用基礎設施的優勢鎖定AI競賽的下半場。這事兒放進更大的坐標系裡看,400億隻是開胃菜。OpenAI被孤立,下一個百億金主難尋Anthropic的算力問題被解決了。OpenAI自己的算力問題,反而開始凸顯。Stargate項目過去半年頻繁出現資金缺口的傳聞。微軟不再是OpenAI的獨家算力供應方,軟銀承諾的資金至今還在分批到帳。OpenAI正在向中東主權基金、阿聯AI公司G42、沙烏地阿拉伯PIF等多方尋找新的資金來源。OpenAI的下家,目前看不清。OpenAI不是沒有金主——SoftBank、Oracle、MGX、輝達都在,輝達甚至單獨承諾投1000億美元,但這些資金大部分仍要靠Stargate這個執行不確定的載體落地。Anthropic四天搞定的事,OpenAI幹了一年還在協調。如果說Anthropic找到了Amazon、Google、Microsoft、Nvidia四重靠山,那OpenAI還需要在主權資本和雲巨頭裡再找一個等量級的合作夥伴——而且要快。更深層的問題是,OpenAI的傳統優勢在變弱。GPT-5.5上線後,單點性能依然領先,但Claude Code在Coding場景、Claude在企業級應用裡的份額持續蠶食OpenAI的護城河。奧特曼最近頻繁提到OpenAI的核心競爭力將轉向AI Operating System,但OS要落地,需要的不是模型領先,而是開發者生態加基礎設施。Anthropic陣營,把雲巨頭和算力都打包了。Benchmark分數已經決定不了AI產業的勝負。這場洗牌的真正賽道,是現金+算力+生態的三線博弈。Google投出400億的那一刻,第一回合的勝負判定已經寫好了。OpenAI該急著找下家了。 (新智元)
剛剛,Google發佈第8代TPU,算力怪獸、性能爆表!
目錄為訓練而生的 TPU 8t專注代理式 AI 及推理需求的 TPU 8i與 Gemini 共同設計、支援廣泛開發框架最大化能源效率Google Cloud 的 TPU 以往都是採用單晶片兼具訓練及推理功能的設計,不過在 Google Cloud 年度盛會 Google Cloud Next '26 上,宣佈推出兩款差異化的第 8 代 TPU 產品,攜手 Google DeepMind 開發針對訓練的 TPU 8t 以及針對推理的 TPU 8i。Google強調通過針對 AI 兩大核心任務不同的執行需求進行最佳化設計,進一步將性能發揮到極致。同時 Google 也強調兩款晶片都能運行各類 AI 負載,只是在各自擅長的領域表現更強。為訓練而生的 TPU 8t▲用於訓練的 TPU 8t Pod 晶片總量雖未翻倍,但晶片互聯及叢集互聯頻寬大幅提升、FP4 性能顯著增強。TPU 8t 旨在處理大規模、計算密集型訓練任務,提供更高的計算吞吐量與可擴展頻寬,滿足 AI 模型訓練需求,單晶片配備 216GB HBM。Google 表示,基於 TPU 8t 的 Pod 相較上一代產品性能提升 3 倍,可將模型開發周期從數月縮短至數周,並儘可能提升能源效率。TPU 8t 可擴展至 9600 顆晶片與 2PB 的 HBM 記憶體,晶片間頻寬相較上一代提升兩倍,可實現高達 121 ExaFlops 的算力,讓超大型模型能夠使用統一的超大記憶體池。此外,TPU 8t 還整合了速度提升 10 倍的儲存訪問,通過 TPUDirect 讓資料繞過 CPU 直接進入 TPU,進一步提升計算效率。借助 Google 全新 Virgo 網路以及 JAX、Pathways 軟體,TPU 8t 可在包含百萬顆晶片的叢集中實現近乎線性的性能擴展。同時,TPU 8t 通過 RAS 功能保障可靠性,包括對數萬顆晶片即時監測、自動檢測並在不中斷作業的情況下繞過故障 ICI 連接,以及 OCS 光路交換任務等自主維護機制,將硬體故障對叢集及訓練的影響降至最低,力爭實現超過 97% 的有效吞吐量。專注代理式 AI 及推理需求的 TPU 8i▲由 TPU 8i 構成的推理 POD 規模更大,無論記憶體容量、頻寬還是推理性能均大幅提升。TPU 8i 是面向 AI 推理與代理式 AI 服務開發的晶片,擁有更高記憶體頻寬與極低的推理延遲。通過解決記憶體傳輸瓶頸、搭配 Axion CPU 架構、針對 MoE 混合專家模型最佳化及降低延遲等四項關鍵技術,為新一代代理式 AI 及 AI 推理需求實現最佳化設計,綜合使每美元效能提升 80%,企業可用相同成本服務兩倍的使用者。TPU 8i 搭載 288GB HBM 記憶體與 384MB 片上 SRAM,解決記憶體傳輸瓶頸,容量相較上一代提升 3 倍,幾乎不會出現等待記憶體傳輸的閒置情況。同時,TPU 8i 伺服器物理 CPU 數量相較上一代增加一倍,採用基於 Arm 指令集的 Google 定製 Axion 架構,通過非均勻記憶體架構(NUMA)隔離,進一步擴展性能。MoE 混合專家模型是代理式 AI 的發展趨勢,由多個小型專家模型組成,僅在需要時載入相關模型,執行混合任務時無需在多個模型間切換。Google 將 TPU 8i 的晶片互聯頻寬提升至 19.2TB/s,相較上一代翻倍,確保多顆 TPU 8i 組成的系統具備統一、低延遲特性,媲美大型單晶片。此外,通過片上 CAE(集體加速引擎)解除安裝全域操作,可將晶片延遲降低 5 倍,大幅縮短響應時間。與 Gemini 共同設計、支援廣泛開發框架▲無論是 TPU 8t 還是 TPU 8i,均可運行所有 AI 任務,架構則分別針對訓練與推理場景最佳化。兩款第 8 代 TPU 晶片均與 Gemini 協同設計,其中 Boardfly 拓撲結構為滿足當前最強推理模型的通訊需求而設計,TPU 8i 的 SRAM 容量則依據量產級推理模型的 KV 快取佔用空間確定,Virgo 網路架構的頻寬目標則根據兆參數訓練的平行性需求制定。同時,TPU 8t 與 TPU 8i 均搭配 Google 定製 Axion CPU 系統運行,實現系統級最佳化。兩款平台均原生支援 AX、MaxText、PyTorch、SGLang、vLLM 等常用框架,支援客戶無需虛擬化直接訪問硬體,同時開源了 MaxText 參考實現與用於強化學習的 Tunix 等相關資料。最大化能源效率:第4代液冷▲Google 強調從 CPU、TPU 到系統設計全程自主把控,實現能源效率最大化,圖為 TPU 8 系列採用的第 4 代液冷架構。面對 AI 資料中心因海量算力需求帶來的能源緊張問題,Google 表示,TPU 8t 與 TPU 8i 相較代號 Ironwood 的第 7 代 TPU,能源效率提升兩倍,最佳化覆蓋整體架構設計、整合可即時動態調節功耗的電源管理等方面。同時從晶片到資料中心實現全系統級能效最佳化,例如將網路連線與計算整合在同一晶片,降低 TPU 晶片資料傳輸能耗,並圍繞 TPU 協同設計資料中心架構,最終相較五年前每單位電力算力提升 6 倍。TPU 8t 與 TPU 8i 採用 Google 第 4 代液冷散熱架構,實現傳統風冷難以企及的高性能密度。加上從 CPU、TPU 到整機系統的全鏈路自主設計,達成傳統分體式主機與晶片方案無法實現的高效能表現。 (芯榜+)
2025全球AI平台TOP10對比:國外巨頭霸榜,國內選手突圍,出海藏著最大紅利
2025年,AI行業徹底告別野蠻生長,全球平台格局塵埃落定。一邊是OpenAI、Google等國外巨頭牢牢把持流量大盤,通用大模型一家獨大;另一邊是國內AI廠商依託本土生態奮起直追,走出差異化路線。今天拆解國外AI平台TOP10、國內AI平台TOP10,深挖兩者核心差異,幫你看清當下AI賽道最值得抓的出海機會。一、2025國外AI平台TOP10:通用大模型壟斷,流量碾壓級領先國外AI市場依舊是技術驅動+全球化的天下,頭部平台月訪問量以十億為單位,使用者付費習慣成熟,覆蓋全球全場景使用者,排名與核心亮點一目瞭然:1. ChatGPT(OpenAI)全球AI絕對龍頭,年度總訪問量高達633.32億次,月均超50億,佔據全球AI市場近8成份額,是全民級AI入口,通用對話、多模態、外掛生態全面領跑,無人能撼動。2. Gemini(Google)Google全力押注的AI產品,同比增速超560%,年度總訪問92.3億次,深度繫結Google搜尋、Android系統、辦公套件,多模態能力突出,是ChatGPT最強勁對手。3. Grok(X AI)依託X(原Twitter)社交生態崛起,年度總訪問20.67億次,主打即時熱點互動、搞怪對話,年輕使用者與社交場景粘性拉滿。4. Perplexity AIAI即時搜尋賽道頭部,年度總訪問17.4億次,精準抓取全網最新資訊,無需使用者自行篩選,學生、職場人、內容創作者首選。5. Claude(Anthropic)長文字處理天花板,年度總訪問15.4億次,同比增長超130%,主打企業級安全合規,處理長文件、複雜邏輯、隱私內容優勢顯著。6. Character.AIAI角色陪伴賽道爆款,月活近6000萬,主打虛擬角色互動,情感陪伴、趣味聊天屬性強,Z世代使用者佔比極高。7. Canva AI設計類AI工具TOP1,月活8400萬,將AI生成與可視化設計結合,零門檻做海報、圖文、視訊,全民設計剛需工具。8. Suno AIAI音樂生成黑馬,月活428萬,輸入文字就能生成完整歌曲,詞曲唱一體,短影片BGM、個人音樂創作神器。9. Runway MLAI視訊編輯標竿,月活380萬,文生視訊、視訊剪輯、特效生成一步到位,海外短影片創作者必備。10. Notion AI辦公協作AI利器,月活350萬,嵌入筆記、任務管理、團隊協作全流程,AI輔助寫作、總結、規劃,企業效率神器。二、2025國內AI平台TOP10:生態繫結為王,本土化深耕突圍國內AI平台避開通用大模型的全球內卷,依託網際網路大廠生態+本土化剛需實現突圍,主打全民易用、場景貼合,月活以億級為核心梯隊,排名與優勢清晰可見:1. 豆包(字節跳動)國內原生AI APP第一名,月活1.72億,依託抖音、今日頭條生態,覆蓋全民日常對話、內容創作、生活諮詢全場景,易用性與使用者規模雙第一。2. DeepSeek(深度求索)技術派代表,月活1.45億,開源生態成熟,全球化佈局增速驚人,專業程式碼、複雜邏輯處理能力突出,深受極客與開發者認可。3. 通義千問(阿里)阿里生態專屬AI,月活1億,深度繫結電商、辦公、本地生活場景,AI客服、商品文案、店舖設計等電商相關能力拉滿。4. 文心一言(百度)搜尋+AI雙入口,月活0.88億,依託百度搜尋的資訊整合能力,在知識問答、學術查詢、政企服務領域佈局深厚。5. Kimi(月之暗面)長文字垂直賽道黑馬,月活4400萬,超長上下文處理、程式碼解讀、文件總結能力出眾,職場與學生群體口碑爆棚。6. 騰訊元寶騰訊社交生態AI,月活4286萬,聯動微信、QQ,社交場景賦能、日常助手功能突出,使用者觸達效率極高。7. 夸克AI(阿里)輕量搜尋型AI,月活3900萬,介面簡潔、響應快速,主打移動端輕量化體驗,海外市場表現同樣亮眼。8. 訊飛星火語音AI龍頭,月活3600萬,依託科大訊飛語音技術,在教育、辦公、語音互動領域深耕,多模態語音能力領先。9. 百度網盤AI工具場景繫結型AI,月活3200萬,聚焦檔案處理、內容總結、圖片識別,依託網盤海量使用者,留存率極其穩定。10. 360智腦安全+AI雙屬性,月活2800萬,主打安全搜尋、本地隱私處理,政企與安全敏感場景信任度高。三、中外AI平台核心差異:3點不同,決定出海破局方向對比兩份榜單,差距與機會一目瞭然,這也是我們做AI垂類應用出海的核心依據:1. 流量體量:差距超3-10倍,垂類是唯一破局口國外頭部平台流量呈碾壓級優勢,ChatGPT單月流量,相當於國內TOP5平台總和的3倍以上。國內平台雖增速快,但僅侷限於本土市場,全球流量佔比極低。核心機會:放棄通用大模型內卷,聚焦小而美垂類AI(助眠、變聲、冥想、香氛推薦等),這類產品國外競爭小、流量成本低,極易通過投放起量。2. 發展路線:技術全球化VS生態本土化國外AI平台純技術驅動,主打全球化覆蓋、付費訂閱變現,面向全球使用者做通用能力,商業模型成熟。國內AI平台生態繫結驅動,依託大廠本土生態,聚焦國內剛需場景,免費+會員模式為主,全球化佈局起步晚。核心機會:複製國外垂類AI的成功邏輯,結合國內輕量化開發優勢,做海外本土化改款,快速搶佔全球增量市場。3. 使用者與變現:C端付費成熟VS剛需場景滲透國外C端使用者AI付費意願極強,訂閱、內購變現順暢,垂類AI使用者復購率高;國內以免費使用為主,變現依賴廣告、生態內轉化,付費意識偏弱。核心機會:我們主打海外垂類AI,直接對接成熟付費市場,搭配網盟流量、精準投放,變現效率遠高於國內市場。四、結語:2025AI最大紅利,藏在垂類出海裡2025年全球AI格局早已定型:通用大模型紅海廝殺,垂類小工具藍海淘金。國外巨頭霸佔通用賽道,但無暇顧及細分小場景;國內廠商深耕本土,卻錯失海外付費紅利。AI賽道從不缺機會,缺的是找準細分賽道、快速落地的眼光。2026年,垂類AI出海,必將迎來真正的爆發! (美瀾科技)
Google太狠了!要統治幾十億手機
在上月底舉辦的三星 Galaxy S26 發佈會上,三星和Google官宣將在 Galaxy S26 上首發基於 Gemini 的 Screen Automation(螢幕自動化)的能力。簡單來說,就是 Gemini 可以直接在手機螢幕上操作應用:打開 APP、識別螢幕、點選滑動、輸入文字……完成一連串 UI 操作,最後再把確認步驟交給使用者。圖片來源:三星沒錯,聽起來就和努比亞 M153(坊間俗稱「豆包手機」)上的豆包手機助手一樣,都是能替代人類在手機上進行「代理」操作,實現一句話點外賣、叫車、網購等需求。從海外媒體和論壇的反饋來看,這項功能終於在最近的測試版更新中上線了。不過我們也發現,Google並沒有全盤學習豆包手機助手的做法。雖然在技術實現路徑上同樣基於 GUI 的 Agent,但 Gemini 會基於 Android 開啟一個本地的虛擬沙盒,同時還主動限制了首批開放 Gemini「操作」的 APP,僅限少數一批應用。這種處理方式與國內廠商顯然不太一樣。甚至可以對比字節的豆包手機助手和阿里的千問,Google選擇了一條看起來既激進、又保守的路線。讓 AI 作業系統,而不是接管手機只看功能表面,Gemini 的「螢幕自動化」很容易被理解為另一種「豆包手機助手」。它同樣可以替你點外賣、叫車、下單,看起來也像一個能替人操作手機的 AI 代理。但如果把視角往下再挖一層,就會發現Google的方案其實完全不是一回事。豆包手機助手的邏輯很簡單:AI 讀取螢幕像素,像人眼一樣識別按鈕和輸入框,然後模擬手指點選。這種方式最大的優點就是通用——理論上任何 APP 都能操作,因為 AI 看到的只是螢幕。Gemini 明顯更「保守」。在實際執行任務時,Gemini 並不會直接在你的手機桌面上操作應用,而是會在 Android 系統裡開啟一個本地的虛擬沙盒窗口,讓 AI 在這個環境裡運行目標 APP。整個過程是可見的,使用者可以隨時終止任務,也可以在任何一步接管操作。圖片來源:Android Central簡單來說,Gemini「螢幕自動化」在產品定位上並不是一個可以隨意操控手機的萬能代理,而是一個被系統嚴格約束的自動化能力。Google還主動限制了第一批支援自動化的應用數量。目前開放的主要是打車、外賣和餐飲類服務,僅支援 Lyft、Uber、GrubHub、DoorDash、Uber Eats 和星巴克。也限制了「使用者範圍」。目前除了三星 Galaxy S26 系列已經可以在測試版中體驗,Google也僅規劃了 Pixel 10 系列支援,同時 Gemini 免費使用者每天僅有 5 次使用額度、Plus 會員 12 次、Pro 會員 20 次、Ultra 會員 120 次。這裡既有算力的考量,也在於使用者對 AI「亂動手機」的擔憂,尤其是在歐美市場。所以Google做了權限隔離、關鍵步驟必須要使用者手動操作、可以即時中斷 AI 操作等。但說到底,這只是過渡階段,Google的野心絕不止是讓 Gemini 僅僅能夠操作幾個特定 APP。圖片來源:Google很多人注意到 Gemini 的 GUI 操作能力,卻忽略了 Android 在系統層面正在發生的一件事情。就在三星 Galaxy S26 系列發佈會前夕,Google官方發佈了一篇博文名為《智能作業系統:讓 AI 代理對Android應用更有幫助》,並正式推出了一套新的應用能力介面體系——AppFunctions,允許 APP 主動向系統聲明自己可以被 AI 呼叫的功能。舉個例子,一個外賣 APP 可以告訴系統:支援搜尋餐廳、加入商品、提交訂單這些能力。當使用者對 Gemini 說「幫我點一份披薩」時,AI 並不一定需要逐步點選介面,它可以直接呼叫這些能力完成任務。如果把這套機制理解成 AI 的「函數呼叫」,事情就變得非常清晰了。在Google的設計裡,AI 代理其實有兩條路徑可以執行任務,一種是通過系統介面直接呼叫應用能力,另一種才是通過識別螢幕介面來進行 GUI 自動化。前者效率更高、穩定性更好;後者則是為了相容那些沒有適配新介面的應用。這意味著 Gemini 未來的裝置自動化能力,本質上並不是單純的「AI 看螢幕操作手機」,而是一種系統 API 與 GUI 混合的架構。AppFunctions 的應用示例,圖片來源:雷科技這個差異聽起來有點技術化,但它背後的產品邏輯其實非常簡單。相比豆包手機助手讓 AI 像人一樣使用手機,Google想做的事情是讓 AI 像系統一樣調度應用。當 AI 只是讀取螢幕像素時,它始終站在系統之外,只能模仿人的操作邏輯;但一旦 AI 被放進作業系統內部,它就可以直接協調應用之間的能力。從這個角度看,Gemini Screen Automation 的真正目標或許並不是點外賣、叫車這些場景。Google真正想建立的,是一種新的 Android 運行邏輯和生態。從這裡出發,我們也能在一定程度上明白,為什麼Google要和高通聯手推動「Android電腦」(非 Chromebook)。也解釋了為什麼 Gemini 的方案看起來既激進又保守。激進的地方在於,它試圖把 AI 變成 Android 的調度中心;保守在於,Google並不打算讓 AI 隨意接管整個手機,而是通過系統介面、權限控制和應用白名單,一步一步推進這種變化。相比「萬能 AI 代理」的想像,這種路線顯然更慢,也更克制。但對於一個擁有數十億裝置的作業系統來說,Google可能也沒有太多激進試錯的空間。豆包向左,千問向右,Gemini 走中間相比Google在手機上的做法,去年底亮相的豆包手機助手選擇了最簡單、也最激進的一種方式:讓 AI 像人一樣使用手機。在這套方案裡,AI 讀取螢幕像素,識別按鈕、輸入框和頁面結構,然後模擬手指點選完成操作。無論是點外賣、比價購物還是下單支付,AI 都是在手機介面上一步步執行。這種方式最大的優勢就是通用。因為 AI 看到的只是螢幕,它不需要任何 APP 的介面支援,也不需要平台授權。理論上,只要是人能操作的應用,AI 都可以完成同樣的操作。這也是為什麼很多人第一次體驗豆包手機助手時,會覺得它像一種「真正的 AI 手機」。圖片來源:豆包但問題也同樣明顯。當 AI 可以讀取整個螢幕並操作所有應用時,權限和安全問題就不可避免。同時,很多網際網路平台也並不歡迎這種自動化行為,因為它繞過了平台自身的入口和推薦體系。簡單說,豆包的路線技術上非常直接,但也天然會和應用生態產生摩擦。相比之下,阿里的千問走的是另一條思路,利用阿里自己的服務生態,讓 AI 成為一個調度中心。在這套體系裡,使用者的一句話會被拆解成具體任務,然後分別呼叫淘寶、支付寶、高德、飛豬等服務來完成。比如搜尋商品、下單支付、規劃路線,都是直接呼叫真實業務能力,而不是模擬介面操作。因為所有操作都發生在生態內部,AI 不需要繞過應用權限,也不會觸發平颱風控,又因為直接呼叫服務介面,執行效率往往也更高。圖片來源:雷科技但問題同樣清晰:生態邊界。千問能夠調度的服務,本質上還是阿里系應用。一旦使用者需求涉及其他平台,能力就會明顯下降。從這個角度看,豆包和千問其實代表了兩種非常典型的 AI 代理路徑。前者試圖讓 AI 接管手機本身,追求的是通用能力;後者則通過生態整合,讓 AI 接管服務流程,追求的是業務深度。而Google的 Gemini,某種程度上站在二者之間。在當前階段,Gemini 依然保留了 GUI 自動化能力,這意味著它在必要時也可以像豆包一樣,通過識別介面來操作應用。但與此同時,Google又在 Android 系統裡引入了新的應用能力介面,讓 APP 主動向系統開放可以被 AI 呼叫的功能。如果應用支援這些介面,Gemini 就不需要再逐步點選介面,而是可以直接呼叫應用能力完成任務。換句話說,Google的方案其實是一種混合路徑:系統介面優先,GUI 自動化兜底。從短期來看,這種方式顯然沒有豆包那樣驚豔,也不像千問那樣能夠迅速整合成熟生態。但它的好處在於,既避免了和應用生態的正面衝突,又保留了足夠的通用性。寫在最後把視角再拉遠一點,其實不難理解三種路線為什麼會分化成現在這樣。字節沒有作業系統,也沒有本地生活生態,所以只能讓 AI 直接接管手機;阿里擁有龐大的服務體系,於是讓 AI 去調度自己的業務網路;而Google真正擁有的,則是 Android 這個覆蓋數十億裝置的作業系統。因此,Gemini 的目標從一開始就不是做一個更強的手機助手,而是把 AI 變成系統的一部分,讓 Android 從「運行應用的平台」慢慢變成「調度應用的智能系統」。從這個角度看,Gemini 的克制並不是保守,而更像是一種平台級公司的必然選擇。 (雷科技)
Gemini攻克「宇宙弦」終極難題!AI科學家最優雅解法震撼物理學
就在剛剛,Google Research團隊用Gemini Deep Think + 樹搜尋框架,獨立攻克了一個理論物理領域的未解積分難題——宇宙弦引力輻射功率譜的精確解析解。AI探索了600條候選路徑,找出6種解法,最優雅的那條,讓人類物理學家都拍案叫絕。震驚,AI科學家真的要來了!Google發佈了最新(3月6日)一篇論文,一石激起千層浪。Gemini Deep Think聯手樹搜尋演算法,獨立破解了理論物理的開放難題!一個人類頂級研究團隊公認「難得不知從那下手」的問題,被這套AI系統硬生生地解出來了。論文地址:https://arxiv.org/pdf/2603.04735這篇論文非常具有突破性!簡單來說,AI解開人類物理學家之前沒能解開的複雜數學/物理難題。聯想到此前,Claude幫高德納解決圖論猜想的消息刷屏。如果說高德納論文中Claude攻克圖論猜想,是AI在離散數學領域的突破。那麼Google這篇論文,則代表AI在連續數學和理論物理領域的全面進攻。一個是組合數學,一個是數學物理。兩件事幾乎同時發生,構成了2026年3月最具標誌性的「AI科學家」事件。AI,正在人類最核心的智力領域全面開花。宇宙弦 一個讓所有科學家著迷的終極問題宇宙弦(cosmic strings),是宇宙學中一種假設的一維拓撲缺陷結構,誕生於宇宙早期相變。這東西振動時,會向外輻射引力波。而近年來,脈衝星計時陣(Pulsar Timing Arrays,簡稱PTA)首次觀測到了疑似宇宙弦的引力波背景訊號,理論物理界因此對宇宙弦的研究熱情空前高漲。要預測宇宙弦發出的引力波訊號,就必須精確計算它的引力輻射功率譜(power spectrum)。具體來說,有一個核心積分 I(N, α)——描述宇宙弦環第N諧波發出的輻射強度。這個積分看起來簡單,但積分區域是個球面,被積函數在邊界處存在奇點(e₁,₂ = ±1時),導致標準數值積分根本不穩定。用經典的勒讓德多項式展開?權函數不匹配,爆炸。過去的研究,只能給出大N時的漸近解,或者奇數N的部分結果。精確、統一的解析解,多年來一直是懸案。直到Gemini Deep Think出手。一句話科普論文解決了什麼問題。AI計算出了一種名為「宇宙弦」發出的引力波的精確數學公式。為了計算這個引力波的功率,物理學家需要解開一個非常複雜的數學積分公式。這個公式裡有「奇點」(Singularities,類似於數學上除以0那種讓計算崩潰的地方),導致傳統的數值計算方法常常失效。在過去的幾年裡,人類物理學家和早期的AI嘗試過,但只找到了一些「部分解」或者「近似解」,一直沒有找到一個統一、精確的解析公式。難道人類科學家的問題被Gemini攻克了與Claude解決高德納問題時的31步研究式探索類似,Gemini解決這個問題的方式也非常像一個訓練有素的研究團隊在工作。Google團隊沒有讓AI裸奔。他們搭了一套精密的「神經符號系統」:Gemini Deep Think + 樹搜尋(Tree Search)+ 自動數值反饋三者缺一不可,協同作戰。Gemini Deep Think負責「大腦」:生成數學假設,進行符號推導,判斷那條路徑「看起來優雅可行」。它不是簡單地暴力試驗,而是被指示進行深度推理鏈,提前預判無窮級數展開時的收斂問題。樹搜尋(Tree Search) 負責「系統性探索」:把整個解題空間建成一棵大樹。每個節點代表一個數學中間表示式——用LaTeX寫出來,同時配上自動生成的Python程式碼,讓電腦去數值驗證。搜尋策略採用了PUCT演算法(置信上限樹搜尋),這和AlphaGo下棋的底層邏輯一脈相承——在「開採已有好路徑」和「探索新可能」之間保持平衡。自動數值反饋負責「質量控制」:每一步推導完成後,立刻用高精度數值計算去核驗符號結果是否正確。如果對不上,這條路徑直接砍掉。這一步最為關鍵:每當模型提出一個中間步驟,系統就會自動執行對應的Python程式碼,與高精度數值基準進行比較。如果發現數值不穩定、發散或執行錯誤,系統會把錯誤資訊和誤差反饋給模型,讓它自主修正。整個過程中,AI一共探索了約600個候選節點。其中超過80%被自動驗證器以「代數錯誤」或「數值發散」為由剪枝淘汰——包括災難性抵消誤差、不穩定的單項式求和、病態的基變換等。只有少數路徑,挺過了層層篩選,最終勝出。這不是暴力搜尋猜答案,而是真正的「AI驅動的數學研究」。600條路,AI找到了6種解經過系統探索,Gemini Deep Think一共找到了6種不同的解法,分為三大類:第一類:單項式展開(Monomial Basis Approaches)核心思路是把函數展開為冪級數,然後用不同的技巧計算積分。方法1用生成函數方法,構造指數型生成函數,利用高斯積分求解。方法2用高斯積分提升,把球面積分提升到三維空間中,轉化為標準的高斯積分。方法3是混合坐標變換,先展開為冪級數,再投影到Legendre基底上。這三種方法數學上正確,但存在數值不穩定性——當N變大時,會出現大數相減導致精度損失的問題。方法1:生成函數法(Generating Function)方法2:高斯積分提升法(Gaussian Integral Lifting)方法3:混合坐標變換法(Hybrid Coordinate Transformation)這三種方法都基於冪級數展開,思路紮實。但有個致命弱點:當N→∞時,數值不穩定,出現災難性抵消誤差。第二類:譜分解(Spectral Basis Approaches)這兩種方法利用了Funk-Hecke球面摺積定理,直接在Legendre譜空間中工作。方法4:譜Galerkin矩陣法,把問題轉化為一個三對角線性方程組來求解。方法5:譜沃爾泰拉遞推法(Spectral Volterra Recurrence Method),推匯出係數的前向遞推關係。這兩種方法數值穩定,計算複雜度僅為O(N),比單項式方法快了整整一個數量級。第三類:精確解析解(The Analytic Solution)方法6:格根鮑爾方法(Gegenbauer Method)這是最優雅的方法——Gegenbauer方法。AI發現了一個絕妙的思路:選擇Gegenbauer多項式作為展開基底,而這類多項式的正交權函數恰好是(1-t²),正好與被積函數分母中的奇異因子完全抵消!這樣一來,原本令人頭疼的奇異積分,變成了一個完全正則的積分。通過分部積分和標準恆等式,AI推匯出了精確的閉合公式,甚至最終得到了一個優美的漸近表示式。也是此次AI給出的王者之選。最優雅的解法,讓物理學家心動了格根鮑爾多項式,Gegenbauer polynomials,記作 Cₗ^(3/2)(t))。這是一種定義在[-1,1]上的正交多項式族,而它的權函數 w(t) = 1 - t²,恰好能自然地消去被積函數的奇點。這不是湊巧,這是Gemini識別出的深層數學結構。具體思路是這樣的:將被積函數 fN(t) 展開成格根鮑爾多項式的線性組合,利用正交性確定各展開係數。關鍵時刻到來——權函數與分母相消,原本讓人頭疼的奇點,就這樣被優雅地「吸收」進去了,留下的是一個完全正則的積分。隨後,借助恆等式 Cₖ^(3/2)(t) = Pₖ₊₁'(t)(格根鮑爾多項式與勒讓德多項式導數的關係),以及分部積分,積分進一步化簡為勒讓德多項式的傅里葉變換形式。最終,結果可以用餘弦積分函數Cin(z)精確表達——一個封閉的解析表示式,無需數值近似,適用於任意環幾何結構下的任意N。Google團隊在論文中寫道——格根鮑爾方法是這6種解法中最優雅的,因為它在數學上最自然地處理了積分的奇點結構。更驚豔的是:在尋找大N漸近行為時,Gemini還自主發現了與量子場論中費曼參數化的內在聯絡——這是一個跨越物理子領域的深層數學統一性,連人類研究者都沒有預先料到。人機協作,而非AI單打獨鬥要特別說明的是,Google團隊對這一過程的描述非常誠實——初始的6種解法,是樹搜尋框架自動找到的,格根鮑爾方法最初給出的是一個無窮尾和形式的精確解,數學上無誤,但不夠簡潔。為了把它化為真正的有限封閉形式,一位人類研究者手動介入,把中間結果喂給一個更大、更強的Gemini Deep Think版本,要求它嚴格驗證已有證明並尋找進一步化簡。在這次人機互動中,高級模型獨立發現了方法5(譜沃爾泰拉遞推法)初始表述中的一個錯誤,並在修正後識別出方法5和方法6的等價性——這使得方法6中的無窮尾和可以被精確「折疊」成有限形式,最終得到用餘弦積分表達的漂亮解析解。這是一次協同接力,而非完全自主的AI發現。但這反而更重要——它展示了一種真實可行的人機協作範式。Google團隊在結論中保持了科學謙遜:「我們並不聲稱這個物理問題本身具有深刻意義,但AI系統能夠輕鬆解決它,對於加速科學發現過程具有重要潛力。」但這句話的另一面同樣值得細品——所謂的「輕鬆」,是站在600次探索、80%淘汰率之上的。這不是聰明的運氣,這是系統化的智識搜尋。幾十年來,物理學家和數學家們普遍認為,符號推導、理論發現,是AI最難觸碰的聖域——因為這需要真正的數學直覺,需要從茫茫解法空間中識別出「優雅」。但格根鮑爾方法告訴我們:AI正在發展出某種類似直覺的能力。它不是隨機試錯,它在評估解法的優雅程度,在識別數學結構的深層美感。這一次,是宇宙弦的引力波譜。下一次,也許是弦論中更深的方程,也許是量子引力中的核心積分。人類提出問題,AI系統化探索結構,人類完成最後的意義詮釋——這種新型科研模式,已經不再是科幻,而是正在被Google用一篇論文,白紙黑字地寫下來。「神經符號系統」,AI科學發現的基礎設施值得關注的是,這篇論文所使用的樹搜尋框架,並非一次性的專項工具,而是有系統性方法論的可復用框架。Google團隊在附錄中詳細公開了:完整的系統提示詞(System Prompt)評估驗證的程式碼實現「負向提示」(Negative Prompting)策略——這是強制AI探索不同解法方向的關鍵技巧所謂負向提示,就是在AI找到一個有效解法後,明確告訴它「不要再用這個方法」,強制它另闢蹊徑,繼續探索——這樣才有了從方法1到方法6的多樣解法。這種方法論本身,就是一個可以遷移的科研工具。今天用於宇宙弦,明天可以用於材料科學、量子化學、純數學中的未解猜想。AI正在叩開理論物理的大門回顧這件事,有一個細節讓人印象深刻。在機器學習領域,大家早就習慣了AI能做的事:識別圖片、生成文字、下棋、寫程式碼……但推導符號數學、獨立識別數學結構的奇點並找到消除它的優雅方法——這件事,此前被認為幾乎不可能。因為數學發現不是搜尋,是「頓悟」。然而Gemini Deep Think的案例告訴我們——「頓悟」也許可以被分解成:足夠大的搜尋空間 + 足夠精密的評估標準 + 足夠強的推理能力。三者疊加在一起,就可以湧現出看起來像「直覺」的東西。AI,已經準備好成為數學家、物理學家以及所有科學家的最強搭檔。這,也許真的只是一個開始。 (新智元)
【MWC 2026】全網最全:AI 徹底變天!中國軍團殺瘋全球!OpenClaw 屠榜封神!
最硬核現場!MWC 被中國 AI 霸屏,機器人手機、人形機器人炸場2026 世界移動通訊大會(MWC)在巴塞隆納啟幕,恰逢落地 20 周年,以智能新紀元為主題,匯聚全球 2900 余家企業。展會聚焦 AI 與通訊深度融合,覆蓋 5G-A、6G、算力網路、衛星通訊、具身智能等前沿方向,是全球科技與產業的風向標。本屆展會看點密集、技術密集,深科技(deeptek)為你逐一拆解核心趨勢與重磅成果。01 開場炸:MWC 變中國主場!AI 從 “陪聊” 直接跳去 “幹活”2026 開年第一炸,不在矽谷,不在紐約,直接砸在西班牙巴塞隆納 ——MWC 2026 徹底被中國科技軍團包場。350 家中國企業擠爆展館,中文比西班牙語還高頻,老外排隊三小時就為摸一下中國 AI 手機、中國機器人、中國大模型。行業共識一夜改寫:AI 不再是聊天耍帥的花瓶,而是能動手幹活的工具人。從語音對話到自主操作裝置、跨 APP 執行、長鏈推理、自動完成複雜任務,2026 就是 AI 從 “聽懂” 到 “動手” 的元年。中國廠商不玩虛的,直接把未來端到全球面前,這波出海不是參展,是降維碾壓。02 OpenClaw 封神!GitHub 史上最瘋項目,中國模型殺穿榜單本屆最大黑馬不是手機,不是晶片,是OpenClaw—— 一個能直接操控你電腦的 AI Agent 神器。全球開發者集體瘋狂,卡帕西盛讚 “科幻級爆發”,直接登頂 GitHub 史上最受歡迎開放原始碼專案。簡單說:你說一句話,它幫你點滑鼠、敲鍵盤、跑程式碼、做表格、干雜活,全自動不廢話。誰能喂飽 OpenClaw,誰就是下一代 AI 王者。結果呢?中國模型直接屠榜。03 階躍星辰殺瘋!Step 3.5 Flash 碾壓 GPT/Gemini,海外開發者跪服3 月 2 日當天,階躍星辰 Step 3.5 Flash 單日呼叫破 40B,OpenClaw 呼叫榜全球第二。干翻誰了?Kimi K2.5、Gemini 3 Flash、Claude Sonnet 4.5……全是國際頂流。海外開發者用腳投票:這才是 Agent 時代該有的模型。硬核邏輯不講虛:1960 億總參數,每次只啟動 110 億,速度狂飆 350token/s消費級 128GB 就能跑,MacBook 直接起飛推理強、成本低、長任務穩到離譜老外直呼:中國模型才是 OpenClaw 真命天子。04 徹底開源殺招!階躍星辰把家底全甩出來,行業看傻更炸的是:別家開源遮遮掩掩,階躍星辰直接Base 權重 + Midtrain 權重 + Steptron 框架一次性全開源。開發者要啥給啥,隨便二開、隨便微調、隨便造自己的 Agent。在全球大模型開源越來越保守的今天,這波操作等於把通往未來的鑰匙直接塞給全世界。Reddit、LocalLLaMA 直接炸版,CTO 深夜線上答疑,中國技術團隊第一次成為全球開發者的 “精神領袖”。一句話:不是讓開發者適配模型,是模型跪下來適配開發者。05 手機徹底變異!榮耀機器人手機火到西班牙國王親自打卡手機圈十年死水,今年直接物種大爆炸。榮耀甩出王炸:全球首款可量產機器人手機 ROBOT PHONE。攝影機自帶 “脖子”,四自由度雲台,會轉頭、會跟拍、會點頭、會隨音樂跳舞。西班牙國王駐足看呆,這那裡是手機,是裝在口袋裡的機器人。榮耀直接喊出:打破黑色方塊,給手機加大腦、加手腳。AI 手機的終點,不是更聰明的助手,是擁有身體的智能生命。06 豆包殺瘋!中興努比亞 AI 手機,一句話全自動跨 APP 幹活字節跳動豆包聯手努比亞,直接把AI 原生手機帶到 MWC。不用點、不用切、不用手動操作,喊一聲:幫我發朋友圈 + 配文幫我全平台比價下單幫我點外賣AI 自動跨 APP 跑完所有流程,你只負責張嘴和確認。蘋果 Apple Intelligence 還在畫餅,中國廠商已經把體驗做滿。老外上手直接震驚:這才是 2026 年的手機。07 具身智能狂歡!中國人形機器人佔領展館,會打架會幹活MWC 六號館直接變成中國機器人閱兵場。智元機器人:全系列人形 + 四足 + 靈巧手,迎賓、搬運、工業通吃宇樹科技:機器狗載人、人形機器人現場 “搏鬥”魔法原子:機器貓熊、全尺寸人形炸場中國具身智能不再是實驗室玩具,能跑、能扛、能合作、能落地。目標很明確:搶歐洲市場,做全球夥伴。這波不是秀肌肉,是把未來生產力直接擺上貨架。08 網路革命!華為 AI 原生網路 + 靈衢匯流排,硬剛流量海嘯GSMA 主席潑冷水:AI 流量海嘯要壓垮網路。華為直接正面硬剛:別加寬管道,給管道裝大腦。AI-Centric Network,讓網路自己懂你、自動調度、自動開綠色通道。更狠的是靈衢 UnifiedBus:萬卡協同像一顆大腦,打破輝達算力壟斷。Atlas 950 SuperPoD 海外首秀,訓練 + 推理全端通殺。6G 前夜提前開戰,U6GHz 頻段卡位,中國廠商直接定義下一代網路。09 三大營運商亮劍!6G + 智算 + 全球生態,中國方案統治未來中國移動:5G-A 超級上行 + 百 T 級智算路由,算力效率拉滿 98%中國聯通:九大行業一站式出海方案,歐洲、東南亞遍地開花中國電信:聯手智元發佈6G + 四足機器人,把邊界從 3% 陸地擴到全域不再是管道商,是智能時代的架構師。雲 - 網 - 邊 - 端全鏈路打通,中國算力網直接走向世界。10 終局炸:2026 AI 分水嶺!中國從陪跑變領跑,全行業顫抖2025 是國產模型爆發年,2026 是中國 AI 統治年。大模型:階躍星辰在 OpenClaw 屠榜,中國開源征服全球開發者終端:機器人手機、AI 眼鏡、模組化硬體全面變異機器人:具身智能叢集出海,硬體 + 演算法雙殺網路:AI 原生 + 6G 卡位,重新定義通訊底層行業鐵律變了:不再比誰參數大,比誰能落地、能幹活、能普惠、能走進普通人生活。中國廠商走了一條最難、但最正確的路:用應用牽引技術,用落地定義未來。MWC 2026 已經說明一切:AI 的下一個時代,主場在中國。11、MWC 2026 核心公司總結一、AI 大模型 & 智能體(Agent)階躍星辰Step 3.5 Flash 開源模型在 OpenClaw 呼叫榜全球第二,單日呼叫超 40B架構:稀疏 MoE,總參數量 1960 億,每 token 啟動約 110 億速度:單請求程式碼類最高 350 token/s開源:Base 權重、Midtrain 權重、Steptron 訓練框架全開源定位:主打智能密度、推理速度、Agent 能力,面向 “讓 AI 幹活”字節跳動・豆包 AI與中興 / 努比亞合作推出豆包 AI 手機(海外首秀)功能:一句話語音指令,自動跨 APP 完成點外賣、發社交平台等定位:系統級 AI 助手,從 “陪聊” 走向自動執行阿里・千問發佈千問 AI 眼鏡,售價 1997 元,即將開售支援即時翻譯、語音助手、地圖、支付、識圖等後續將推出AI 指環、AI 耳機,打造軟硬一體 AI 入口小米・MiMo自研大模型躋身全球開源第一梯隊支撐人車家全生態:手機、汽車、智能家居全域協同推出全屋智能系統 Miloco:可自動感知、決策、調度裝置(如自動叫掃地機器人)二、手機終端創新榮耀全球首款機器人手機 Robot Phone:4DoF 雲台攝影機,可自動跟拍、點頭、律動首款消費級人形機器人,可跳舞、後空翻折疊屏 Magic V6 旗艦發佈vivoX300 Ultra 海外首秀全球首發 400mm 蔡司增距鏡,專業影像向 “生產工具” 升級中興 / 努比亞努比亞 M153 搭載豆包 AI 手機助手發佈 AI 情感寵物 iMoochi,主打治癒陪伴傳音(Tecno)4.9mm 超薄模組化磁吸手機,可外接鏡頭、電池、手把等模組聯想模組化 AI PC、AI Workmate 陪伴機器人捲軸屏筆記本、折疊掌機小米徠卡手機 LeitzphoneVision Gran Turismo 概念超跑三、人形機器人 & 具身智能智元機器人(AGIBOT)A2、X2、G2、D1 全系列機器人面向零售、製造、物流,主打 “能幹活”展示 6G + 四足機器人 方案宇樹科技G1 人形機器人,高動態對抗、抗摔、運動控制強魔法原子GEN1 全尺寸人形、MagicBot、MagicDog 四足機器人四、通訊 & 網路 & 6G華為AI-Centric Network(以 AI 為中心的網路)發佈 U6GHz 全場景產品,5G-A 向 6G 平滑過渡超節點 Atlas 950 SuperPoD,支援 8192 卡 高速互聯靈衢(UnifiedBus)高速互聯匯流排A2A-T 智能體互動協議開源中興通訊AIR MAX 面向 AI 時代的網路架構全球首個 U6G 6G GigaMIMO 原型首發 Wi-Fi 8 Mesh 方案Co-Sight 工業級智能體工廠高通成立 6G 聯盟,路線圖:2028 預商用,2029 商用X105 5G 數據機,支援 6G 標準可穿戴晶片支援本地運行 20 億參數 模型愛立信6G 原型、MRSS 5G/6G 頻譜共享AI Native Network、可程式設計網路諾基亞AI-RAN 與輝達合作自智網路、雲化基站三大營運商中國移動:5G-A 超級上行、百 T 級智算互聯裝置中國電信:量子通訊、衛星通訊、低空經濟中國聯通:算網、低空智聯、空天地一體化五、晶片 & 算力 & 儲存紫光展銳:eSIM + 基帶方案江波龍:AI 眼鏡、端側 AI 儲存聯發科:6G 互通方案、Wi-Fi 8、AI 眼鏡平台AMD:銳龍 AI PRO 400 系列六、深圳企業軍團(70+ 家)榮耀、華為、中興、傳音、TCL雷鳥創新:AR 眼鏡與德國電信合作領益智造:機器人核心部件(減速器、絲槓)時空壺:AI 同傳翻譯耳機七、本屆核心趨勢總結AI 從 “聊天” 轉向 “幹活”:Agent、具身智能、自動執行成主流終端形態革命:機器人手機、模組化、雲台手機、AI 眼鏡爆發網路 AI 原生化:從 5G-A 走向 6G,網路本身變智能中國廠商全球領跑:350 家參展,AI + 硬體 + 通訊全面出海開源大模型崛起:中國模型成為全球開發者首選 (深科技)
Google 發佈 Gemini 3.1 Flash-Lite:每秒 363 tokens,百萬 token 只要 $0.25
Google 剛發佈了 Gemini 3 系列的最新成員,Gemini 3.1 Flash-Lite,主打一個又快又便宜。這個模型有多快呢?輸出速度達到了 363 tokens/秒,而上一代 Gemini 2.5 Flash 是 249 tokens/秒,直接快了 45%。首個 token 的響應速度更是提升了 2.5 倍。簡單說就是,你話還沒問完,它答案都快出來了。價格也砍了快就算了,價格還降了。輸入 $0.25/百萬 tokens,輸出 $1.50/百萬 tokens。跟上一代比,輸入便宜了 17%,輸出便宜了 40%。這個價格在當前的大模型市場裡,已經屬於「白菜價」等級了。Google 的意思很明確:大規模呼叫的場景,用這個就對了。跑分不差便宜歸便宜,但跑分並沒有拉胯。在 Arena.ai 排行榜上拿了 1432 Elo,幾個關鍵基準測試的成績:GPQA Diamond(科學知識):86.9%MMMU Pro(多模態推理):76.8%Video-MMMU(視訊理解):84.8%MMMLU(多語言問答):88.9%LiveCodeBench(程式碼生成):72.0%Google 說它在推理和多模態理解上,超過了同等級的其他模型。考慮到它的價格,這個性價比確實有點離譜。動態思考Gemini 3.1 Flash-Lite 有個有意思的功能:動態思考等級(dynamic thinking levels)。開發者可以根據任務複雜度來調整模型的推理深度。翻譯、內容稽核這種簡單任務,用淺層推理就夠了,省錢省時間。生成 UI 介面、跑模擬這種複雜任務,就讓它深度思考。這就好比一個員工,簡單活兒不磨蹭,難的活兒也能啃下來,自己知道什麼時候該省力什麼時候該拚命。支援全家桶模態方面,Gemini 3.1 Flash-Lite 支援文字、圖片、音訊、視訊輸入,上下文窗口 100 萬 tokens,最大輸出 64K tokens。基於 Gemini 3 Pro 架構打造,該有的能力都沒縮水。誰在用幾家早期合作夥伴已經在用了,包括 Latitude、Cartwheel 和 Whering。反饋是:表現接近高端模型的水準,能跟複雜指令,能保持上下文理解。Google 給它定位的典型場景包括:大規模翻譯、內容稽核、客服系統、資料分析,以及任何對延遲敏感的即時應用。Gemini 3.1 Flash-Lite 目前已在 Google AI Studio 和 Vertex AI 上以預覽版提供。363 tokens/秒的速度加上白菜價的定價,Google 瞄準的就是那些需要大規模 API 呼叫的開發者和企業。 (AGI Hunt)
剛剛,GPT-5.3 新模型撞車 Gemini,OpenClaw:謝謝你們
在 AI 模型的命名玄學裡,「Instant」和「Lite」這兩個後綴,長期以來都帶著一股說不清道不明的廉價感。不是沒有原因。過去這類模型給人留下的印象,基本就是:速度快、腦子慢,做做文字總結勉強夠用,一旦碰上稍微複雜的推理任務,就開始一本正經地胡說八道。久而久之,輕量模型幾乎成了「將就用」的代名詞。就在剛剛,OpenAI 和 Google 又一次撞車,發佈了各自的輕量模型,並試圖用硬實力來扭轉這個刻板印象。省流版如下:GPT-5.3 Instant: 更具「人味兒」的智能助理,大幅降低幻覺率、減少「AI 腔」以及強化細節寫作能力,溝通更自然精準,適合對內容質量要求高的場景(寫作、專業問答、高風險領域)Gemini 3.1 Flash-Lite:便宜、快、不拖泥帶水,還支援「思考等級」調節功能,在保持高吞吐量的基礎上兼顧了深層邏輯推理,適合大規模、高即時性的批次任務(內容稽核、UI 生成、NPC 對話)GPT-5.3 Instant:終於學會像個正常人一樣聊天了經常用 ChatGPT 的人,大概都有過這種無奈:你只是隨口問個小問題,它非要先給你端上一段「作為一個人工智慧,我需要提醒你……」的長篇大論。這種總想教人做事的「AI 腔」,確實挺招人煩的。好在,OpenAI 這次是真的聽進去了。新上線的 GPT-5.3 Instant 花了很大的力氣來解決這個「毛病」。它學會了直接給出答案,不再囉里囉嗦地鋪墊。除了不愛說廢話,它也變得更靠譜了。舊版本搜完網頁之後,容易把一堆連結和不相關資訊堆到你面前。得益於搜尋能力的提升,GPT-5.3 Instant 會主動把網頁內容和自身的背景知識結合起來,先想清楚你真正想問什麼,再給出有重點的回答,而不是把搜尋引擎的工作原封不動地轉包給你。OpenAI 公佈的內部評測顯示,在聯網狀態下幻覺率降低了 26.8%,僅靠內部知識時也降低了 19.7%。官方特別提到醫療、法律、金融等高風險領域,新模型在這些場景下的謹慎程度和精準性都有明顯改善。最令人驚喜的,其實是它在寫作上的變化。OpenAI 用一首詩的對比做了說明:同樣寫一個費城郵遞員退休最後一天,舊版本傾向於堆砌「把這座城市背在郵袋裡」這類抒情句,新版本則會寫那根「掉漆的藍色欄杆」、那扇「總有狗在門口等著的柵門」。情緒不靠凹,就這樣自然而然流露出來。語氣上的調整也是此次更新的核心目標之一。「停下。深呼吸。」這類會打斷對話節奏的句式被刻意減少,整體風格更直接,少了一種不必要的「AI 腔」。使用者仍可在設定裡自訂回覆的溫暖程度與熱情度,調出自己習慣的互動風格。GPT-5.3 Instant 即日起向所有 ChatGPT 使用者開放,API 名稱為「gpt-5.3-chat-latest」。付費使用者還可以在舊版模型裡繼續用 GPT-5.2 Instant,但它將在今年 6 月 3 日正式退役。彩蛋時間Gemini 3.1 Flash-Lite:便宜、反應快,還挺聰明相比於 GPT-5.3 Instant 的好好說話,Gemini 3.1 Flash-Lite 走的是純粹的務實風,目標非常明確:就是要快,就是要便宜。價格方面,Gemini 3.1 Flash-Lite 的輸入價格是 0.25 美元每百萬 tokens,輸出價格是 1.50 美元每百萬 tokens。這是什麼概念?如果你是一個開發者,這意味著你大概花不到 2 塊錢人民幣,就能讓 AI 閱讀相當於 5 本《哈利·波特》全集的文字量。覺得便宜沒好貨?格局小了。根據 Artificial Analysis 的基準測試,,相比上一代的 Gemini 2.5 Flash,3.1 Flash-Lite 的首字響應時間(TTFT)快了 2.5 倍,整體輸出速度提升了 45%。對於需要即時響應的產品來說,這個延遲差距在使用者體驗上會有肉眼可見的感受。這意味著,當你還在眨眼的時候,它的回答可能已經生成了一半。對於那些需要即時反饋的應用——比如即時翻譯、遊戲內的 NPC 對話、即時 UI 生成——這種低延遲是決定性的。除此之外,Gemini 3.1 Flash-Lite 還具備「思考」能力。在 AI Studio 和 Vertex AI 中,Google 為這款 Lite 模型配備了「思考等級(Thinking Levels)」的選項。開發者可以根據任務的複雜程度,自主調節模型「想多深」。簡單的高吞吐量任務,比如批次內容翻譯和內容稽核,可以用最輕的配置快速跑完;遇到需要嚴格遵循指令的介面生成或模擬建立任務,則可以讓模型多花一點時間推理,把結果做紮實。這種「既要又要」的能力,也因此收穫了相當不錯的成績單。在 Arena.ai 的排行榜中,它的 Elo 分數達到了 1432,在 GPQA Diamond(研究生等級的問答)測試中拿到了 86.9% 的精準率。在學術評測 GPQA Diamond 上得分 86.9%,多模態理解 MMMU Pro 上達到 76.8%。這兩個數字不只是「在同檔位裡還不錯」,而是直接超過了體量更大的 Gemini 2.5 Flash。注意,這裡對比的是 Gemini 2.5 Flash 而非 Gemini 3 Flash,顯然雞賊的 Google 對這款模型也並未抱有多大的信心。目前,3.1 Flash-Lite 以預覽版形式通過 Google AI Studio 和 Gemini API 向開發者開放,企業使用者可通過 Vertex AI 接入。Latitude、Cartwheel、Whering 等早期合作夥伴已在生產環境中完成測試,普遍認可它在大規模呼叫下的穩定性和指令遵循能力。把這兩個模型放在一起看,你會發現「Instant」和「Lite」,或許正在找到自己最合適的位置。以最近大火的 OpenClaw 為例,其核心場景是幫使用者處理郵件、管理日程,本質上是一個需要自主執行任務的 Agent。這類產品對模型的要求,和普通 chatbot 聊天工具完全不同:它不需要模型表演得多聰明,它需要模型說人話、不出錯、還得扛得住高頻呼叫。GPT-5.3 Instant 顯著降低幻覺率,意味著 Agent 在自主執行任務時少犯錯;「AI 腔」的消退,意味著生成的郵件、文件讀起來更貼合真人的閱讀習慣。Gemini 3.1 Flash-Lite 則更符合最為關鍵的第三個需求。Agent 在後台狂奔時,往往需要平行處理海量的子任務,對響應速度和 API 成本極度敏感。Flash-Lite 極快的響應速度和白菜價的成本,加上能靈活調配算力的「思考等級」,這種極具彈性的架構對高並行的自動化任務而言,無疑是久旱逢甘霖。即便兩款模型的長期穩定性仍需觀察,但大方向已經很明確:一個負責讓互動更像人,一個死磕更快更省錢。在未來人手一隻「龍蝦」的情況下,輕量模型將成為更自然、務實的選擇。 (APPSO)