#阿里雲
平頭哥公佈AI晶片規劃,真武GPU已出貨56萬片
5月20日,在2026阿里雲峰會上,阿里發佈基於平頭哥新一代AI晶片真武M890的128卡超節點伺服器,搭載互聯晶片ICN Switch 1.0,通訊時延低至百納秒級,可讓128張AI晶片組成一台電腦,滿足海量Agent並行推理和大模型訓練需求。這是面向Agentic時代全面升級的重要部分,當天阿里雲推出了全新“芯-雲-模型-推理”技術體系。 Agentic時代,算力叢集需要承載成千上萬個Agent同時運行,每個Agent在一次任務中可能連續發起數十次模型呼叫,這對通訊時延和頻寬有極高要求。磐久AL128超節點伺服器基於自研AI晶片和互聯晶片打造,通過單機櫃128卡緊密耦合互聯,P2P時延低於150ns,單櫃頻寬達到Pb/s級,可支海量Agent的並行請求。該超節點伺服器已上線阿里雲百煉,支援Qwen、DeepSeek、Kimi等主流模型。 據介紹,首次亮相的真武M890採用自研平行計算架構,內建144GB視訊記憶體,性能是真武810E的3倍,片間互聯頻寬達到800GB/s,晶片原生支援FP32到FP4等多種資料精度,可應用於高精度訓練、低精度和超低精度推理的全場景,低精度推理場景下,不僅可以保證模型輸出質量,還能顯著降低單次推理的算力開銷。 平頭哥互聯晶片ICN Switch 1.0支援自研ICN互聯匯流排協議和PCCL通訊庫,吞吐量達25.6Tbps,可支援真武M890的高效互聯,提升AI叢集的算力效率。真武M890搭配ICN Switch1.0晶片,可實現64卡全頻寬互聯,顯著提升大規模智算叢集計算的效率與穩定性。基於平頭哥自研T-Head SAIL軟體棧的軟硬協同,可最大程度釋放晶片的算力。
中國 AI 漲價,美國使用者先慌了
3 月中旬,阿里雲、百度智能雲先後放了一個消息:AI 產品要集體漲價了,算力、儲存、大模型推理服務,全都在漲價名單裡。業內人士普遍認為,這標誌著中國雲市場正式進入漲價周期。有趣的是,這消息一出,這邊中國使用者倒是挺淡定,先慌的居然是美國使用者。你沒看錯,這些習慣用中國 AI 的美國工程師們,真的有點手忙腳亂。為什麼?得先看看過去兩年中國 AI 的價格史。從 2023 下半年到 2025 年,中國大模型廠商幾乎在玩“史詩級打骨折”。對標 GPT‑4 的主力模型,單價下調 90% 以上,輸入價格被媒體調侃成“美國同行的一個零頭”。有的廠商還直接放出大量免費額度,把中小開發者和初創公司全拉進自家陣地。各種研究報告和評論指出,中國雲和 AI 服務長期處於高投入、低價格狀態,大模型價格戰背後是資本撐著、用規模換市場份額。行業裡調侃一句:“美國在卷算力,中國在卷算力單價。”也正是在這種背景下,“China’s AI is cheap”幾乎成了美國使用者的默認印象。其實,美國使用者慌的不只是“價格上升”本身,而是過去兩年養成的習慣被打亂了。根據彭博社記者盧茲·丁(Luz Ding)一年的跟蹤報導,中國 AI 企業甚至刻意選在美國開發者的作息時間發佈新模型。目的很明確:方便給太平洋彼岸的開發者留,同時暗示:“來試用我們的模型吧。”不僅是線上推送,很多廠商還跑到舊金山灣區,扎堆參加技術沙龍、駭客松,甚至舉辦“麻將之夜”,獎品就是搭載中國模型的雲服務免費額度。效果立竿見影,美國創業者和工程師們很直接:“只要能幫我把 AI 成本砍下來,誰的模型都願意試。”Airbnb 首席執行長布萊恩·切斯基(Brian Chesky),也是 OpenAI 創始人薩姆·奧特曼(Sam Altman)的朋友。他透露,Airbnb 非常依賴阿里巴巴的 Qwen 模型,因為中國 AI 性能好、速度快、成本低。相比之下,他評價 ChatGPT 時表示:“我認為它還不夠好。”美國風險投資公司 16z 的合夥人馬丁·卡薩多(Martin Casado)也觀察到,大多數美國 AI 創業者都在用中國模型。“我估計他們有 80% 的機率在使用中國開源模型。”投資人 Chamath Palihapitiya(Social Capital)同樣坦言,他選擇用中國 Moonshot AI 開發的開源模型 Kimi K2 處理公司大部分工作。因為性能遠超 OpenAI,而且價格便宜得多。甚至在開發者圈裡,全球主流 AI 原生程式碼編輯器 Cursor 的聯合創始人阿曼·桑格(Aman Sanger)也公開承認。他們的新程式碼模型 Composer 2,其實是基於中國企業“月之暗面”的開源模型 Kimi K2.5 二次開發的,月之暗面方面也確認了雙方的授權商業合作。不只是創業者,學術圈同樣熱衷中國模型。比如在波士頓大學的一場駭客馬拉松上,參會者對中國開源模型青睞有加。麻省理工學院講師安德魯·米德(Andrew Mead)在現場介紹最新中國開源模型。他營運的 AI 技術趨勢通訊《向量實驗室》(Vector Lab)一直關注中國大模型的崛起。米德觀察到,這些模型不僅價格低廉,性能在很多指標上甚至接近美國頂級專有模型。更有哈佛和史丹佛的科研團隊採用“混合策略”:先用 Claude 等美國模型搭建項目框架,再把性價比高的中國模型交給具體任務執行。那怕第一次跑失敗也沒關係,因為成本低,可以多次偵錯,總體成本仍比全程用美國模型划算。資料也佐證了這種趨勢。根據全球最大大模型 API 聚合平台 OpenRouter 的統計。中國模型使用量從 2024 年幾乎為零,到 2025 年 11 月已佔平台總流量超過 30%。在本周的大語言模型熱門榜單前十中,中國模型佔據七席,小米最近發佈的 MiMo‑V2‑Pro 更是位列首位。所以,當中國雲廠商宣佈漲價,台下美國開發者慌得很直接:便宜的成本方案沒了,議價籌碼也弱了,而且全球算力都在漲價。此外,AWS、Google雲都在調價,硬體、電力、冷卻成本都在漲,原本覺得“有中國模型能避開漲價”的安全區,而如今貌似也不存在了。而中國 AI 漲價的原因也很現實,AI 推理和大模型訓練背後是真金白銀的成本。GPU、ASIC、資料中心、電力、冷卻……這些開支壓得人喘不過氣。過去靠資本燒錢撐價格,遲早得回到可持續盈利。這波漲價,對行業其實也有好處。廠商有利潤,才能繼續迭代和研發;開發者也能明確成本邊界,不再抱著“幾塊錢就能跑千張圖片”的錯覺。從長遠來看,中美 AI 的競爭焦點也在悄悄變化。不再是比誰便宜,而是比誰的性能/成本比更高,誰能持續迭代不燒錢,誰能在多雲、多模型環境下靈活調度。 (科技狐)
未來時代,Token就是印鈔機
【原始碼智能前瞻】:Open Claw爆火之後,混元宣佈漲價460%,智譜宣佈漲價100%,阿里雲宣佈漲價34%。漲價的理由都是同一個——“Token呼叫量暴漲”。究其原因,Open Claw發佈後,AI第一次能真正“幹活”,接管電腦、寫程式碼、訂機票、發郵件。隨之,Token消耗邏輯發生了本質變化:以前是問答消耗(幾十Token),現在是任務消耗(幾萬Token),再往後是智能體自主執行消耗(百萬級Token)。中國日均Token消耗半年漲5倍,輝達預測未來幾年年複合增長3000%。中國廠商已經跟上。雲廠商推出一鍵部署,大模型廠商繫結自家模型,硬體廠商做端側Claw,紛紛爭奪Token的入口和定價權。黃仁勳在GTC會議上把資料中心叫作“Token工廠”,提出“每瓦Token數”作為新KPI。意思是:算力不再是賣卡,是賣Token。Token正在從技術概念,變成經濟概念。本文回答四個問題:Token為什麼是計價單位?怎麼消耗?誰在定價?定價和什麼有關?一、Token為什麼是計價單位?(一)什麼是Token?Token是AI處理資訊的最小單元。你問AI一句話,AI回你一段話,這些話在AI模型中都會被拆解成Token。Token數量要看分詞規則,舉個例子,“人工智慧”如果是常見詞,可能直接是1個Token;如果被拆開,可能是“人工”和“智能”2個Token。類比理解,Token就是AI世界的“字節(Byte)”,是模型理解語言的基本單位。(二)為什麼用Token計價?為什麼大模型用Token來計價,而不是按次或按時長計價?如果按次計算,一次簡單的問答和一次複雜的程式碼生成,消耗的算力差幾百倍。如果按時長計價,算力消耗不是勻速的,高峰時段和空閒時段差距太大。用Token計價則解決了以上問題。它是目前能找到的最精確的計量單位,主要原因如下:第一,消耗量與算力直接相關,每生成一個Token,背後都是一次完整的推理計算。第二,消耗量與任務價值正相關。金融業務的token比日常對話的token更具價值。第三,Token可分層定價。廠商可以根據Token的質量定價。Token已經從技術概念,轉變成為反映算力消耗和商業收入的計量單位。以前Token是大模型訓練過程中的副產品。現在成本重心從供給端(訓練)轉移到需求端(推理)。推理是持續的消耗,Token消耗量開始和費用直接掛鉤。二、Token是怎麼消耗的?根據IDC測算,全球Token消耗年複合增長率可達3000%。中國得日均Token消耗已經從2025年中的30兆飆升至2026年2月的180兆,半年增長了5倍之多。Token消耗與任務複雜度直接相關,呈現出明顯的層級特徵:為什麼層級間消耗差異如此懸殊?核心在於AI的“思考”方式發生了根本變化。以o1為代表的推理模型,不再採用傳統的“預測下一個詞”模式,而是在內部生成思維鏈,模型會在回答前進行多步推理、試錯、反思,這些內部過程都以Token形式消耗。Claude Code、Open Claw等智能體框架更進一步。它們將推理能力與工具呼叫結合,實現“思考-執行-驗證”的閉環迭代。一次完整的智能體任務,可能包含數十輪內部推理和外部工具呼叫,單次任務消耗從幾十萬到幾百萬Token不等。以下是不同使用者消耗量級的直觀對比:三、誰在給Token定價?Token從生產到消費,經過四個環節,每個環節的定價權不同。生產層:輝達定義成本基準。它不直接賣Token,但掌握最底層的定價權。黃仁勳提出“每瓦Token數”——在固定電力下,誰能產出更多Token,誰就能賺更多錢。新一代AI計算平台Vera Rubin平台將生成Token成本降低90%,每瓦性能提升10倍。據財報,輝達60%收入來自前五雲廠商。煉化層:模型廠商直接面對供需。國聯民生證券研報指出,當推理消耗變成生產資料,模型廠商有機會把“算力稀缺”通過分層定價轉化為毛利。輝達的分層定價印證了這一點,Token的價值由它能幹什麼決定。分銷層:雲廠商賺管道溢價。3月以來,中國雲端運算產業鏈逐級漲價。優刻得全線漲價,騰訊雲混元漲價超460%,智譜漲20%。但云廠商不只是“二道販子”,它們封裝服務(一鍵部署OpenClaw)、整合生態(阿里串起千問、釘釘、淘寶),賺取溢價和粘性。消費層:使用者用錢包投票。黃仁勳算過一筆帳:“一個研究員每天用5000萬Token,一天7500美元,但對研究團隊來說根本不是問題——因為Token帶來的價值遠超成本。”也就是說,Token的價格由它能創造的價值決定,而非生產成本。這正是Token從技術參數演變為經濟單位的底層邏輯。可以看出,輝達掌握底層成本基準,模型廠商掌握直接定價權,雲廠商掌握管道溢價,使用者用錢包進行價值投票。四、Token定價和什麼有關係?為什麼有的Token貴,有的便宜?成本、能力、供需、場景共同決定Token定價。過去主要由成本決定,現在正向供需和場景傾斜。未來,場景價值會成為主導因素。第一,成本驅動。一個1GW的資料中心,電力是物理上限。誰產出更多Token,誰就能把成本攤薄。中國廠商能打價格戰,靠的就是成本優勢:一度電0.2-0.5元(歐美0.8-1.2元),對應單張B200晶片每年能省900美元。第二,能力分層。同樣是Token,能幫企業做業務的就比閒聊的貴,因為前者價值更大。輝達分層定價正是按能力分層。第三,供需關係。這是最直接的驅動因素。2026年2月,全球前十AI模型Token總消耗量突破27兆,中國貢獻14兆,佔比超50%,一年半漲了1800倍。但是供給端產能緊張,HBM視訊記憶體、先進製程GPU受限,伺服器成本上升。阿里雲、混元、騰訊、智譜漲價,直接原因就是“全球AI需求爆發”和“供應鏈漲價”。第四,場景價值。這是未來定價的主導因素。一個Token用在個人寫周報,價值幾毛錢;但用在金融交易、自動駕駛,價值幾百倍。國信證券指出,推理更看重使用者生態和調度效率,定價權正在從“算力供給方”向“場景需求方”轉移。誰的場景價值高,誰就願意付更高價格。在PC時代,有一個經典的安迪-比爾定律,即硬體提升的性能,很快被軟體消耗掉了,使用者永遠覺得不夠快。智能時代的“安迪-比爾”正在應驗,輝達每18-24個月性能翻倍,但AI智能體瘋狂消耗Token,算力永遠不夠用。Token不再是技術參數,而是經濟概念。印鈔機已經啟動,誰能掌握定價權,誰就能分到最大一塊蛋糕。 (原始碼悟真投研筆記)
平頭哥,這下要封神了!
根據最新財報,2026財年截至2月底。阿里雲外部商業化收入,穩穩突破1000億元人民幣。3月19日晚的業績電話會上,吳泳銘拋出重磅目標。未來五年,包含MaaS在內的雲和AI商業化年收入,要突破1000億美元。換算下來,年均複合增長率要達到20%以上,難度不小。財報顯示,阿里雲季度收入增速持續加速,達到36%。增長動力主要來自公共雲業務,核心是AI相關產品的爆發。AI相關產品的表現,堪稱驚豔。收入連續第十個季度實現三位數同比增長。這意味著,AI已經成為阿里雲增長的核心引擎。吳泳銘在電話會上,解釋了千億美元目標的信心來源。核心就是大模型驅動的MaaS業務,正在快速崛起。過去三個月,百煉MaaS平台的Token消耗規模,暴漲6倍。他甚至直言,商業化MaaS收入,未來會成為阿里雲最大收入產品。除此之外,中大型企業的內部推理和訓練市場。也是阿里雲接下來要重點搶佔的增量市場。在吳泳銘看來,行業增長的最大動能,在於大模型的能力突破。現在的大模型,已經能逐步完成B端複雜工作流。這徹底改變了雲端運算市場的邏輯,也打開了增長空間。一個關鍵變化值得關注。很多企業不再把Token消耗當作預算,而是納入生產或研發成本。這意味著,AI已經從“可選”變成企業的“剛需”。為了抓住這個機遇,阿里早已提前佈局。全新的Alibaba Token Hub事業群(ATH)已經成立。核心目標就是“創造Token、輸送Token、應用Token”,打通全鏈路。ATH涵蓋了通義實驗室、MaaS業務線、千問事業部等核心類股。相當於把阿里的AI力量整合起來,集中發力。這種協同效應,後續會逐步顯現。大模型層面,阿里也在持續迭代。春節期間,新一代大模型Qwen3.5-Plus正式推出。吳泳銘透露,針對coding與agentic場景最佳化的新版本,也即將上線。對於AI行業的未來,吳泳銘的判斷很清醒。需求側,大模型的規模化法則還沒到瓶頸,能力仍在提升。行業能通過模型完成的事情,只會越來越多。供給側,現狀卻很緊張。AI伺服器從CPU到儲存,各個環節都在缺貨。擴產周期至少需要兩三年,算力供不應求將成常態。所以他直言,未來三年內,AI泡沫並不存在。需求旺盛而供給短缺,行業會處於良性增長階段。這也是阿里敢於定下千億美元目標的重要前提。AI進入智能體驅動階段後,玩法也變了。模型和應用必須緊密配合,缺一不可。阿里的優先順序很明確:先把模型能力做到最強。只有最強的模型,才能驅動各行各業的應用拓展。同時還要聯動阿里自身的B端、C端應用。通過MaaS連結行業應用,打通資料飛輪和業務閉環。財報裡,平頭哥的進展,是另一個大驚喜。其自主研發的GPU,已經實現規模化量產。能支援從訓練、微調到推理的端到端AI工作負載。截至2026年2月,平頭哥GPU累計交付47萬片。年化營收規模達到百億等級,商業化成效顯著。預計2026、2027年,產能還會進一步擴大。更關鍵的是,平頭哥晶片的外部滲透率很高。阿里雲場景中,60%以上的晶片服務於外部商業化客戶。已經支撐了400多家企業的AI任務,覆蓋多行業領域。吳泳銘強調,平頭哥的價值不止於成本最佳化。更重要的是,在全球算力緊缺的背景下,提供算力保障。至於IPO,目前沒有明確時間表,但不排除未來可能性。C端市場,千問APP的表現也很亮眼。2月6日春節推廣啟動後,截至2月底。近1.4億使用者通過其智能體功能,首次體驗AI購物。2月份,千問C端應用月活躍使用者數,突破3億。這意味著,阿里AI在C端的滲透,已經形成規模。也為後續的商業化,積累了大量使用者基礎。 (1 ic芯網)
AI高門檻時代結束:阿里雲JVSClaw讓AI員工3分鐘上崗
中國AI圈剛剛發生了一件很少見的事情。幾乎所有大廠,在一周之內同時發佈 AI Agent。2026年3月4日,騰訊雲上線一鍵部署 OpenClaw;2026年3月6日,字節跳動推出OpenClaw快速接入方案;2026年3月7日,月之暗面發佈智能體工具,開始支援AI Agent;2026年3月9日,京東宣佈電商系統接入OpenClaw能力;2026年3月10日,智譜AI宣佈其大模型平台接入OpenClaw;2026年3月13日,阿里雲發佈JVSClaw智能體工具。如果只是看新聞,很多人可能會覺得:這不就是又多了幾個AI工具嗎?但我自己實測完之後,心裡其實咯噔了一下。因為這次阿里雲的 JVSClaw,有三個非常危險的關鍵詞:0程式碼3分鐘不用API配置這3個詞組合在一起,釋放了一個明顯的訊號:當“養龍蝦”變得像發朋友圈一樣簡單。很多行業,其實就開始變天了。(1)3分鐘養一隻AI龍蝦,AI智能體第一次做成“傻瓜版”在AI圈,大家喜歡把 AI Agent 叫做“AI龍蝦”(OpenClaw)。以前想養一隻“龍蝦”,難如登天。原因很簡單:門檻太高了。你要先準備:Python環境、Node環境、模型API、伺服器。90%的人,在第一步就卡住了。這就是為什麼很多人裝不上OpenClaw的原因!技術門檻太高了!所以AI Agent一直停在開發者圈子裡。這一次 阿里雲做的事情其實很簡單:把這件事變成傻瓜操作。JVSClaw的核心邏輯非常簡單:手機打開App點三下,一個AI智能體就建立好了。不需要配置伺服器、不用寫一行程式碼,也不用配一個節點。直接就能跑任務。這意味著:這是AI Agent第一次開始真正面向普通人。當“養龍蝦”變得像發朋友圈一樣簡單,真正開始慌的人,其實還沒出現。(2)有人養AI龍蝦一天燒217美元,問題出在這裡最近AI圈有個很真實的案例。有使用者在測試AI Agent的時候,AI突然陷入死循環。不停呼叫模型。結果一天時間,燒掉了217美元。一天217美元,相當於很多人一個月的午飯錢。(一個群裡電商老闆說:“太燒token了,我有點燒不起。”)最近國安部和工信部剛發了公告,強調AI資料的安全合規。很多老闆想把AI部署在自己公司的電腦或本地伺服器上,其實隱患極大:一旦中病毒、被駭客入侵,或者AI亂跑資料,根本沒人兜底。這就帶來兩個風險:第一,AI會陷入死循環,Toeken瘋狂消耗。第二,你根本不知道問題出在那。而阿里雲這種“國家隊”選手,天生就帶著安全鎖。 資料在雲端加密運行,符合國家最高安全標準。所以JVSClaw 這次做了一個極其關鍵的設計:ClawSpace。在這裡,AI的每一步操作都是“直播”給你看的。它打開了那個網頁、填了什麼資料、在那一步卡住了,你一清二楚。如果AI犯傻卡住,你可以隨時手動接管,幫它點一下,它再繼續。(3)AI開始操作手機,很多崗位要變天了在中國中小企業的生意裡,有80%的業務都在手機上操作,例如抖音直播、微信客服、閒魚訂單、小紅書引流。如果AI不能操作手機,很多場景就做不了。而這次阿里雲推出了一個版本叫MobileClaw,它可以直接識別手機介面,像真人一樣完成操作:點選、滑動、輸入。簡單說:AI可以自己操作APP。比如以自動回覆客服消息、自動處理訂單、自動去評論了。這對很多中小企業來說,功能非常實用。因為很多公司最缺的就是人。(4)AI智能體變成傻瓜工具,最先慌的是這三類人如果普通人三分鐘就能擁有一個AI智能體,那原本要團隊做的事情,可能會被重新定義了。比如:(1)AI部署外包商:那些在朋友圈、抖音上喊著“幫你搭建私有化OpenClaw”、“企業Agent定製部署”的工作室,以後很那接到訂單了,以前報價5000起的活,現在可能只值50塊。(2)AI培訓講師:那些賣《7天精通OpenClaw部署》、《AI智能體高階玩法》一門課程賣6980的的大V,他們的課程內容變成廢紙,口碑瞬間崩塌。(3)“AI套殼”公司,以前加個UI介面,套個GPT介面,包裝一個“AI產品”,然後打著“垂直賽道AI”的名號去融資,收年費的公司護城河要沒有了。如果像阿里雲這種平台,直接把AI智能體做成零程式碼工具,很多“簡單AI產品”就沒有存在必要了。過去需要一個團隊做的工具,現在普通人就能搭出來。AI行業每次真正的洗牌,都不是從技術突破開始的,而是技術門檻的消失。(5)寫在最後:過去兩年,AI最大的功能是:陪你聊天、寫寫文章、寫個程式碼;但現在事情開始變了。AI開始:會抓資料、跑流程、處理任務了。簡單說:AI開始幹活了。如果說過去的AI更像助手,那現在的AI更像:打工人。而像JVSClaw這樣的工具,本質只做了一件事:讓普通人也能擁有一個AI打工人。AI行業真正的革命,從來不是模型變強。而是普通人突然也能用它幹活。 (盧松松)