#阿里雲 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#阿里雲

對話李開復：別叫我們 “六小虎”，叫 “金錢豹”

零一萬物正籌備上市，明年實現單季度盈利。零一萬物 CEO 李開復春節前幾天，李開復在飛機上接到一通客戶電話，對方說 “我會考慮和你們合作，但你能不能馬上飛來非洲談談？” 投資人、創業導師、AI 專家李開復不會為了談生意在春節時跑到一個非洲國家下礦洞。病癒後他尤其看重與家人相聚，“我以前會說，換個時間？”

阿里雲為什麼「重構自己」？

“當雲的主要使用者開始從人變成 Agent，雲端運算這門生意，也開始被重新改寫。” 如果你連續幾年參加雲相關的峰會，今年就會有一個明顯的感受：話題變了。過去我們聊雲，我們在聊什麼？一來是聊雲，我們聊的是怎麼把伺服器搬上去。

科技巨頭同日押注Agent化，阿里雲交出“芯-雲-模型-推理”全端答卷

5月20日，阿里雲在2026阿里雲峰會上宣佈完成"晶片-雲-模型-推理"全端Agent化升級，同步推出全新AI產品官網"千問雲"、搭載自研AI晶片真武M890的超節點伺服器，以及最新旗艦模型Qwen3.7-Max。千問雲是阿里雲成立17年來首次在主官網之外推出的全新產品官網，據阿里雲介紹，也是國內雲廠商率先專門面向Agent（智能體）設計的模型服務入口。而從晶片到推理引擎的這次全端升級，更是國內雲廠商首次圍繞Agent進行完整的產品體系發佈。就在不到24小時前，Google剛在I/O開發者大會上把開發平台Antigravity升級為agent-first架構，發佈了定位為"24/7 personal agent"的Gemini Spark，宣佈Gemini從AI助手全面轉向自主執行任務的Agent。 Google和阿里雲在同一天做了同一個判斷：雲和AI的主要消費者正在從人變成Agent。

平頭哥公佈AI晶片規劃，真武GPU已出貨56萬片

5月20日，在2026阿里雲峰會上，阿里發佈基於平頭哥新一代AI晶片真武M890的128卡超節點伺服器，搭載互聯晶片ICN Switch 1.0，通訊時延低至百納秒級，可讓128張AI晶片組成一台電腦，滿足海量Agent並行推理和大模型訓練需求。這是面向Agentic時代全面升級的重要部分，當天阿里雲推出了全新“芯-雲-模型-推理”技術體系。 Agentic時代，算力叢集需要承載成千上萬個Agent同時運行，每個Agent在一次任務中可能連續發起數十次模型呼叫，這對通訊時延和頻寬有極高要求。磐久AL128超節點伺服器基於自研AI晶片和互聯晶片打造，通過單機櫃128卡緊密耦合互聯，P2P時延低於150ns，單櫃頻寬達到Pb/s級，可支海量Agent的並行請求。該超節點伺服器已上線阿里雲百煉，支援Qwen、DeepSeek、Kimi等主流模型。據介紹，首次亮相的真武M890採用自研平行計算架構，內建144GB視訊記憶體，性能是真武810E的3倍，片間互聯頻寬達到800GB/s，晶片原生支援FP32到FP4等多種資料精度，可應用於高精度訓練、低精度和超低精度推理的全場景，低精度推理場景下，不僅可以保證模型輸出質量，還能顯著降低單次推理的算力開銷。平頭哥互聯晶片ICN Switch 1.0支援自研ICN互聯匯流排協議和PCCL通訊庫，吞吐量達25.6Tbps，可支援真武M890的高效互聯，提升AI叢集的算力效率。真武M890搭配ICN Switch1.0晶片，可實現64卡全頻寬互聯，顯著提升大規模智算叢集計算的效率與穩定性。基於平頭哥自研T-Head SAIL軟體棧的軟硬協同，可最大程度釋放晶片的算力。

阿里雲宣佈：調整標準版、專業版使用者的API免費額度並支援按量付費

阿里雲宣佈調整標準版、專業版使用者的API免費額度並支援按量付費。DataWorks標準版、專業版使用者，取消每日呼叫API的數量限制；DataWorks標準版，呼叫API的免費額度調整為10萬次/月；超出部分採用OpenAPI按量付費的方式；DataWorks專業版，呼叫API的免費額度調整為50萬次/月；超出部分採用OpenAPI按量付費的方式；DataWorks基礎版和企業版保持不變；各版本的QPS限制保持不變。從2026年4月14日逐步發佈，到2026年4月23日所有region生效。 (科創日報)

中國 AI 漲價，美國使用者先慌了

3 月中旬，阿里雲、百度智能雲先後放了一個消息：AI 產品要集體漲價了，算力、儲存、大模型推理服務，全都在漲價名單裡。業內人士普遍認為，這標誌著中國雲市場正式進入漲價周期。有趣的是，這消息一出，這邊中國使用者倒是挺淡定，先慌的居然是美國使用者。你沒看錯，這些習慣用中國 AI 的美國工程師們，真的有點手忙腳亂。為什麼？得先看看過去兩年中國 AI 的價格史。從 2023 下半年到 2025 年，中國大模型廠商幾乎在玩“史詩級打骨折”。對標 GPT‑4 的主力模型，單價下調 90% 以上，輸入價格被媒體調侃成“美國同行的一個零頭”。有的廠商還直接放出大量免費額度，把中小開發者和初創公司全拉進自家陣地。各種研究報告和評論指出，中國雲和 AI 服務長期處於高投入、低價格狀態，大模型價格戰背後是資本撐著、用規模換市場份額。行業裡調侃一句：“美國在卷算力，中國在卷算力單價。”也正是在這種背景下，“China’s AI is cheap”幾乎成了美國使用者的默認印象。其實，美國使用者慌的不只是“價格上升”本身，而是過去兩年養成的習慣被打亂了。根據彭博社記者盧茲·丁（Luz Ding）一年的跟蹤報導，中國 AI 企業甚至刻意選在美國開發者的作息時間發佈新模型。目的很明確：方便給太平洋彼岸的開發者留，同時暗示：“來試用我們的模型吧。”不僅是線上推送，很多廠商還跑到舊金山灣區，扎堆參加技術沙龍、駭客松，甚至舉辦“麻將之夜”，獎品就是搭載中國模型的雲服務免費額度。效果立竿見影，美國創業者和工程師們很直接：“只要能幫我把 AI 成本砍下來，誰的模型都願意試。”Airbnb 首席執行長布萊恩·切斯基（Brian Chesky），也是 OpenAI 創始人薩姆·奧特曼（Sam Altman）的朋友。他透露，Airbnb 非常依賴阿里巴巴的 Qwen 模型，因為中國 AI 性能好、速度快、成本低。相比之下，他評價 ChatGPT 時表示：“我認為它還不夠好。”美國風險投資公司 16z 的合夥人馬丁·卡薩多（Martin Casado）也觀察到，大多數美國 AI 創業者都在用中國模型。“我估計他們有 80% 的機率在使用中國開源模型。”投資人 Chamath Palihapitiya（Social Capital）同樣坦言，他選擇用中國 Moonshot AI 開發的開源模型 Kimi K2 處理公司大部分工作。因為性能遠超 OpenAI，而且價格便宜得多。甚至在開發者圈裡，全球主流 AI 原生程式碼編輯器 Cursor 的聯合創始人阿曼·桑格（Aman Sanger）也公開承認。他們的新程式碼模型 Composer 2，其實是基於中國企業“月之暗面”的開源模型 Kimi K2.5 二次開發的，月之暗面方面也確認了雙方的授權商業合作。不只是創業者，學術圈同樣熱衷中國模型。比如在波士頓大學的一場駭客馬拉松上，參會者對中國開源模型青睞有加。麻省理工學院講師安德魯·米德（Andrew Mead）在現場介紹最新中國開源模型。他營運的 AI 技術趨勢通訊《向量實驗室》（Vector Lab）一直關注中國大模型的崛起。米德觀察到，這些模型不僅價格低廉，性能在很多指標上甚至接近美國頂級專有模型。更有哈佛和史丹佛的科研團隊採用“混合策略”：先用 Claude 等美國模型搭建項目框架，再把性價比高的中國模型交給具體任務執行。那怕第一次跑失敗也沒關係，因為成本低，可以多次偵錯，總體成本仍比全程用美國模型划算。資料也佐證了這種趨勢。根據全球最大大模型 API 聚合平台 OpenRouter 的統計。中國模型使用量從 2024 年幾乎為零，到 2025 年 11 月已佔平台總流量超過 30%。在本周的大語言模型熱門榜單前十中，中國模型佔據七席，小米最近發佈的 MiMo‑V2‑Pro 更是位列首位。所以，當中國雲廠商宣佈漲價，台下美國開發者慌得很直接：便宜的成本方案沒了，議價籌碼也弱了，而且全球算力都在漲價。此外，AWS、Google雲都在調價，硬體、電力、冷卻成本都在漲，原本覺得“有中國模型能避開漲價”的安全區，而如今貌似也不存在了。而中國 AI 漲價的原因也很現實，AI 推理和大模型訓練背後是真金白銀的成本。GPU、ASIC、資料中心、電力、冷卻……這些開支壓得人喘不過氣。過去靠資本燒錢撐價格，遲早得回到可持續盈利。這波漲價，對行業其實也有好處。廠商有利潤，才能繼續迭代和研發；開發者也能明確成本邊界，不再抱著“幾塊錢就能跑千張圖片”的錯覺。從長遠來看，中美 AI 的競爭焦點也在悄悄變化。不再是比誰便宜，而是比誰的性能/成本比更高，誰能持續迭代不燒錢，誰能在多雲、多模型環境下靈活調度。 (科技狐)

未來時代，Token就是印鈔機

【原始碼智能前瞻】：Open Claw爆火之後，混元宣佈漲價460%，智譜宣佈漲價100%，阿里雲宣佈漲價34%。漲價的理由都是同一個——“Token呼叫量暴漲”。究其原因，Open Claw發佈後，AI第一次能真正“幹活”，接管電腦、寫程式碼、訂機票、發郵件。隨之，Token消耗邏輯發生了本質變化：以前是問答消耗（幾十Token），現在是任務消耗（幾萬Token），再往後是智能體自主執行消耗（百萬級Token）。中國日均Token消耗半年漲5倍，輝達預測未來幾年年複合增長3000%。中國廠商已經跟上。雲廠商推出一鍵部署，大模型廠商繫結自家模型，硬體廠商做端側Claw，紛紛爭奪Token的入口和定價權。黃仁勳在GTC會議上把資料中心叫作“Token工廠”，提出“每瓦Token數”作為新KPI。意思是：算力不再是賣卡，是賣Token。Token正在從技術概念，變成經濟概念。本文回答四個問題：Token為什麼是計價單位？怎麼消耗？誰在定價？定價和什麼有關？一、Token為什麼是計價單位？（一）什麼是Token？Token是AI處理資訊的最小單元。你問AI一句話，AI回你一段話，這些話在AI模型中都會被拆解成Token。Token數量要看分詞規則，舉個例子，“人工智慧”如果是常見詞，可能直接是1個Token；如果被拆開，可能是“人工”和“智能”2個Token。類比理解，Token就是AI世界的“字節（Byte）”，是模型理解語言的基本單位。（二）為什麼用Token計價？為什麼大模型用Token來計價，而不是按次或按時長計價？如果按次計算，一次簡單的問答和一次複雜的程式碼生成，消耗的算力差幾百倍。如果按時長計價，算力消耗不是勻速的，高峰時段和空閒時段差距太大。用Token計價則解決了以上問題。它是目前能找到的最精確的計量單位，主要原因如下：第一，消耗量與算力直接相關，每生成一個Token，背後都是一次完整的推理計算。第二，消耗量與任務價值正相關。金融業務的token比日常對話的token更具價值。第三，Token可分層定價。廠商可以根據Token的質量定價。Token已經從技術概念，轉變成為反映算力消耗和商業收入的計量單位。以前Token是大模型訓練過程中的副產品。現在成本重心從供給端（訓練）轉移到需求端（推理）。推理是持續的消耗，Token消耗量開始和費用直接掛鉤。二、Token是怎麼消耗的？根據IDC測算，全球Token消耗年複合增長率可達3000%。中國得日均Token消耗已經從2025年中的30兆飆升至2026年2月的180兆，半年增長了5倍之多。Token消耗與任務複雜度直接相關，呈現出明顯的層級特徵：為什麼層級間消耗差異如此懸殊？核心在於AI的“思考”方式發生了根本變化。以o1為代表的推理模型，不再採用傳統的“預測下一個詞”模式，而是在內部生成思維鏈，模型會在回答前進行多步推理、試錯、反思，這些內部過程都以Token形式消耗。Claude Code、Open Claw等智能體框架更進一步。它們將推理能力與工具呼叫結合，實現“思考-執行-驗證”的閉環迭代。一次完整的智能體任務，可能包含數十輪內部推理和外部工具呼叫，單次任務消耗從幾十萬到幾百萬Token不等。以下是不同使用者消耗量級的直觀對比：三、誰在給Token定價？Token從生產到消費，經過四個環節，每個環節的定價權不同。生產層：輝達定義成本基準。它不直接賣Token，但掌握最底層的定價權。黃仁勳提出“每瓦Token數”——在固定電力下，誰能產出更多Token，誰就能賺更多錢。新一代AI計算平台Vera Rubin平台將生成Token成本降低90%，每瓦性能提升10倍。據財報，輝達60%收入來自前五雲廠商。煉化層：模型廠商直接面對供需。國聯民生證券研報指出，當推理消耗變成生產資料，模型廠商有機會把“算力稀缺”通過分層定價轉化為毛利。輝達的分層定價印證了這一點，Token的價值由它能幹什麼決定。分銷層：雲廠商賺管道溢價。3月以來，中國雲端運算產業鏈逐級漲價。優刻得全線漲價，騰訊雲混元漲價超460%，智譜漲20%。但云廠商不只是“二道販子”，它們封裝服務（一鍵部署OpenClaw）、整合生態（阿里串起千問、釘釘、淘寶），賺取溢價和粘性。消費層：使用者用錢包投票。黃仁勳算過一筆帳：“一個研究員每天用5000萬Token，一天7500美元，但對研究團隊來說根本不是問題——因為Token帶來的價值遠超成本。”也就是說，Token的價格由它能創造的價值決定，而非生產成本。這正是Token從技術參數演變為經濟單位的底層邏輯。可以看出，輝達掌握底層成本基準，模型廠商掌握直接定價權，雲廠商掌握管道溢價，使用者用錢包進行價值投票。四、Token定價和什麼有關係？為什麼有的Token貴，有的便宜？成本、能力、供需、場景共同決定Token定價。過去主要由成本決定，現在正向供需和場景傾斜。未來，場景價值會成為主導因素。第一，成本驅動。一個1GW的資料中心，電力是物理上限。誰產出更多Token，誰就能把成本攤薄。中國廠商能打價格戰，靠的就是成本優勢：一度電0.2-0.5元（歐美0.8-1.2元），對應單張B200晶片每年能省900美元。第二，能力分層。同樣是Token，能幫企業做業務的就比閒聊的貴，因為前者價值更大。輝達分層定價正是按能力分層。第三，供需關係。這是最直接的驅動因素。2026年2月，全球前十AI模型Token總消耗量突破27兆，中國貢獻14兆，佔比超50%，一年半漲了1800倍。但是供給端產能緊張，HBM視訊記憶體、先進製程GPU受限，伺服器成本上升。阿里雲、混元、騰訊、智譜漲價，直接原因就是“全球AI需求爆發”和“供應鏈漲價”。第四，場景價值。這是未來定價的主導因素。一個Token用在個人寫周報，價值幾毛錢；但用在金融交易、自動駕駛，價值幾百倍。國信證券指出，推理更看重使用者生態和調度效率，定價權正在從“算力供給方”向“場景需求方”轉移。誰的場景價值高，誰就願意付更高價格。在PC時代，有一個經典的安迪-比爾定律，即硬體提升的性能，很快被軟體消耗掉了，使用者永遠覺得不夠快。智能時代的“安迪-比爾”正在應驗，輝達每18-24個月性能翻倍，但AI智能體瘋狂消耗Token，算力永遠不夠用。Token不再是技術參數，而是經濟概念。印鈔機已經啟動，誰能掌握定價權，誰就能分到最大一塊蛋糕。 (原始碼悟真投研筆記)

平頭哥，這下要封神了！

根據最新財報，2026財年截至2月底。阿里雲外部商業化收入，穩穩突破1000億元人民幣。3月19日晚的業績電話會上，吳泳銘拋出重磅目標。未來五年，包含MaaS在內的雲和AI商業化年收入，要突破1000億美元。換算下來，年均複合增長率要達到20%以上，難度不小。財報顯示，阿里雲季度收入增速持續加速，達到36%。增長動力主要來自公共雲業務，核心是AI相關產品的爆發。AI相關產品的表現，堪稱驚豔。收入連續第十個季度實現三位數同比增長。這意味著，AI已經成為阿里雲增長的核心引擎。吳泳銘在電話會上，解釋了千億美元目標的信心來源。核心就是大模型驅動的MaaS業務，正在快速崛起。過去三個月，百煉MaaS平台的Token消耗規模，暴漲6倍。他甚至直言，商業化MaaS收入，未來會成為阿里雲最大收入產品。除此之外，中大型企業的內部推理和訓練市場。也是阿里雲接下來要重點搶佔的增量市場。在吳泳銘看來，行業增長的最大動能，在於大模型的能力突破。現在的大模型，已經能逐步完成B端複雜工作流。這徹底改變了雲端運算市場的邏輯，也打開了增長空間。一個關鍵變化值得關注。很多企業不再把Token消耗當作預算，而是納入生產或研發成本。這意味著，AI已經從“可選”變成企業的“剛需”。為了抓住這個機遇，阿里早已提前佈局。全新的Alibaba Token Hub事業群（ATH）已經成立。核心目標就是“創造Token、輸送Token、應用Token”，打通全鏈路。ATH涵蓋了通義實驗室、MaaS業務線、千問事業部等核心類股。相當於把阿里的AI力量整合起來，集中發力。這種協同效應，後續會逐步顯現。大模型層面，阿里也在持續迭代。春節期間，新一代大模型Qwen3.5-Plus正式推出。吳泳銘透露，針對coding與agentic場景最佳化的新版本，也即將上線。對於AI行業的未來，吳泳銘的判斷很清醒。需求側，大模型的規模化法則還沒到瓶頸，能力仍在提升。行業能通過模型完成的事情，只會越來越多。供給側，現狀卻很緊張。AI伺服器從CPU到儲存，各個環節都在缺貨。擴產周期至少需要兩三年，算力供不應求將成常態。所以他直言，未來三年內，AI泡沫並不存在。需求旺盛而供給短缺，行業會處於良性增長階段。這也是阿里敢於定下千億美元目標的重要前提。AI進入智能體驅動階段後，玩法也變了。模型和應用必須緊密配合，缺一不可。阿里的優先順序很明確：先把模型能力做到最強。只有最強的模型，才能驅動各行各業的應用拓展。同時還要聯動阿里自身的B端、C端應用。通過MaaS連結行業應用，打通資料飛輪和業務閉環。財報裡，平頭哥的進展，是另一個大驚喜。其自主研發的GPU，已經實現規模化量產。能支援從訓練、微調到推理的端到端AI工作負載。截至2026年2月，平頭哥GPU累計交付47萬片。年化營收規模達到百億等級，商業化成效顯著。預計2026、2027年，產能還會進一步擴大。更關鍵的是，平頭哥晶片的外部滲透率很高。阿里雲場景中，60%以上的晶片服務於外部商業化客戶。已經支撐了400多家企業的AI任務，覆蓋多行業領域。吳泳銘強調，平頭哥的價值不止於成本最佳化。更重要的是，在全球算力緊缺的背景下，提供算力保障。至於IPO，目前沒有明確時間表，但不排除未來可能性。C端市場，千問APP的表現也很亮眼。2月6日春節推廣啟動後，截至2月底。近1.4億使用者通過其智能體功能，首次體驗AI購物。2月份，千問C端應用月活躍使用者數，突破3億。這意味著，阿里AI在C端的滲透，已經形成規模。也為後續的商業化，積累了大量使用者基礎。 (1 ic芯網)