#阿里巴巴
Token產業鏈:中國有那些Token供應商?
在人工智慧大模型迅猛發展的當下,Token成了數字世界最為關鍵的價值承載物。每一回模型推理,每一回智能互動,其背後都是數量眾多Token的產生、流轉以及消費。圍繞這一嶄露頭角的“Token經濟”,一條包含模型層、算力基礎設施、硬體底座、端側入口以及安全配套的完備產業鏈已然形成。本文會從Token的直接生產者著手,逐個剖析這一產業鏈的關鍵參與者,勾勒當前Token經濟的產業格局。1. 什麼是Token經濟?Token,簡而言之就是AI大模型處理文字、圖像、視訊等資訊的“最小計量單位”。2026年3月23日,國家資料局正式確定Token的中文譯名為“詞元”,並將其定位為“智能時代的價值錨點”,作為連接技術供給與商業需求的結算單位,為商業模式的落地提供了可量化的基礎。Token,可類比為AI產業運轉的“數字電力”,也是AI服務計費與結算的基礎單位。如果把大模型比作一台智慧型手機器,那麼詞元就如同這台機器運轉所消耗的“每一度電”,同時也是對外提供服務時“按度計費”的核心依據。資料來源:iiMedia Research(艾媒諮詢)(艾媒諮詢)資料顯示,2025年中國詞元呼叫總量達24,619.3兆次;報告預計2026年將增至111,799.5兆次,2030年將進一步攀升至7,046,680.4兆次,2025–2030年複合增長率(CAGR)為210%。資料來源:iiMedia Research(艾媒諮詢)2. Token產業鏈有那些重要企業?Token經濟產業鏈全景解析:從模型生產到算力底座一、模型層(Token直接生產者)模型層是Token經濟的起始源頭,借由大模型API或者自有應用去生成Token呼叫量。1. 網際網路大廠(通用模型底座)阿里巴巴:通義千問與阿里雲兩張王牌,目標被定位為“Token經濟的最大批發商”,其業務範圍涵蓋電商領域、雲端運算領域以及企業服務領域,形成了全場景閉環。騰訊:混元大模型在社交場景中被高頻呼叫,在遊戲場景裡也被高頻呼叫,在雲場景同樣被高頻呼叫,其自有生態Token消耗量極為巨大。百度:文心一言、搜尋、雲服務佈局,是國內面向個人消費者加上面向企業客戶的Token服務主要力量。字節跳動:豆包大模型定位被設定為“Token經濟的C端吞吐機”,它擁有超過1.5億的日活使用者,在國內,其日均Token消耗量處於首位。科大訊飛:推出星火大模型,在政企場景成熟,在教育場景成熟,在醫療場景成熟,其日均處理Token數量超過3兆,AI開放平台2025年時收入為135億。2. 大模型獨角獸(專業API供給)智譜AI:國內ToB API領域中處於龍頭地位的智譜AI(GLM),其周呼叫達到1.03兆Token,海外收入所佔比例超過50%,並且政企訂單呈現出爆發式增長態勢。MINIMAX:Token往海外發展領域的絕對處於領先地位的企業,OpenRouter在全球範圍內的呼叫數量在所有相關對象裡排名第一,每周的呼叫數量達到3.07兆Token,在市場中所佔的份額為22%,其來自海外的收入在總收入裡所佔的比例是73%。月之暗面(Kimi):它是長文字場景中,那個負責Token消耗的引擎,專門聚焦於C端長文字互動,而且使用者增長的速度十分迅猛。深度求索(DeepSeek):身處Token生產領域,把推理成本借助演算法最佳化降低到行業十分之一以下,堪稱“極致降本者”的存在。百川智能:Token供給者,其Baichuan系列處在金融領域,還有政務領域,有著很高的滲透率。零一萬物:它在開源生態裡是Token效率標竿,並且Yi系列模型於開源社區其影響力有著相當程度的大。商湯科技:多模態Token進行“感知 + 生成”融合,其旗下日日新大模型,在視覺這個領域以及多模態範疇處於領先位置。3. 垂直領域模型商(場景化Token服務)崑崙萬維:有著天工大模型全球API,是Token出海領域的龍頭,其每天處理的Token數量超過200億,海外收入所佔比例在70%以上,到2025年API收入可達32億,同比增長210%。拓爾思:具備政務以及金融NLP,能為金融和政務給予語義推理,以及Token計費服務。雲從科技:人機協同Token合規化的踐行者,在金融場景有所深耕,在治理場景也有所深耕。瀾舟科技:在輕量化Token生產方面堪稱“小而精”類型的代表,其孟子輕量化模型系列主要側重於主打垂直場景。達觀資料:是在垂直行業智能文字處理方面佔據獨特地位的專門對於各種詞彙元素精準把控加以操作的行家,其在金融領域所進行的應用達到了頗為深入的程度,在製造領域所產生的應用深入發展態勢顯著。虎博科技:是在金融範疇有著較高壁壘的玩家。二、算力基礎設施層(Token生產環境)是Token生產的“廠房”,也是Token生產的“能源”。4. 智算中心營運(重資產算力底座)潤澤科技:它是字節、智譜的核心IDC,有智算中心叢集,其算力租賃佔比超過60%。鴻博股份:是MINIMAX的獨家算力夥伴,有著海外智算中心的佈局,採用算力租賃以及Token計費模式。首都線上:智譜AI核心算力的底座,具有全球化的彈性算力,按照Token消耗進行即時計費,有著低延遲的Token生產和分發。資料港:它是阿里以及騰訊的核心IDC,有著AI算力叢集,還能夠支撐大模型Token推理。萬國資料:是大規模Token生產叢集當中的物理承載者,在國內屬於第三方資料中心領域的龍頭。秦淮資料:是進行Token生產的“電力公司”,是超大規模資料中心的營運商,能為AI訓練以及推理提供電力,還能提供散熱基座。奧飛資料:是為 AI 企業算力需求提供服務的智算中心服務商,也是為相關領域提供服務的網際網路資料中心服務商。5. 雲服務與算力平台(彈性算力供給)優刻得:為中小人工智慧企業提供Token算力服務,其定位呈現出“血汗工廠”模式。光環新網:它是AI推理算力的物理承載者,同時也是AI訓練算力的物理承載者,並且是以IDC加上雲端運算這種雙輪驅動的模式。軟通智算:擔任著算力網裡的“營運商”角色,承擔著對算力資源進行調度的工作,以及負責Token生產環境的維運任務。青雲科技:推出一種方案,該方案是關於彈性Token生產環境的混合雲方案,此方案能夠提供靈活的算力資源。平行科技:它是科研場景裡的高性能 Token 生成者,同時也是工業場景中的高性能 Token 生成者,還是超算雲服務商。三、硬體底座層(Token生產工具)提供諸如AI晶片、伺服器這類硬體裝置,對Token的生產效率以及成本起著決定性作用。6. AI晶片(算力核心)海光資訊:它是國產AI晶片裡的龍頭,是大模型訓練以及推理的核心所在,是信創智算領域當中的Token生產基座,還是國產替代的主力。寒武紀:是雲端 AI 晶片,是智算中心的標配,是邊緣側 Token 生產方面低功耗晶片的先鋒。摩爾線程:是國產全功能GPU的Token產能推動因素,是國產GPU領域處於領先之地的存在。壁仞科技:超大規模智算叢集的算力底座,單卡支援高並行推理燧原科技:雲端AI推理晶片的國產替代主力,專注雲端AI推理沐曦積體電路:是國產高性能GPU方面的Token生態建構者,其產品涵蓋了訓練以及推理這兩個範疇。7. AI伺服器與計算系統浪潮資訊:在國內AI伺服器市場佔有率處於首位,是字節跳動、百度以及阿里這幾家公司的核心供應商,是Token計算的硬體基礎。中科曙光:國產算力領域的龍頭,它具備AI伺服器以及智算中心,憑藉自主可控的算力為Token生產提供支撐。工業富聯:它是全球人工智慧伺服器代工領域當中處於龍頭地位的企業,其市場佔有率超過百分之四十,還是輝達的核心合作夥伴,更是Token工廠裝置的那塊基石。龍芯中科:其為自主可控Token生產鏈裡指令集的基石所在,是形成自主指令集架構的關鍵部分。華為:是全端式Token工廠的總包商,有著昇騰晶片以及鯤鵬生態,實現了國產算力全鏈條的覆蓋。四、端側與邊緣層(Token分發入口)在終端裝置上直接生成和消費Token,實現邊緣AI推理。8. 智能終端與邊緣計算小米集團:消費端Token入口領域有著生態級表現的參與者,其中小愛同學以及AloT裝置所覆蓋的終端數量達到了數億之多。聯想集團:它是端側Token生成方面的有著推動作用的主體,同時也是算力基礎設施領域的有著驅動效能的一方,它在AI PC領域與在伺服器領域所佔據的地位同等重要。OPPO:是端雲協同Token實現生產的出海典型代表者,它有著安第斯大模型,還有與之相關的手機終端。中科創達:它是終端以及汽車端側Token生成的OS使能者,有著智能作業系統和端側模型。海康威視:是物理世界視覺 Token 的入口級玩家,它有著視覺大模型,還有攝影機終端,呈現多模態融合。五、安全與配套層(Token經濟保障)保障Token生產、流通、使用的安全合規與資料供給。9. 安全與資料服務奇安信:是Token經濟安全基礎設施的守護者,它保障著Token生產環境的安全,也保障著Token流通環境的安全。深信服:是智算中心的一員,也是 AI 應用的安全接入者,它能夠提供安全雲端運算,還能夠提供算力接入。海天瑞聲:屬於Token生產的那種“原材料供應商”,能夠提供具備高品質的標註資料,還能提供訓練資料。 (TOP行業報告)
蔡崇信,剛剛募集70億
浮出水面。今年中國最大一筆美元募資誕生。據《華爾街日報》消息,藍池資本(Blue Pool Capital)已為旗下首支私募股權基金募集到10億美元(約合70億人民幣)。總部位於中國香港,藍池資本是由阿里巴巴蔡崇信Joe Tsai於2014年聯合創辦的家族辦公室,如今正發展為外部資本管理平台。這幾年,創投圈對於神秘低調的藍池資本愈發熟悉,不少投資案例中都能看到他們的身影。如今完成美元募資,極具風向標意味。蔡崇信的家族辦公室募集70億這是藍池資本的第一支PE基金。早在2025下半年,正值全球資本重估中國資產之際,藍池資本啟動了這支基金的募集工作,名為Riverside Fund,目標規模為7.5億美元。彼時就有知情人士透露將在2026年初完成首輪募集。今年3月,Riverside Fund實現超募,規模10億美金。此前彭博社曾報導,目標LP包括家族辦公室、主權財富基金、養老金基金,Riverside將尋求對企業價值在1億至10億美元之間的中型企業進行控制性或少數股權投資,三大投資方向為:高端零售和生活方式品牌;金融科技、數字銀行和支付解決方案;人工智慧(AI)和軟體即服務(SaaS)等技術領域。但在《華爾街日報》最新報導中,“全球快速增長的消費品企業”將是投資重點。說起藍池資本,創投圈的印象是低調而隱秘。這是由阿里巴巴集團聯合創始人蔡崇信(Joe Tsai)發起並控制的家族辦公室。最早可追溯至2004年,由蔡崇信和Alexander West在香港創辦,並在2014年正式確立藍池資本主體,持有香港證監會9號資產管理牌照。蔡崇信是核心出資人,早期也涉及馬雲及其他阿里高管的財富管理。所謂“藍池”,象徵著深邃、冷靜與長期主義的投資理念。截至2022年,藍池資本資產管理規模超500億美元(約3600億元人民幣),可謂亞洲頂級家族辦公室。(藍池資本官網,僅此一頁)目前藍池資本的CEO是奧利弗·韋斯伯格(Oliver Weisberg),他擁有深厚的華爾街和避險基金背景,早期職業生涯始於高盛,於2015年左右加入藍池資本,負責日常營運和投資決策。如今藍池資本正在向多家族辦公室及對外資產管理平台轉型,以尋求新的增長路徑與更大規模的交易機會。據悉,藍池資本這些年開始接觸一些規模過大的交易,從而引發了關於募集獨立私募股權基金的討論。梳理下來,現在的藍池資本包括(但不限於):Riverside Fund,首支私募股權基金,規模10億美金,聚焦高端零售、金融科技、AI/SaaS;Harborside Fund,規模5億美金,用於投資避險基金與私人信貸基金;同時,韋斯伯格還和另外一個團隊負責蔡崇信家族的資產營運。過往數年,藍池資本的投資組合包括SpaceX、字節跳動、華領醫藥、騰盛博藥、創新藥研發公司FogPharma、中東版花唄Tabby、Golden Goose黃金鵝等,足跡遍佈全球。其中,對資產管理公司BlueOwlCapital的投資,是藍池資本公開披露的最賺錢單筆上市資產——早年間,藍池通過Dyal Capital(Blue Owl 前身)切入,成為其核心LP與戰略股東,此後Blue Owl通過SPAC上市,股價一度飛漲,藍池帳面浮盈超200%。幾年前,藍池資本已減持,落袋為安。又見蔡崇信幾筆交易震撼創投圈蔡崇信,創投江湖無人不識。1999年,他結識馬雲。彼時,這個草根創業團隊正在尋找VC的投資,而蔡崇信任職於瑞典Investor AB風險投資部香港辦公室。雖然投資最後沒談成,但後面卻成就一段佳話:蔡崇信毅然辭掉年薪70萬美元的風投工作,跑到杭州加入不知前途幾何的阿里。幾經浮沉,蔡崇信職業生涯幾乎獻給了阿里。兜兜轉轉,他如今仍是阿里集團董事會主席。阿里之外,蔡崇信和藍池資本這幾年頻繁出現在創投圈。去年春節期間,義大利高端運動鞋、服裝和配飾品牌Golden Goose Group S.p.A(黃金鵝,簡稱“Golden Goose”)宣佈獲得來自藍池資本約12%的戰略股權投資,成為藍池在大消費領域投資的標誌性一筆。更為人熟知的,是蔡崇信家族對體育資產的投資。2024年6月,布魯克林籃網隊的擁有者蔡崇信將手中的部分股權出售給科赫家族,交易總估值為60億美元(約430億人民幣)。而他此前分批全資購得籃網隊時,花費金額為30億美金——幾年間,蔡崇信這一筆投資不經意翻倍。還有去年6月,美國女子職業籃球聯賽(WNBA)紐約自由人隊以4.5億美元(超32億人民幣)估值出售股權,創下了女子職業體育俱樂部的最高估值紀錄。該球隊背後,正是蔡崇信和妻子吳明華(Clara Wu Tsai),他們曾在2019年以超過1000萬美元買下自由人隊。回到阿里,蔡崇信對於AI極為推崇。早在2024年,他就為阿里明確了“使用者為先,AI驅動”的發展戰略,並說:未來十年,沒有那個行業能免於AI帶來的顛覆。根據阿里最新財報,2025財年全年資本開支約860–925億元,絕大部分投向AI算力、資料中心與自研晶片。前不久的中國發展高層論壇上,蔡崇信分析了中國AI獲得成功並持續發展的幾個因素:國家在電力基礎設施上戰略佈局、共贏互利的開源信念、AI與製造業的深度融合、廣大的市場和應用潛力。他提出AI終極目標是,普及應用、造福社會。中國富豪開始流行家族辦公室過去一段時間裡,藍池資本都是中國家族辦公室的標竿。這在海外早已是一股潮流——正如Google前CEO,埃瑞克·施密特(Eric Schmidt)設立自己的家辦Hillspire;亞馬遜創始人傑夫·貝索斯創辦自己的Bezos Expeditions。如今,我們看到越來越多中國富豪設立家族辦公室,他們不再滿足於傳統的家族財富的理財增值,更是產業戰略延伸的前沿觸角。由此,他們的身影開始密集出現在創投圈。正如春節後,千尋智能宣佈完成近20億元的融資,估值破百億,投資界梳理投資方看到了一個生面孔——明薈投資,這是A股龍頭匯川技術董事長朱興明的家族辦公室;隨後光輪智能融資10億,投資方出現了鼎邦投資——A股三安光電董事長家族辦公室。同樣活躍的“立翎基金”,系立訊精密家族辦公室,近幾年悄悄現身在眾多創業公司身後,例如微納核芯、中芯整合、芯聯動力等。更為知名的是嘉道私人資本,這是“中國最牛天使投資人”龔虹嘉的家族辦公室。這些白手起家的中國富豪們,把目光投向關乎未來的科技賽道。背後邏輯不難解釋,科技新時代日新月異,單純依靠企業的內部研發已不足以應對全球技術的加速迭代,家族辦公室作為靈活、長效的資本工具,悄然成為推動中國科技創新的重要力量。本周,由香港特區政府主辦、聚焦全球家族辦公室的裕澤香江高峰論壇舉辦,當中“AI與機器人技術”作為三場專題討論之一。產業潮水的方向,便是財富的方向。源源不息。 (投資界)
暴拉15%!港股巨頭,突現罕見一幕!重大訊號,悄然來襲!
美團突然大爆發!港股巨頭美團午後持續拉升,漲幅擴大至15%,公司將於明日公佈業績。與此同時,阿里巴巴、京東等股票集體拉升。恆生科技漲幅快速擴大至2%以上。那麼,發生了什麼?市場監管總局轉發經濟日報文章《外賣大戰該結束了》。外賣大戰影響的不僅僅是餐飲業老闆的帳本,更是普通人的生計。此前,恆生科技大跌,外賣大戰就是主因之一。若就此休戰,可能存在估值修正之機。美團午後暴拉恆生科技指數午後漲幅擴大至2%,美團一度漲超15%,阿里巴和京東也一度漲超5%。國家市場監督管理總局轉發經濟日報文章《外賣大戰該結束了》。該文章提到,外賣大戰影響的不僅僅是餐飲業老闆的帳本,更是普通人的生計。當作為“壓艙石”的餐飲消費因價格戰而失速,經濟大盤感受到的寒意,最終會傳導到每個微觀個體。健康的競爭,應該是技術創新、效率提升、服務最佳化的良性角逐,而不是依靠資本堆砌的燒錢遊戲,更不是利用壟斷地位控流量、逼站隊的零和博弈。讓外賣價格回歸合理區間,讓餐飲行業擺脫不補貼就死,一補貼就亂的困境,讓市場競爭從拼砸錢轉向拼服務,這才是真正的惠企利民。價格戰,走不遠;內卷競爭,沒有贏家。外賣大戰,該結束了。今天,國家市場監督管理總局還發佈消息稱,3月23日,北京市市場監管局聯合市商務局、市文化和旅遊局,依法約談和行政指導攜程、去那兒網、高德、京東、淘寶閃購、美團、飛豬旅行、途家民宿、抖音等12家平台企業,集中通報開展平台“內卷式”競爭綜合整治以來發現的第一批問題並提出整改要求。2025年10月起,北京市以住宿、餐飲行業為切口,開展平台“內卷式”競爭綜合整治,陸續發佈《平台“內卷式”競爭行為負面清單》等檔案,通過平台自查、暗訪暗查、飛行檢查、體驗調查“四查聯動”模式,系統排查治理“內卷式”競爭風險。有券商認為,這是行業重大利多,監管介入宣告“燒錢換量”模式終結,競爭回歸效率與服務,利多頭部平台盈利能力與估值修復。報導強調平台大額補貼導致餐飲價格下行,成為制約餐飲行業增速的重要因素,直接將餐飲堂食客單價打回10年前。這種惡性競爭迫使餐飲企業犧牲品質、壓縮利潤,陷入賠本賺吆喝的循環,不僅拖累了消費回暖的大趨勢,更影響了普通人的生計。財報顯示,大戰期間阿里、京東、美團累計補貼高達800億元至1000億元。監管介入意味著低價補貼難以為繼,行業競爭重心將轉向營運效率、服務質量和生態協同。美團等具備規模效應與營運優勢的平台將率先受益。而阿里自身亦有望受益於現金流改善與盈利修復等,在AI等技術領域投入更具充足彈藥。估值存修復之機恆生科技指數自成立以來,市盈率(PE)中位數約22—23倍,當前處於16%—18%分位,顯著低於歷史均值。與恆生指數(PE約12—13倍)相比,科技類股溢價合理(反映成長屬性),但絕對估值已回落至低估區間。2月底機構報告也確認PE為21.20倍(16%歷史分位),風險收益比具備吸引力。此前,外賣大戰爆發,引發了該指數權重股的集體調整,進而帶動整個指數走弱。但從基本面(AI資本開支、網際網路龍頭現金流)來看,並未實質惡化。不少科技頭部公司,近期也頻頻發佈了AI爆款模型,但並未體現在估值當中。分析人士認為,當前估值已充分反映悲觀預期,具備較高的中長期投資價值。但短期仍需耐心等待築底確認,反彈需盈利修復+催化共振;長期看,若中國經濟復甦+AI落地兌現,指數上行空間可觀。不少機構認為,目標隱含20%—30%的修復潛力。另外從地緣來看,廣發證券認為,短期看,“地緣政治無專家”,局勢演繹具備隨機性。中期看,衝擊或被逐步消化,且科技產業周期不輕易言頂。且2026年美國中期選舉,核心議題將是“價格”,那麼當下戰爭局面持續發酵,也並非中期選舉之前可以承受的。2026年全球非美資產牛市的邏輯很難被地緣局勢顛覆,因此,待短期地緣不可控因素消除後,中資股市場可能迎來今年最好的抄底機會。 (券商中國)
2848億!阿里巴巴發佈Q3財報
阿里正式發佈2026財年Q3(自然年2025年Q4)業績。收入:2848.43億元,同比增2%;剔除已處置的高鑫零售、銀泰業務,同口徑增9%。經營利潤:106.45億元,同比降74%;經調整EBITA 233.97億元,同比降57%,主因即時零售、使用者體驗、科技投入增加,被雲業務增長及營運效率提升部分抵消。淨利潤:歸母淨利潤163.22億元,淨利潤156.31億元,同比降66%;非公認會計準則淨利潤167.10億元,同比降67%。每股收益:非公認會計準則攤薄每股美國存托股、普通股收益均同比降67%。現金流:經營現金流淨額360.32億元,同比降49%;自由現金流113.46億元,同比降71%,主因即時零售投入;現金及流動投資5601.75億元。中國電商:即時零售規模擴大,單位經濟效益、客單價環比提升;餓了麼更名為淘寶閃購,2026年1月接入千問App。客戶管理收入1026.64億元,同比增1%;淘寶月活消費者雙位數增長。88VIP會員超5900萬,數量雙位數增長。國際數字商業:季度虧損大幅縮小,速賣通Choice單位經濟效益環比改善。深化韓國合作、推進Brand+計畫,品牌接入與銷量環比大增。雲智能集團:收入432.84億元,總收入、剔除並表後收入分別同比增36%、35%;AI相關收入連續10個季度三位數增長。多項權威評級穩居領先,蟬聯金融雲、混合雲市場第一;發佈新一代AI作業系統,全球佈局29地域92可用區。千問大模型:Qwen3.5發佈,多模態能力、效率、全球覆蓋升級;Hugging Face下載量破10億,為全球熱門開源模型。平頭哥晶片:自研 GPU規模化量產,覆蓋全鏈路AI任務,為雲業務提供算力支撐。千問App:2026年1月打通阿里生態,成為國內首個可規模化執行複雜真實任務的AI助手。春節後使用者激增,2月底近1.4億使用者體驗AI購物,月活超3億。阿里巴巴集團首席執行長吳泳銘表示:“在過去的一個季度裡,我們圍繞‘AI+雲’和‘消費’這兩大戰略重點保持了強勁的投資勢頭。雲智能集團的收入增長加速,同時我們的‘即時零售’業務持續擴大規模,單位經濟效應也在不斷改善。阿里巴巴已建構了完整的全端AI能力,以支援AI需求的指數級增長。本季度,來自外部客戶的雲智能集團收入增速提升至35%,其中AI相關產品收入連續多個季度實現三位數的同比增長。平頭哥的自研GPU晶片已實現規模化量產。關於以‘創造、交付和應用token’為核心使命的應用層,我們成立了新的阿里巴巴Token事業部。我們最近還推出了企業AI代理平台‘悟空’。悟空是全球首個AI原生企業級代理平台,能夠在相容每個組織的資料權限和內部流程的同時,實現企業工作流程的AI驅動升級。關於另一個戰略重點——消費領域。我們持續推進各項戰略舉措。”順便說下,昨晚阿里巴巴美股大跌7%。(BAT)
阿里AI,5年要再造一個阿里
3月19日,阿里巴巴發佈2026財年第三季度(2025年10月至12月)業績。AI+雲的業績表現強勁。根據最新財報,阿里雲加速增長至36%,其中外部商業化收入同比增長35%,AI相關產品收入連續第10個季度實現三位數增長。MaaS業務增速尤為突出,管理層在電話會上首次披露相關資料,最近三個月,百煉MaaS平台上公共模型服務市場的Token消耗規模提升了6倍。預計商業化MaaS收入將會成為阿里雲最大的收入產品。這組資料說明,阿里雲的收入結構正在發生質的變化,AI和MaaS佔比提升正在拉動整體增速上台階。更重要的是,阿里巴巴CEO對AI戰略的商業化給出了清晰目標:未來五年,包含MaaS在內的雲和AI商業化年收入突破1000億美元。以目前年收入1000多億人民幣的水平出發,該目標意味著阿里雲收入將在5年翻7倍,即每年超過有40%的收入增速,如果達成,這好比再造一個阿里。這一指引的底氣來自MaaS帶來的收入結構最佳化和更快的增長節奏,過去市場對阿里雲的定價錨在傳統IaaS的低個位數增長上,如今這個錨正在被重新設定。過去一個季度,阿里的敘事邏輯和業務邏輯都發生了巨大變化。這不再是一家單靠電商基本盤的公司,一個全新的阿里正在浮出水面:"平頭哥"三個字首次寫入阿里財報,AI infra(晶片+雲)+ATH(模型+to b和to C應用)構成了阿里當下體系愈發成熟豐滿的全端AI。放眼全球,擁有同等量級全端AI能力的科技公司,只有Google。在AI Agent時代到來之際,阿里的全端AI佈局所建構的領先地位和性價比優勢,極難被覆制。隨著公司加速推進MaaS優先戰略,阿里的未來想像空間被進一步打開。01組織層進化:Alibaba Token Hub重塑MaaS優先策略理解今天的阿里,必須先理解Token在AI時代的位置。2025年9月雲棲大會上,吳泳銘給出過一個判斷:"Token就是未來的電。絕大部分AI能力將以Token的形式在雲端運算網路上產生和輸送。"他的邏輯是,未來每個人都將擁有幾十甚至上百個Agent,這些Agent全天候不間斷地工作和協同,需要消耗海量計算資源。AI Agent運行的燃料,就是Token。這個判斷在三天前得到了來自全球算力教父的呼應。3月16日GTC 2026大會上,黃仁勳首次系統闡述了"Token工廠經濟學"。他說,未來的資料中心是生產Token的工廠。在固定功率下,誰的每瓦Token吞吐量最高,誰的生產成本就最低。Token正在成為AI時代的核心商品。黃仁勳甚至預測,未來科技公司招聘工程師時,除了薪資外還會提供"Token配額",因為擁有更多AI計算資源的工程師效率更高。中國市場已經在驗證這個趨勢,OpenClaw的爆火又帶動了Token消耗量的非線性增長。MiniMax披露,其Token用量暴增6倍,直接受益於Agent應用的爆發。阿里在這個時間點做了兩件事。第一件是組織變革。3月16日,阿里成立了由CEO吳泳銘直接牽頭的Alibaba Token Hub事業群(ATH),核心目標是"創造Token、輸送Token、應用Token"。ATH整合了通義實驗室、MaaS業務線、千問事業部、悟空事業部及AI創新事業部。吳泳銘在全員信中判斷,"當下正處於AGI爆發前夜,大量數位化工作將由數以百億計的AI Agent來支撐,而這些AI Agent將由模型產生的Token支撐運行。"這一組織架構釋放的核心訊號是:MaaS的戰略優先順序被提到了前所未有的高度,且有了組織保障。用一個類比來理解ATH的架構:通義實驗室是發電廠,負責創造最強模型,生產Token的源頭。百煉MaaS是電網,把Token以API、模型服務等多種產品形態輸送到企業和開發者手中。千問和悟空是用電終端,一個面向C端、一個面向B端,負責讓Token真正流入工作場景產生價值。阿里用一次組織變革,把"生產Token、運輸Token、消費Token"三個環節統一到一個CEO直管的事業群裡。這在全球科技公司中幾乎沒有先例。第二件是資料驗證。電話會上管理層披露的最新資料顯示,過去三個月MaaS平台公共模型服務市場的Token消耗規模提升了6倍。MaaS正在從增量貢獻轉向核心驅動,直接支撐了管理層給出的5年阿里雲年收入1000億美元的目標。MaaS對利潤結構的改善同樣值得關注。大摩在3月16日研報中指出,相比以GPU小時定價的訓練業務,推理和MaaS業務按Token/API收費,可以疊加更多增值服務,定價彈性更大,資源分配也更靈活。隨著AI工作負載從訓練向推理遷移,雲廠商的利潤率有結構性改善空間。大摩還指出,ATH的業務收入和成本結構類似純粹的基礎模型公司(如MiniMax、智譜),有可能在阿里的分部加總估值中成為一個新的獨立估值組成部分。02AI infra(晶片+雲)+ATH(模型+AI應用)構成阿里的全端AIMaaS 戰略的落地,依託的是阿里在底層技術上的全端能力。本季度首次完整披露AI infra(晶片+雲)+ATH(模型+to b和to C應用)戰略體系,標誌著阿里的全端AI佈局正式成型。AI infra(晶片+雲)構築了全端AI的最底層算力與基礎設施底座。在晶片端,平頭哥補齊了最容易被忽略、但含金量極高的底層硬體拼圖。管理層在電話會上表示,其自研GPU晶片已實現規模化量產超過47萬片,並實現了平頭哥年化過百億的營收規模。預計平頭哥可以生產的高品質能源晶片的規模還會持續擴大,為整個集團的AI業務提供充足的算力保障,也能夠為整體AI業務提供非常強大的增長動能。同時管理層表示,平頭哥不排除IPO的可能性,但目前尚無明確時間表。參照GoogleAI佈局中自研晶片TPU的戰略角色,底層晶片的價值不容低估。大摩3月12日研報單獨對這部分晶片業務進行了估值測算,區間在280億至860億美元,這是一個巨大的價值催化劑。在雲端,阿里雲是阿里AI能力向外輸出的超級平台。AI投入持續兌現為業績,在雲和AI領域實現加速增長。根據最新財報資料,阿里雲加速增長至36%,其中外部商業化收入同比增長35%,AI 相關產品收入連續第10個季度實現三位數增長。同時,阿里雲已連續三個季度提升市場份額,升至36%,領先優勢擴大。這些資料充分表明,AI已經成為阿里雲重拾高增長的最強驅動力。ATH(模型+to b和 to C應用)構成了全端AI的智能中樞與生態入口。在模型層,通義實驗室及其開源大模型千問構築了核心競爭力。阿里開源了全新一代大模型Qwen 3.5-Plus,在推理、程式設計、Agent智能體等多維基準評估中表現優異。得益於底層模型架構創新,Qwen 3.5-Plus在百煉平台的API價格低至每百萬Tokens 0.8元,以不到5%的價格獲得媲美Gemini 3的高性能。Artificial Analysis的全球評估顯示,千問是中國超大規模雲廠商中最具智能的模型。應用層的格局也在加速重構。AI to C方面,2025年11月阿里推出千問App,2026年1月千問接入淘寶、支付寶、飛豬、高德等阿里消費生態,春節期間千問依託阿里生態能力推廣AI購物。財報顯示,2月千問 C 端月活躍使用者已達3億。AI to B方面,阿里在全球公測了AI to B Agent悟空。這是阿里AI能力在企業工作場景的統一出口,也是全球首個企業級AI原生工作平台。至此,阿里AI Agent正式形成以千問為C端旗艦、悟空為B端旗艦的雙引擎格局。千問 App 和悟空同時也是 Token 消費的兩大核心入口,它們的使用者增長和使用深度,直接拉動 MaaS 平台的 Token 呼叫量。底層Infra與上層ATH協同的結果是,阿里能以更低的成本生產Token,以更高的效率輸送Token,最終通過MaaS將Token商業化。這正是全端AI體系的核心競爭力所在。03投資邏輯切換:定價全端技術優勢的token商業化能力過去三個多月,阿里在AI領域動作頻頻。大摩在3月密集發佈了多份與阿里相關的重磅研報,投資邏輯的核心線索清晰可見。3月12日的研報標誌著一個關鍵轉向,報告提出,擁有完整四層AI堆疊(晶片、雲、模型、應用)的公司,成為AI贏家的機率大幅提高。在中國四大雲廠商的對比中,阿里是唯一在每一層都拿到最高評級的公司。大摩據此將阿里上調為中國網際網路行業首選(Top Pick),取代了此前的騰訊。3月16日的AI雲市場深度報告進一步量化了賽道空間。大摩預測中國AI雲2024至2029年複合增長率將達72%,市場規模從150億元人民幣膨脹至2180億元。更值得關注的是大摩對雲定價周期的判斷。大摩認為中國雲端運算市場正在迎來20年來首次提價周期。大摩測算,阿里雲每提價1%,EBITA利潤率即可提升1個百分點,或推動EBITA預測上調11%。若整體合同價格提升10%(假設每年20%的合同到期續簽),EBITA利潤率將擴張4個百分點,這一利潤彈性,是當前市場尚未充分定價的核心變數。就在大摩研報發佈的2天後,阿里雲宣佈AI算力和儲存產品最高漲價34%。ATH事業群組建之際,大摩點評則從組織角度給出正面評價。大摩認為,ATH的成立印證了Token使用量爆發背後的AI需求增長趨勢,進一步強化阿里在AI token商業化方面的競爭優勢。多份報告疊加在一起,傳遞出一個統一訊號:阿里正在從中國網際網路公司轉型為一家全端AI基礎設施公司,它的估值錨點也正在從電商PE倍數,向雲+AI的PS倍數遷移。支撐這次遷移的,是一套完整的體系:底層有平頭哥自研晶片與千問開源大模型壓陣,中間有百煉MaaS平台統一調度Token的生產與流通,頂層有千問和悟空兩大旗艦Agent拉動C端與B端的Token消費,外加最高決策層直管的Token Hub事業群為整個鏈條護航。隨著算力成本的進一步最佳化、Token商業化能力的全面釋放,以及雲端運算提價周期帶來的利潤彈性,阿里在AI時代的長期商業價值,正迎來一次全面且深遠的重估。 (華爾街見聞)
監管批准字節跳動、阿里巴巴、騰訊等公司哦買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻
監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻/比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始/小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%監管剛批了40萬塊H200,黃仁勳轉頭宣佈:我已經開始重新生產了!今年1月,監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片,總價值約100億美元。這是中美晶片博弈裡罕見的"開綠燈"時刻——美國出口管制繞了一大圈,監管蓋了章,DeepSeek也在其中拿到了有條件購買許可。(來源:Reuters、《華爾街日報》)與此同時,中國官方發言人回應說"不瞭解具體情況"——100億美元的訂單,官方說不知道,這已經是一種態度了。更快的是輝達這邊。2026年3月17日,CEO黃仁勳在GTC大會上直接宣佈:已收到來自"眾多客戶"的訂單,H200中國版正在重啟生產。幾周前訂單來了,幾周內工廠開動。禁令、解禁、重啟,這條鏈條走完只用了不到兩個月。100億美元擺在那裡,到底是管制有效,還是管制本身就是一筆生意?(來源:Axios、CNBC)不是降級版!輝達Groq晶片5月入華,這次連"特供"都省了輝達去年底以約200億美元收購了推理晶片公司Groq,現在這顆晶片要直接賣給中國了。據Reuters消息,輝達正在為中國市場準備一款Groq晶片,預計5月上市,面向AI推理業務——也就是模型跑起來之後回答問題、執行任務那個環節。更關鍵的是,知情人士明確透露:這款晶片不是降級版,也不是專為中國特供的閹割版本。(來源:Reuters)之前H20是專門為中國"定製"的縮水版,這次連縮水都免了。這個時間點很微妙。H200剛剛重啟生產,Groq非降級版緊跟著入場,輝達在中國市場一口氣佈局兩條產品線。可美國出口管制的框架還掛在那裡,Groq晶片究竟走的是那個口子,目前沒有官方解釋。監管還沒表態,晶片已經在路上——黃仁勳每次在華盛頓和監管之間走鋼絲,都比上次走得更穩一點。(來源:Reuters)五角大樓要讓AI公司進軍事機密庫訓練模型,這件事比你想像的更炸這件事3月17日才被MIT Technology Review報導出來,五角大樓正在討論一個計畫:為AI公司建立安全隔離環境,讓它們用機密軍事資料訓練專屬的軍用版模型。不是部署,是訓練。意味著OpenAI、Anthropic或者Google的工程師,理論上可以接觸到美軍的機密資料集來"喂"模型。這是一個史無前例的方向,之前從來沒有商業AI公司被允許碰這類東西。(來源:MIT Technology Review)背景是:OpenAI已經與五角大樓簽了在機密網路中部署AI系統的協議,國防部也在今年1月發佈了AI戰略備忘錄。問題是,訓練和部署是兩件性質完全不同的事。部署是讓AI用軍事資訊,訓練是讓軍事資訊變成AI的一部分——這兩者之間的資料安全邊界,目前沒有任何明確的技術標準或法律框架來界定。Hegseth已經警告Anthropic必須配合軍方,OpenAI也大方接單。但誰來決定這些模型最終學到了什麼、記住了什麼,答案目前是:沒人知道。(來源:MIT Technology Review、PBS)GPT-5.4 mini和nano來了——OpenAI說這是"最強小模型",速度快了2倍多OpenAI正式發佈GPT-5.4 mini和GPT-5.4 nano,主打Agent、程式碼生成、多模態工作流,定位是"以極低成本提供接近GPT-5.4水準的性能"。GPT-5.4 mini相比上一代GPT-5 mini,在程式設計、推理、多模態理解、工具呼叫上全面提升,速度快了2倍以上;兩款模型都支援40萬token的超長上下文窗口(大約30萬個漢字),專門針對需要大量子任務串聯的Agent場景做了最佳化。(來源:OpenAI、ZDNET)這對開發者來說是實打實的降本消息——頂級性能的七成,花頂級價格的一個零頭。但OpenAI這一步的棋感,很微妙。GPT-5.4 mini是給API用量大、成本敏感的企業用的,nano是面向更高頻的輕量場景。兩款小模型同時推,等於在Agent賽道上把價格門檻砸穿——競爭對手做的那套"小模型夠用論",OpenAI直接親自驗證了。Anthropic、Google同樣有自己的"小強模型",但現在面對的問題是:你的小模型,是不是真的比OpenAI的小模型更小、更便宜、還更好用?(來源:OpenAI、ZDNET)阿里、騰訊都搶了,百度終於把"小龍蝦"塞進了小度音箱中國AI圈這陣子有個新詞叫"養龍蝦"——OpenClaw是一個開源AI Agent框架,因為logo像龍蝦,被叫爆了。騰訊最先動,做了QClaw接入微信和QQ;阿里隨後跟上。3月17日,百度宣佈將OpenClaw整合進旗下小度(Xiaodu)智能音箱,讓小度變成一個語音控制的Agent遙控器,用一句話就能觸發跨應用的複雜任務。(來源:Bloomberg)三大廠同台,百度靠的是硬體入口:小度的螢幕和麥克風,是其他兩家沒有的物理觸點。但有趣的是,在這場搶跑裡,百度的AI雲收入剛剛同比增長38%,OpenClaw的整合宣佈同一天發佈,時機選得極準——用一個熱詞捆綁一個財報數字,這是一種很熟練的敘事操作。問題是,把Agent塞進音箱和塞進聊天框,那個更容易讓使用者真的用起來?目前沒有任何資料,三家都在同一起跑線上等答案。(來源:Bloomberg)阿里巴巴發佈"悟空"平台,讓AI幫企業打工——現在還在內測阿里巴巴正式推出企業級AI平台"悟空(Wukong)",目前處於封閉測試階段。悟空的核心邏輯是協調多個AI Agent配合工作,處理文件編輯、表格操作、商業研究等複雜企業任務——不是一個聊天機器人,而是一套能"自己分工幹活"的Agent調度系統。(來源:Reuters)時間節點同樣刻意:剛好在中國agent熱潮爆發的那個當口,騰訊在聊,百度在跟,阿里這次選擇先做企業端。悟空和同期宣佈的"Token Hub"是阿里AI戰略的兩面。Token Hub是整合阿里所有AI研究、消費者產品、AI應用的新業務集團,由CEO吳泳銘(Eddie Wu)親自掛帥,核心命題是AI變現。(來源:Bloomberg)悟空是變現的產品抓手,Token Hub是整合內部資源的組織容器——從架構上看,這是阿里把AI從"成本中心"推向"利潤中心"的一次整體操刀。但封閉內測的悟空究竟什麼時候能開放,阿里沒說。(來源:Reuters)Manus突然下載到我電腦裡了!"My Computer"讓AI Agent徹底告別雲端2026年3月16日,Manus正式發佈桌面應用,核心功能叫"My Computer"——可在Windows和macOS上運行,讓AI Agent直接訪問你的本地檔案、瀏覽器、應用程式,以及在你電腦空閒時自動幹活。這是Manus從雲端走向本地的關鍵一步。之前Manus能做的事,都發生在遠端沙盒裡;現在它可以直接讀你的項目資料夾、開你本地的IDE、在你不看螢幕的時候繼續工作。(來源:Manus官網、9to5Mac)這不是"助手",更像一個在你電腦裡常駐的無聲員工。這件事最讓人不安的地方,恰恰是它最吸引人的地方——AI終於能碰你真實的本地資料了。雲端Agent和本地Agent的最大區別,就是這道"能不能接觸到你實際工作環境"的門檻。Manus選擇在這個時間點把門踢開,意味著Agent賽道的戰場從"在雲上幫你查資料",正式移到了"在你的電腦裡幫你幹活"。Cursor在程式碼領域已經打通了這一層,現在Manus要在更寬泛的通用任務上複製這條路——誰先讓使用者真的放心把電腦交出去,誰就贏了。(來源:Manus官網)比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始輝達在GTC 2026大會上宣佈:比亞迪、吉利、五十鈴、日產四大車企將採用其DRIVE Hyperion自動駕駛平台,支援Level 4等級無人駕駛車輛。同時,Uber與輝達擴大合作,計畫2027年上半年率先在洛杉磯和舊金山推出全端Robotaxi服務,並於2028年擴展至覆蓋四大洲的28個城市。(來源:Nvidia官方、The Verge)一次發佈會,輝達同時繫結了整車製造端和出行營運端——中美日的車企,全進了這張網。這個陣容有點意思。比亞迪和吉利是中國新能源頭部,五十鈴是日本商用車代表,日產是傳統燃油巨頭——四種不同背景的車企,同時選了輝達的同一套平台,這本身就是一種背書。Waymo已經在舊金山和鳳凰城跑了好幾年,Cruise折戟,特斯拉Full Self-Driving還在講故事;輝達這次的策略不是自己造車,而是把自己做成Robotaxi時代的"底盤供應商"。2027年不到兩年,洛杉磯的街上會不會真的有Uber+輝達的無人車跑起來,值得盯著看。(來源:Reuters、The Verge)騰訊QClaw內測,14億微信使用者的手機裡快要住進一隻"AI龍蝦"了騰訊正在內測一款名為QClaw的產品——這是OpenClaw的微信/QQ雙端一鍵啟動包,讓使用者直接在微信聊天框裡調起AI Agent,完成本來需要跨多個App切換才能做完的任務。(來源:新浪科技、知乎)微信12億活躍使用者,QQ幾億年輕使用者,QClaw一旦全面上線,等於給OpenClaw這套開源框架接上了一個全球最大的流量入口。騰訊之前在AI產品上一直給人"慢半拍"的感覺,這次的動作算是把入口優勢打出來了。但QClaw目前只是內測,預計"近期上線"——沒有正式發佈日期。在這條賽道上,阿里的悟空也在等開放,百度小度已經宣佈整合,OpenClaw在中國的生態正在被三大廠同時圈地。微信入口的流量是真實的,但Agent能不能在14億人的聊天框裡真正活下來,取決於它能不能在一個"對話"介面裡把任務做得比人工快。這一步,騰訊比阿里和百度都更有條件驗證——問題只是它動不動得快。(來源:36氪、財富號)小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%2026年3月16日,小米MiMo大模型負責人羅福莉與監管大學研究團隊聯合發佈ARL-Tangram系統,這是一套針對Agent強化學習的統一資源管理框架,核心數字是:將強化學習訓練步驟持續時長縮短至多1.5倍,節省高達71.2%的外部算力資源,同時在真實世界Agent任務上平均ACT提升4.3分。(來源:IT之家、新浪財經)簡單說,同樣的訓練效果,花的錢不到原來的三成。這在當下算力極度緊缺、訓練成本居高不下的背景下,是非常實際的突破。但這篇論文更值得注意的,是它的位置。羅福莉是小米內部MiMo模型的負責人,ARL-Tangram發的不是產品,是學術論文——小米在用學術成果的方式宣示自己在大模型基礎研究上有真正的積累。三月的AI圈到處是"發佈會",小米選擇發一篇論文。在大廠裡,這種動作通常意味著:接下來會有更大的東西落地。算力成本降了70%,下一步的問題是,這個效率用在那裡?(來源:搜狐、IT之家)Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻2026年3月16日,月之暗面三位聯合創始人楊植麟、吳育昕、周昕宇與數十名研究員聯署,發佈了一篇純架構層面的技術報告。他們重新設計了大模型的核心結構——殘差連接(Residual Connection),這個元件自2015年引入Transformer以來,超過10年幾乎沒有人動過。Kimi的方案讓每一層能夠選擇性地關注此前各層的輸出,而不是統一求和,實驗結果是48B參數規模的模型訓練效率提升1.25倍。(來源:新浪財經、澎湃新聞)論文發出後,馬斯克本人評價"令人印象深刻",前OpenAI研究科學家Andrej Karpathy同樣給予好評。這篇報告的戲劇性,不在於那1.25倍的效率提升,而在於它選擇攻擊的目標——一個10年沒人敢改的基礎元件。大多數模型創新發生在訓練方法、資料配比、規模擴展上;動架構本身,是風險最高也最難被外界驗證的路。三位聯合創始人都署名,不像是一篇普通論文,更像是一份聲明:Kimi在做自己的事,而不是跟在別人後面堆參數。馬斯克和Karpathy的背書,給了這篇論文在國際AI圈的能見度——但它能不能真正改變下一代模型的架構選擇,還需要時間驗證。 (AI Daily Insights)