“AI Infra 就是雲端運算本身。”100 多年前,電力首次進入工廠,許多工廠主做了一個看似合理的決定:保留複雜的蒸汽機傳動軸和皮帶系統,只用電動機替換蒸汽機。結果令他們大失所望:動力更強了,生產效率幾乎沒有同步提升。接下來的 20 年,他們才逐步意識到,電力帶來的真正變革不只是簡單替代動力源,而是把它嵌入到不同的業務單元中,用不同類型的電機驅動鑽頭、傳送帶等,生產力才迎來爆發。這是阿里雲希望給企業深入應用 AI 提供的能力。他們認為,AI 時代客戶要的不只是單一的模型或雲的能力,而是更低成本使用更強模型時,有更靈活的綜合體驗。AI 雲應該像當年的電力真正提高工業生產力時那樣,提供多層次的服務,全面嵌入到企業的業務流程中。這一判斷有業務資料支撐:在阿里雲上呼叫大模型 API ( MaaS 服務)的客戶中,有七成也同時在使用其 GPU 算力服務。阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光說,第一批深度使用 AI 的客戶,會把場景分成不同檔次:不只是簡單呼叫大模型 API,還會用內部資料精調或者後訓練基礎模型,或者自己從頭訓練一個模型。在劉偉光看來,AI 給雲端運算行業帶來的變化才剛剛開始,整個雲端運算體系架構都要為 AI 重構,“MaaS 增長潛力很大,但關鍵是打贏 AI 雲新增的全量市場”,要建立軟硬一體的 AI 雲全端能力,推動企業用更低成本呼叫更強的 AI 模型,解決不同層次、不同場景問題,“這才是競爭中的勝負手”。146 個 行業客戶深度調研:Token 質量比數量重要“如果今天所有的 AI 應用每天只能免費用 100 次,你會用它做什麼?”這是劉偉光 2025 年走訪了 146 個客戶後反覆思考的問題。 他的結論非常直接:沒有人會把它浪費在寫段子或閒聊上,一定會做最重要的東西——對工作最有幫助的決策、對家庭生活最關鍵的建議。在他看來,這是企業使用大模型與個人使用者的本質區別。個人使用者可能為了娛樂消耗 Token,但追求效率的企業,每一次 Token 的交換都有成本。他們不僅要為 Token 付費,業務線上的人力、時間也是投入。很難想像一個年輕的工程師面對裝置故障時,還需要多輪對話才能得到解決方案,需要更快的響應、能讓他迅速解決問題的指南。同樣,基金公司的交易員用 AI 輔助捕捉交易訊號時,也很難容忍模型動輒陷入沉思,然後給出長篇大論,再問一句 “是否需要我幫你整理得更完善”。傳統行業的企業正在用不同的方式,儘可能避開 AI 的短板、提升效率。比如汽車診斷公司,用 30 年積累的產業檢測報告做出來遠端幫助汽修的大模型,才用到診斷報告中;基金公司會用沉澱 20 多年的資料和交易的行為跟模型結合,把各種形式的非結構化資料(如文字、語音、圖像等)轉化為可供投資參考的標準化資訊。企業也希望充分挖掘 AI 的潛力。中國兩家農牧業巨頭公司都在用千問做相同的事情,他們不僅嘗試用 VL(視覺大模型)識別豬的數量,還用它來識別豬的異常行為,檢測豬的健康與活性,或者是開發獸醫大模型解決專業人才短缺問題。還有頭部照明公司接入千問後,不再侷限簡單的開關燈或者調控色溫,還用 AI 理解使用者模糊的指令,用更流暢的對話打造更聰明的端側語言模型,讓人與光的互動更自然。而企業一旦找到合適的方式把 AI 嵌入業務流程中,就會是嚴肅和連貫的。線上招聘行業中的每一家公司,幾乎都在引入 AI 簡歷篩選、智能化面試、自動生成面試記錄。當招聘專員習慣用 AI 輔助工作後,就會形成新的工作流,每天都會使用,不會受到個人喜好影響。“個人消費者使用 AI 的情況會有波動,但企業級市場只會不斷增長。” 劉偉光說,而且使用的廣度和深度會不斷加強,很多場景還沒有解鎖,“如果 AI 能把車損定損給改了,那絕對是一種 ‘革命’。”2024 年雲棲大會上,阿里巴巴集團 CEO 吳泳銘在演講中稱,生成式 AI 最大的想像力,絕不是在手機螢幕上做一兩個新的超級 App,而是接管數字世界,改變物理世界。過去一年中國 AI 企業市場的發展證實了他的判斷。AI 已不只在手機裡面作為應用程式,而是出現在更多的載體中,包括眼鏡、耳機、學習機、玩具、健身器材、汽車、機器人等全品類硬體裝置中。這種不同層次、不同場景的需求,當下無法用單一的模型 API 服務滿足。在美國市場,原本已經給企業提供工具的 SaaS 行業,大模型呼叫量規模持續上漲,提供了一種相對標準化的方案。而在 SaaS 行業未能發展起來的中國市場,傳統行業偏向定製服務解決特定場景問題,往往需要後訓練或者微調大模型。雲端運算公司提供這樣的服務,在一定程度上為企業提供了類似 SaaS 的服務。“現在所有 MaaS 服務加一起,在中國雲端運算市場、甚至 AI 雲市場佔比都不高。MaaS 的空間當然非常大,但不是今天。” 劉偉光說,只統計公有雲市場大模型 API 的呼叫量,無法代表 AI 雲全貌。真實的 Token 消耗量,要把 MaaS 平台 API 呼叫、公共雲 GPU 推理叢集產生 Token、私有化模型部署產生 Token,裝置端模型產生的 Token 等全部統計在內。“冰川下的 Token 消耗非常大,卻無法統計。而且企業用 AI 還處於轉型早期, 90% 以上的企業還沒有真正行動起來,未來肯定是百倍的增長。”但可以觀察的是,只要基礎模型的性能持續提升,雲廠商深入到技術堆疊的每一層提供服務,改進推理能力、節省成本,就可以帶動更多行業的更多客戶用 AI 解決問題。做 AI 時代的基礎設施,承接不同層次的需求輝達 CEO 黃仁勳曾拋出一個著名的論斷:GPU 叢集就是 “Token 工廠”,輸入的是能量,輸出的是 Token。這是典型的晶片公司視角,把 AI 生產過程簡化為了物理層面的能量轉換。對於雲廠商來說,如果只是從事算力轉售業務,現在很難提供可用的 AI 服務。他們必須用系統工程能力,儘可能提升現有算力效率,針對不同行業、不同層次的企業提供模型服務。這也是阿里雲的選擇:做 AI 時代的基礎設施。用劉偉光的比喻來說,阿里雲正在搭建的是一套現代化的自來水廠,而不只是水(大模型 API)的搬運工,還要維護水源地(開源模型)、搭建淨化車間(資料清洗與模型訓練平台)、鋪設輸水管網(高性能網路),以及處理污水(安全治理)等。在這套體系中,阿里雲能夠提供當前不同類型的 “用水” 需求:MaaS(直供水服務): 就像家庭擰開水龍頭就能用水,企業或者開發者不用關心底層複雜的管網,直接呼叫 API,開箱即用,按需付費。這是最輕量的接入方式。PaaS(工業用水服務): 類似於工廠需要特定的水源,企業可以獲得基礎模型,直接用 “開源模型” 在阿里雲平台上微調或者自己後訓練,然後部署到合適的環境中。IaaS(水處理基礎設施): 像是將經過初步淨化、萃取後的水源,輸送給飲料廠或啤酒廠,企業可以用阿里雲提供的算力和基礎軟體,用來訓練獨家配方的 “飲料”,比如自動駕駛模型、各種垂類大模型等等。阿里雲已經有了初步成績。根據市場調研機構 Omdia 資料,2025 年上半年,中國 AI 雲整體市場(AI IaaS+PaaS+MaaS)規模達 223 億元,阿里雲佔比 35.8 %,超過第二到第四名總和。搭建這套全面的基礎設施,不僅需要高昂的投入,還要有戰略決心。2025 年 2 月,阿里宣佈未來三年將投入超過 3800 億元,用於建設雲和 AI 硬體基礎設施,總額超過去十年總和。僅僅是 2025 年前三個季度,阿里用於建設 AI 資料中心等的資本開支就兌現了 950 億元。在基礎模型層面,阿里持續投入訓練不同尺寸、不同類型、不同模態的基礎模型,並投入資源把它們做到第一梯隊。比如視覺生成模型萬相 2.6 性能媲美 OpenAI 的 Sora 2;Qwen-Image-Layered 是業界首個能實現圖像分層精準編輯的模型;Qwen3-Max 的性位居全球模型性能榜單前列。阿里選擇把這些模型開源,提供給各行各業的團隊或企業使用,其中 Qwen 的衍生模型數量超過 18 萬,規模位居全球第一。作為基礎設施,阿里雲上長出來的不只有阿里自研的模型,月之暗面也在阿里雲上訓練 Kimi 系列模型,以及許多智駕團隊也用阿里雲訓練模型。與此同時,阿里雲也提供了一整套體系能力,支撐 AI 時代新誕生的產品迅速發展,除了阿里體系的千問 App,還有螞蟻集團的靈光、阿福,以及月之暗面的 Kimi 應用、MiniMax 的海螺等。儘管當前各行各業應用 AI 還處於早期階段,但定位基礎設施的阿里雲,也在探索更新的產品形態,為接下來的 AI 應用爆發做好準備。最典型的例子就是阿里正在開發千問 App 的 Agent 版本。它不只侷限於使用者提問,還能夠呼叫淘寶比價、使用高德導航,甚至阿里所有的服務都有可能成為它的外掛。最終這些在阿里內部業務和行業頭部公司驗證過的能力,都會沉澱在阿里雲中,成為對外提供服務的產品。讓客戶具備長期、可持續地產生和使用智能的能力,而不是把客戶鎖定在某一種計量方式裡。AI 加速推動客戶上雲AI 正在給雲廠商帶來了新的增長動力。無論是 AWS、微軟 Azure、Google Cloud 還是阿里雲,規模都在迅速增長。但提供動力的不只是 GPU 用量或者大模型 API 的呼叫。阿里雲團隊觀察到, 在阿里雲上使用這些服務的客戶群體,他們在計算、儲存、網路以及巨量資料等產品上用量的增長,高於整個大盤的增長。“AI 會加速推動客戶上雲。” 劉偉光說,客戶為了用好 AI,不得不將資料全面上雲。企業想要讓一個 Agent 產生價值,基礎模型只是一個方面,高品質的業務資料同樣重要。微軟 Azure 的增長邏輯類似,出售 OpenAI 的基礎模型的 API 服務只是其中一個方面,更充足的動力來自企業為了在業務中應用更強的模型,把分散在本地與各系統中的內容與資料,遷移到了更方便模型呼叫的雲產品中。為高並行 Web/HTTP 請求設計的傳統雲端運算架構,難以高效支撐這樣的需求。甲骨文重新獲得增長動力,很大一部分因素就來自於部署 RDMA(遠端直接記憶體訪問)高性能網路和自治資料庫,適應了大模型訓練、推理的需求。這直接改變了公共雲端運算服務在中國市場的前景。此前多年,中國雲端運算公司並不像 AWS 等海外雲平台那樣,公共雲客戶遍佈各行各業,囊括美國證券交易所、大型石油公司、銀行業巨頭等,做大規模就能擁有利潤。在中國雲端運算市場,平台依賴的電力、頻寬等基礎設施成本並不受企業自身控制;部分傳統企業出於資料安全、合規或歷史慣性等原因,仍傾向於自建資料中心。“阿里雲的基礎雲架構,為 AI 重做了一遍。” 劉偉光說,AI Infra 並不是一個特定的垂直方向,就是雲端運算本身,不僅需要規模化、安全和穩定,更需要雲上的跨服務流轉能力,比如新型的向量資料庫、高效的巨量資料清洗平台、靈活的開發框架,滿足企業不同層次、不同場景使用 AI 的配套軟體體系。在阿里雲看來, AI 時代雲端運算平台的競爭力在於 “軟硬一體化” 的體系能力:硬體不只是晶片,而是圍繞 GPU 算力建構的整個高性能底層架構;軟體則是對模型的理解、最佳化和調度能力。“阿里雲的目標是拿下 2026 年中國 AI 雲市場增量的 80%。” 劉偉光說,但是下一年增量的 10% 都會大於上一年的全量。所以過去取得了什麼成績並不重要,變化才剛剛開始。 (晚點LatePost)