在全球人工智慧技術競爭日趨激烈的背景下,阿里巴巴作為中國 AI 技術創新的領軍企業,其技術能力和發展戰略備受關注。2025 年 9 月 24 日,在雲棲大會上,阿里巴巴集團 CEO 吳泳銘宣佈阿里雲重磅升級全端 AI 體系,標誌著阿里巴巴在 AI 領域的戰略佈局進入新階段。
研究背景與動機:當前,全球 AI 技術正經歷從單點突破向系統性能力建設的轉變,各大科技巨頭紛紛加大在 AI 基礎設施、大模型技術和應用生態方面的投入。阿里巴巴作為全球四朵 "超級 AI 雲" 中唯一採取 "全端自研" 路徑的中國公司,其技術發展路徑和能力建設對中國 AI 產業具有重要示範意義。特別是在中美科技競爭加劇的背景下,阿里巴巴的技術自主性和創新能力成為關注焦點。
研究目標與框架:本研究旨在全面分析阿里巴巴 AI 技術能力的最新發展狀況,重點關注其 "全端自研" 技術路徑的實現情況、核心技術成果的創新水平、開源生態建設的影響力以及商業化應用的成效。通過系統性分析,揭示阿里巴巴在全球 AI 技術競爭中的地位和優勢,並為相關決策者提供參考依據。
研究將從六個核心維度展開:技術體系架構的全端自研能力、四大技術研究方向的創新突破、核心技術成果的深度解析、開源生態建設的全球影響力、商業化應用的市場表現以及競爭格局中的差異化優勢。
1.1 阿里雲全端 AI 體系的整體架構
阿里雲已建構了從底層晶片到上層應用的完整 AI 技術堆疊。根據 2025 年 9 月雲棲大會的最新發佈,阿里雲 AI 基礎設施全面升級,展示了從底層晶片、超節點伺服器、高性能網路、分佈式儲存、智算叢集到人工智慧平台、模型訓練推理服務的全端 AI 技術能力。
"全端人工智慧服務商" 定位清晰。阿里雲的技術佈局覆蓋模型層、平台層與基礎設施層,形成閉環生態。在模型層,阿里通過通義家族實現全模態、全尺寸覆蓋;在平台層,阿里雲通過百煉平台提供模型定製與 Agent 開發服務;在基礎設施層,阿里雲提出 "超級 AI 雲是下一代電腦" 的願景。
基礎設施規模實現跨越式增長。過去一年,阿里雲 AI 算力增長超 5 倍,AI 存力增長 4 倍多。在 AI IaaS 層,阿里雲在全球 29 個地域開放了 90 個可用區,為客戶提供 GPU 彈性算力和靈駿大規模 AI 訓練叢集服務,並且擁有高性能儲存 CPFS 和高性能網路 HPN7.0。
1.2 平頭哥 AI 晶片的技術突破
平頭哥半導體在 AI 晶片領域實現多項重大突破。2025 年 9 月 16 日,央視新聞聯播披露了平頭哥 PPU 晶片的關鍵技術參數,標誌著中國在人工智慧核心硬體領域取得重要突破。
PPU 晶片技術參數達到國際領先水平。PPU 晶片採用 HBM2e 高性能記憶體技術,視訊記憶體容量達到 96G,與輝達最新款 H20 晶片持平;在卡間互聯頻寬方面 PPU 達到 700GB/s,介於輝達 A800 和 H20 之間;功耗僅為 400W,顯著低於 H20 的 550W。
倚天 700 + 晶片展現強勁性價比優勢。平頭哥的雲端推理晶片倚天 700 + 算力達到 125TOPS,功耗 350 瓦,比 H20 低 15%,採用中芯國際 14 奈米工藝製造,月產能 8 萬塊,2025 年底前將增加到 15 萬塊,價格 1.9 萬美元,比 H20 便宜 32%。
含光系列晶片奠定技術基礎。平頭哥在 2019 年發佈的首款資料中心推理晶片 "含光 800",基於台積電 12nm 工藝,整合 170 億電晶體,性能峰值算力達 820 TOPS,在業界標準的 ResNet-50 測試中,推理性能達到 78563 IPS,能效比達 500 IPS/W。
1.3 飛天作業系統與 CIPU 2.0 的協同創新
飛天作業系統展現世界級調度能力。飛天作業系統能同時調度 100 萬個伺服器,相當於 "給 100 萬輛車規劃路線不堵車",這在全球只有Google能做到。飛天核心負責統一管理資料中心內的通用伺服器叢集,調度叢集的計算、儲存資源,支撐分佈式應用的部署和執行,並自動進行故障恢復和資料冗餘。
CIPU 2.0 實現硬體加速架構升級。基於全新的 CIPU2.0,阿里雲新推出磐久 AI 伺服器,實現單機 16 卡、視訊記憶體 1.5T 以上,支援 Solar RDMA 互聯。CIPU2.0 實現了 400Gbps 的高吞吐硬體資料加速架構,將整機穩定性提升 20%,還大幅提升了安全性,創新實現資料全生命周期安全。
磐久伺服器達到業界領先水平。新一代磐久超節點伺服器由阿里雲自主研發設計,具備高密度、高性能和高可用的核心優勢,可高效支援多種 AI 晶片,單櫃支援 128 個 AI 計算晶片,密度刷新業界紀錄。磐久超節點整合阿里自研 CIPU 2.0 晶片和 EIC/MOC 高性能網路卡,採用開放架構,擴展能力極強,可實現高達 Pb/s 等級 Scale-Up 頻寬和百 ns 極低延遲。
1.4 通義千問大模型的技術架構創新
通義千問採用 Transformer 架構的深度最佳化版本。通義大模型基於 Transformer 架構建構,其核心在於自注意力機制,能夠讓模型在處理序列資料時,關注輸入序列的不同部分,從而更好地捕捉長距離依賴關係。
Qwen3 系列實現架構突破。Qwen3 密集模型的架構與 Qwen2.5 類似,包括使用 GQA(Grouped Query Attention)、SwiGLU、RoPE 和預歸一化的 RMSNorm。此外,刪除了 Qwen2 中使用的 QKV-bias,並在注意力機制中引入了 QK-Norm 以確保 Qwen3 的穩定訓練。
混合專家 (MoE) 架構大幅降低部署成本。Qwen3 採用混合專家 (MoE) 架構,總參數量 235B,啟動僅需 22B。性能大幅提升的同時,Qwen3 的部署成本還大幅下降,僅需 4 張 H20 即可部署千問 3 滿血版,視訊記憶體佔用僅為性能相近模型的三分之一。
2.1 電腦視覺:內容安全與視覺理解的前沿探索
阿里巴巴人工智慧治理與可持續發展研究中心(AAIG)在電腦視覺領域形成完整技術體系。AAIG 致力於研究內容安全領域複雜場景下的電腦視覺前沿技術,攻關人工智慧與內容安全相結合的視覺巨量資料分析的關鍵技術,研究方向包括視覺大模型、動態網路設計、視覺樣本生成、開放域識別、終身學習等。
"御風" 大模型解決多模態內容安全挑戰。AAIG 致力於打造內容安全領域大模型 "御風",解決內容安全場景音、視、圖、文、多模態、多語言的高難隱晦風險挑戰。相關技術應用於細粒度風險圖片分類、高危目標檢測、億級圖片檢索、敏感人臉識別、內容風控 OCR 等阿里巴巴集團內容安全場景中。
Qwen-VL 視覺理解模型實現重大突破。阿里雲通義千問發佈的 Qwen-VL 視覺理解模型,在精準確識別萬物的基礎上,還能解析圖像的佈局結構及其中的文字、圖表、圖示等複雜內容,從一張 app 截圖中就能分析出插圖和可點按鈕等元素。在時間處理上,新模型引入了動態影格率(FPS)訓練和絕對時間編碼技術,使得 Qwen2.5-VL 不僅能夠準確地理解小時等級的長視訊內容,還可以在視訊中搜尋具體事件,並對視訊的不同時間段進行要點總結。
Qwen3-VL 在 32 項核心能力測評中超越國際先進水平。阿里開放原始碼的 Qwen3-VL 模型在視覺感知和多模態推理方面實現重大突破,在 32 項核心能力測評中超過 Gemini2.5-Pro 和 GPT-5。同時,Qwen3-VL 大幅提升了視覺 Agent、視覺程式設計和空間感知等關鍵能力,不但可呼叫摳圖、搜尋等工具完成 "帶圖推理",也可以憑藉一張設計草圖或一段小遊戲視訊直接 "視覺程式設計"。
2.2 自然語言處理:大語言模型的推理與理解能力
AliceMind 語言模型體係獲得國內外 50 + 著名評測第一。阿里雲 NLP 打造了具有領先性和系統化的深度語言模型體系 ——AliceMind,獲得國內外 50 + 著名評測第一,支援文字實體抽取、文字分類等 NLP 定製化演算法能力。
Qwen3 首創 "混合推理模型" 架構。Qwen3 發佈標誌著阿里巴巴首次推出混合推理模型,融合傳統大語言模型與先進的動態推理技術。Qwen3 模型可以在思考模式(用於複雜、多步驟任務,如數學、編碼和邏輯推理)和非思考模式(用於快速、通用響應)之間無縫切換。
Qwen3-Next 實現參數效率的極致最佳化。針對大模型規模化難題,Qwen3-Next 採用混合注意力機制與高稀疏度 MoE 結構,實現參數效率突破:80B 總參數僅啟動 3B 即可媲美 235B 模型;成本大幅降低:訓練成本較 Qwen3-32B 下降 90%;推理性能飆升:長文字吞吐量提升 10 倍以上。
多語言能力支援達到 119 種語言與方言。Qwen3 在預訓練方面,資料集相比 Qwen2.5 有了顯著擴展,Qwen2.5 是在 18 兆個 token 上進行預訓練的,而 Qwen3 使用的資料量幾乎是其兩倍,達到了約 36 兆個 token,涵蓋了 119 種語言和方言。
2.3 視聽多媒體:多模態內容理解與生成
AAIG 在視聽多媒體領域建構完整技術鏈條。AAIG 致力於解決視聽多媒體相關技術研究與應用實踐,通過自主研發的先進技術手段,為業務的平穩安全運行提供堅實的保障。研究方向包括內容理解、視訊分類、直播風控、語音轉寫、音訊內容理解、聲紋、視訊檢索等。
通義萬相實現人像風格重繪的商業化應用。通義萬相 - 人像風格重繪可以將輸入的人物圖像進行多種風格化的重繪生成,使新生成的圖像在兼顧原始人物相貌的同時,帶來不同風格的繪畫效果。
Qwen2.5-VL 支援一小時以上長視訊理解。通義千問升級版旗艦版模型 Qwen2.5-Max,是對 MoE 模型的最新探索成果,預訓練資料超過 20 兆 tokens,綜合性能強勁。Qwen2.5-VL 展現強大多模態能力,不僅能精準識別物體和解析複雜圖像內容,還可理解一小時以上的長視訊,精確回答問題。
2.4 人工智慧安全:可信 AI 的技術保障體系
AAIG 建構 AI 安全技術的全方位研究體系。AAIG 致力於人工智慧特別是深度學習前沿技術研究與應用實踐,實現安全、可靠、可信賴、可用的人工智慧系統。研究方向包括人工智慧安全性、魯棒性、可解釋性、公平性、遷移性、隱私保護、因果推理等。
媒體安全技術聚焦內容真實性驗證。AAIG 致力於打造解決阿里集團在真實場景下針對多媒體載體安全問題的最佳實踐,研究方向包括多媒體內容(音檢視文)的完整性、真實性、對抗性、可溯源性等。
S-Eval 安全評測框架獲得國際頂會認可。浙江大學與阿里安全 AIGC 安全團隊針對大語言模型安全評測的聯合研究成果《S-EVal:面向大語言模型的自動化與全面安全評測》被 ISSTA Research Track 2025 接收,錄用率為 19.4%。
3.1 Qwen3 系列模型的技術架構創新
Qwen3 實現 "思考模式" 與 "非思考模式" 的無縫切換。2025 年 4 月,阿里巴巴正式發佈通義千問系列最新旗艦模型 Qwen3-235B-A22B,這款採用混合專家(MoE)架構的大語言模型首次實現單一模型內 "思考模式" 與 "非思考模式" 的無縫切換,在數學推理、程式碼生成等複雜任務上超越前代 Qwen2.5 達 40%,同時保持日常對話場景的高效響應。
Qwen3 系列包含 8 款模型覆蓋不同應用場景。Qwen3 系列包含 8 款模型,涵蓋 Dense(稠密)與 MoE(混合專家)架構,其中旗艦型號 Qwen3-235B-A22B 總參數量達 2350 億,但啟動參數僅為 220 億,視訊記憶體佔用為同類模型的 1/3,顯著降低了部署成本。Qwen3-235B-A22B 支援 128K 上下文長度。
Qwen3-Next 採用極致最佳化的混合架構。Qwen3-Next 採用混合注意力機制與高稀疏度 MoE 架構的組合方案。通過將 75% 的神經網路層取代為 Gated DeltaNet 線性注意力模組,配合 25% 的標準注意力層,模型在保持長序列處理能力的同時,將計算複雜度從二次方降至線性水平。在參數效率最佳化上,研發團隊建構了包含 512 個專家模組的極致稀疏 MoE 架構。
3.2 S-Eval 安全評測框架的技術創新
S-Eval 建構多維細粒度風險分類體系。S-Eval 框架建構了一個多維、細粒度的四級風險分類體系,涵蓋 8 個風險維度和 102 個細分風險類型。該框架具備卓越的靈活性,能夠依據快速演變的安全威脅以及 LLMs 的發展態勢,通過靈活配置專家測試 LLM 實現自適應動態調整。
S-Eval 採用雙專家模型架構。S-Eval 框架之下,團隊研發出兩個專家模型:出題專家針對風險熱點自動生成高品質測試題,而判卷專家則對大模型的回覆進行風險識別和分析。
S-Eval 的核心是基於 LLM 的自動測試生成框架。S-Eval 的核心是一種新穎的基於 LLM 的自動測試提示生成和選擇框架,它訓練了一個專家測試 LLM Mt,結合一系列測試選擇策略,自動建構了一個高品質的測試套件,用於安全評估。
3.3 深度偽造檢測技術的產業化應用
AAIG 深度偽造檢測技術獲得最高等級認證。阿里巴巴人工智慧治理與可持續發展研究中心(AAIG)的深度偽造視訊檢測技術,榮獲第三屆中國人工智慧大賽最高 A 級證書。
螞蟻數科 Deepfake 檢測方案達到 98% 精準率。在中關村論壇系列活動第 12 屆數字金融與科技金融大會上,螞蟻數科的 Deepfake (深度偽造) 檢測方案入選大會 "金融科技技術創新與應用案例",檢測準確率達到 98%。
阿里安全在 AIGC 音訊檢測領域獲得 A 級獎項。在第五屆中國人工智慧大賽中,阿里安全一舉斬獲「AIGC 音訊檢測」賽道 A 級證書和「人工智慧顯式內容標識提取技術」賽道 B 級證書。阿里安全的方案可以支援包含文生音訊檢測、變音檢測、聲音克隆檢測和音訊翻錄檢測在內的偽造音訊檢測場景,該方案在大賽中獲得 0.9926 的 AUC,在五十多家參賽廠商中斬獲 A 級獎項。
4.1 Qwen 系列模型的開源規模與影響力
通義千問開源模型數量與下載量均居全球第一。阿里雲周靖人宣佈通義千問全系開源,覆蓋全尺寸全模態,提供超過 300 個開源模型,超過 6 億開源模型下載量。最新資料顯示,阿里 Qwen 系列大模型已被累計下載 3 億次,基於 Qwen 的衍生模型數量超 10 萬個,為全球第一。
Qwen3 單模型下載量突破千萬次。根據《科創板日報》的報導,阿里通義 Qwen3 大模型自開源以來,全球下載量已突破 1250 萬次。Qwen3 在 Hugging Face、魔搭社區及 Ollama 等主流開源平台提供了四種參數規模(0.6B、8B、30B、32B)的版本,各版本下載量均超過百萬次。
通義千問在全球開源模型榜單實現歷史性突破。當 Hugging Face 最新榜單在 9 月 28 日刷新時,全球 AI 社區見證了一個歷史性時刻:阿里通義 7 款模型同時躋身全球開源模型前十,其中 Qwen3-Omni 以全模態能力強勢登頂。阿里用 300 個開源模型、6 億次下載量、17 萬個衍生應用的生態規模,重新定義了全球 AI 競爭的核心邏輯。
4.2 ModelScope 魔搭社區的生態建設成果
魔搭社區成為中國最大 AI 開源社區。魔搭社區匯聚超 500 家機構、7 萬 + 開源模型、服務 1600 萬使用者,模型數量增長 200 倍(2023 年 300 + 模型→2025 年 70000 + 模型),使用者數量增長 16 倍(2023 年 4 月 100 萬→2025 年 7 月 1600 萬)。
魔搭社區形成完整的 AI 模型服務體系。作為中國最大的 AI 模型社區,截至 2025 年已集聚超 1600 萬開發者與 7 萬餘個模型,形成覆蓋文字、圖像、語音、視訊等多模態領域的全生命周期服務能力,包括模型下載、調優、訓練、推理及部署等環節。截至 2025 年 6 月,社區已匯聚 1600 萬 + 全球開發者及 500 余家貢獻機構(含Google、輝達、騰訊、百度等),模型累計下載量超 1 億次,日活使用者超百萬,日均處理百萬級模型呼叫請求。
魔搭社區的快速增長體現技術影響力。截至 2025 年 6 月,魔搭上的模型數量增長迅速,從最初的 100 多個增加到 7 萬多個,成為中國最大最活躍的開源模型社區,與超過 1600 萬的開發者同行。
4.3 開源策略的全球化佈局與本地化適配
Qwen 系列支援 119 種語言與方言體現全球化能力。Qwen3 在預訓練方面,資料集涵蓋了 119 種語言和方言,與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等其他頂級模型相比,旗艦模型 Qwen3-235B-A22B 在編碼、數學、通用能力等基準評估中取得了有競爭力的結果。
阿里巴巴憑藉開源入選《財富》"改變世界" 榜單。阿里巴巴憑藉通義千問大模型系列的開源,入選《財富》2025"改變世界" 榜單。Qwen 系列模型開源超過 300 款,覆蓋全模態、全尺寸,全球下載量突破六億次,支援 119 種語言與方言,通過打造 ModelScope 魔搭社區,累計服務超過 1800 萬使用者。
5.1 阿里雲 AI 相關收入的爆發式增長
阿里雲 AI 相關收入連續 8 個季度保持三位數增長。根據阿里巴巴最新財報資料,阿里雲 AI 相關產品收入已連續 8 個季度實現三位數同比增長。2025 年第二季度,阿里雲智能集團收入達 333.98 億元,同比增長 26%,創下近三年最高增速,AI 相關收入在本季度外部商業化收入中佔比突破 20%。
AI 成為阿里雲增長的核心驅動力。阿里雲收入增長繼續加速至 26%,創三年新高,AI 相關產品收入已連續 8 個季度實現三位數同比增長。在 AI 需求高速增長的同時,AI 應用帶動傳統計算儲存類產品的增長,帶動阿里雲收入同比增長 26%。
阿里雲 CEO 明確 AI 產品的收入貢獻。吳泳銘表示:"阿里雲一半以上的營收增速都來自於 AI 產品"。26% 的增速、20% 的 AI 收入佔比、8 個季度三位數增長 —— 這些數字背後體現了 AI 技術對阿里雲業務的強勁推動作用。
5.2 AI 技術在集團業務中的全面滲透
通義大模型覆蓋 100 + 行業場景實現廣泛應用。通義千問覆蓋 100 + 行業場景,從製造業的 AI 質檢到金融業的風險控制,甚至能給故宮文物 "做 CT"。含光 800 晶片的 AI 算力相當於 10 顆傳統 GPU,卻能把伺服器成本降 50%,這種 "性價比優勢" 讓競爭對手膽寒。
PPU 晶片在實際業務中展現成本優勢。以 PPU 晶片為例,這款阿里自研的 AI 算力晶片剛在 9 月量產,性能直逼輝達 H20,96GB HBM2e 視訊記憶體能支撐千億參數大模型訓練,關鍵是成本比進口晶片低 40%。使用阿里雲的 MaaS 平台,直接在雲上訓練自己的選品模型,用的還是平頭哥晶片的算力,成本降了 60%,選品精準率從 50% 提到 85%,今年雙 11 銷量翻了一倍。
AI 技術在電商場景的精準應用。阿里雲通義千問 2.0 在電商場景表現卓越,直播指令碼生成、競品輿情分析精準率超 90%;可與阿里雲無縫整合,一鍵呼叫雲端運算、支付、物流介面。
5.3 阿里雲基礎設施的 AI 化升級成效
靈駿智算叢集達到世界級性能水平。阿里雲旗下的靈駿智算叢集萬卡規模性能線性度超過 96%,平行儲存吞吐 20TB/s,萬卡規模下網路頻寬利用率超過 99%,可支援單叢集十萬卡等級 AI 算力規模,表現遠超國內同行。
阿里雲在 AI 基礎設施市場保持領先地位。阿里雲依託全端技術升級(如自研硬體、高性能網路架構、平台能力等),成為全球 AI 基礎設施產品力排名第二(Forrester Wave 2024)。硬體層面:自研磐久 AI 伺服器支援單機 16 卡 GPU,共享視訊記憶體超 1.5TB,AI 演算法預測 GPU 故障精準率達 92%。CPFS 檔案儲存提供 20TB/s 吞吐量,滿足 AI 算力指數級擴展需求。
6.1 與國內主要 AI 廠商的技術對比
阿里 Qwen3 在程式設計能力方面領跑國內市場。經實測對比,騰訊混元 Turbo S 在複雜任務處理與視訊分析領域優勢顯著;阿里通義千問 3.0 的程式設計能力領跑行業;百度文心 4.0 在專業領域知識問答上表現突出;科大訊飛星火 V5 憑藉方言識別和即時翻譯功能成為教育 / 醫療場景首選;字節雲雀 X1 則是短影片創作者的高效工具。
通義千問在中文理解能力方面全球領先。在 2025 年全球 AI 大模型排行中,通義千問(阿里巴巴)核心能力為中文理解能力全球領先,邏輯推理和文字創作表現突出,支援百萬級上下文窗口和多模態互動。百度文心一言 4.0 的商業化優勢為呼叫量年增 30 倍,日均呼叫 15 億次,數理科學、語言能力評測領先。
阿里、騰訊、百度形成差異化競爭格局。百度文心一言以 "知識增強 + 多模態融合" 為核心,在中文綜合能力評測(如 SuperCLUE)中穩居前列。百度將文心一言深度整合入自家搜尋、地圖、自動駕駛等多個核心產品,形成 "技術閉環"。
6.2 與國際 AI 巨頭的技術對標
Qwen3 在技術能力上已追上或超越 OpenAI 和Google。外網的各國網友對 Qwen3 的評價都很不錯,橫向對比的話,Qwen3 已經追上或者超越了 OpenAI o1、Google Gemini 2.5 Pro。
阿里雲與Google雲形成 "鏡像戰爭" 態勢。阿里雲的技術路徑與Google雲高度相似:技術堆疊對標:從基礎設施(飛天系統)、模型研發(通義千問)到產品平台(機器學習 PAI),阿里雲正在復刻Google雲的 "全端能力" 架構;商業化路徑:Google通過 Gemini 嵌入 Workspace、Chrome 等場景,阿里則將通義模型深度整合至淘寶、高德等核心業務,二者均試圖通過 "技術 - 場景" 協同建構壁壘;開源生態:千問開源系列在 Hugging Face 衍生模型超 9 萬個,接近Google開源模型的社區活躍度,但在視訊生成等細分領域仍需追趕。
6.3 全端自研路徑的核心競爭優勢
全端自研帶來效率和成本的雙重優勢。阿里雲和Google走的是 "全端自研" 路線,這意味著從最底層的 AI 晶片,到中間的模型訓練平台,再到上層的各種大模型和 AI 應用服務,幾乎都是自己設計、自己開發、自己掌控。一是效率更高,所有環節都是自己人,溝通協作更順暢,能夠最大限度地最佳化系統性能。二是成本更優,自研能夠減少對外部供應商的依賴,降低採購成本和技術整合成本,最終體現在為客戶提供服務時的性價比。
阿里巴巴是全球四朵 "超級 AI 雲" 中唯一的中國全端自研公司。阿里巴巴不僅是全球四朵 "超級 AI 雲" 中唯一的中國公司,更是其中少數採取 "全端自研" 路徑的公司 —— 即在 AI 晶片、雲端運算平台和基礎大模型三個核心層面均追求頂尖自研能力,與Google形成了戰略上的跨洋呼應。自主的 AI 晶片佈局是實現成本控制的關鍵手段,通過為自研模型定製硬體,從根本上降低推理成本,以構築長期成本優勢。而擁有自主硬體能力的全端玩家,可以通過 "軟硬體協同設計" 來最佳化成本結構。
全端技術能力建構難以複製的護城河。阿里巴巴是國內唯一同時實現晶片、作業系統、資料庫、大模型全自研的科技企業,平頭哥晶片與阿里雲、通義大模型的協同能力建構技術護城河。其核心優勢在於 "全端技術能力 + 生態協同效應 + 供應鏈可控性":平頭哥晶片解決算力成本與安全問題,阿里雲提供落地載體,通義大模型創造應用需求,三者形成的閉環能力在國內獨一無二。
核心發現總結
通過對阿里巴巴 AI 技術能力的全面分析,本研究得出以下核心發現:
技術體系架構方面,阿里巴巴已建構起完整的 "全端自研" 技術體系,從平頭哥 AI 晶片(PPU、倚天 700+、含光 800)到飛天作業系統與 CIPU 2.0 的協同,再到通義千問大模型的架構創新,形成了從硬體到軟體的完整技術閉環。特別是飛天作業系統能同時調度 100 萬個伺服器的世界級能力,以及 CIPU 2.0 實現的 400Gbps 高吞吐硬體加速架構,展現了技術實力的雄厚。
技術研究方向方面,阿里巴巴在電腦視覺、自然語言處理、視聽多媒體、人工智慧安全四大領域均實現重要突破。Qwen3-VL 在 32 項核心能力測評中超過 Gemini2.5-Pro 和 GPT-5,Qwen3 首創的 "混合推理模型" 架構實現 "思考模式" 與 "非思考模式" 的無縫切換,S-Eval 安全評測框架建構了涵蓋 8 個風險維度和 102 個細分風險類型的評估體系。
核心技術成果方面,Qwen3 系列模型實現了架構創新和性能突破,8 款模型覆蓋不同應用場景,旗艦型號 Qwen3-235B-A22B 總參數量達 2350 億但啟動參數僅 220 億,顯著降低了部署成本。在安全技術方面,深度偽造檢測技術獲得第三屆中國人工智慧大賽最高 A 級證書,螞蟻數科 Deepfake 檢測方案精準率達 98%。
開源生態建設方面,通義千問已開源超過 300 個模型,全球下載量超 6 億次,衍生模型達 17 萬個,穩居全球第一。ModelScope 魔搭社區匯聚超 500 家機構、7 萬 + 開源模型、服務 1600 萬使用者,成為中國最大的 AI 開源社區。
商業化應用方面,阿里雲 AI 相關收入連續 8 個季度保持三位數增長,在 2025 年第二季度外部商業化收入中佔比突破 20%,成為阿里雲增長的核心引擎。AI 技術在電商、製造業、金融業等 100 + 行業場景實現廣泛應用。
競爭格局方面,阿里巴巴作為全球四朵 "超級 AI 雲" 中唯一採取 "全端自研" 路徑的中國公司,在技術自主性、成本控制、生態建構等方面形成了獨特優勢,已在某些技術指標上追上或超越 OpenAI、Google等國際巨頭。
對不同群體的建議
對投資者的建議:阿里巴巴的 "全端自研" 技術路徑具有長期競爭優勢,特別是在當前國際技術競爭加劇的背景下,技術自主性的價值更加凸顯。建議關注阿里雲 AI 業務的持續增長潛力,特別是 AI 相關收入佔比提升和商業化應用拓展帶來的業績增長機會。同時需要關注技術研發投入的可持續性和競爭格局的變化。
對行業從業者的建議:阿里巴巴的技術發展路徑為行業提供了重要參考,特別是 "全端自研" 模式在成本控制和技術創新方面的優勢值得借鑑。建議關注通義千問開源模型的技術演進和應用場景拓展,積極參與 ModelScope 魔搭社區的生態建設,把握 AI 技術帶來的產業變革機遇。
對政策制定者的建議:阿里巴巴在 AI 技術領域的成就體現了中國企業在全球科技競爭中的實力,建議繼續支援企業的技術創新和開源生態建設,特別是在關鍵核心技術攻關方面給予政策支援。同時需要關注 AI 技術發展帶來的倫理、安全等社會問題,建立健全相關監管體系。
對阿里巴巴的建議:建議繼續堅持 "全端自研" 的技術路線,加大在關鍵核心技術領域的研發投入,特別是在 AI 晶片、大模型架構、安全技術等方面保持技術領先優勢。同時需要加強開源生態建設,提升國際影響力,在全球 AI 技術競爭中爭取更大話語權。在商業化應用方面,建議進一步拓展 AI 技術在垂直行業的深度應用,實現技術價值的最大化。
總體而言,阿里巴巴在 AI 技術領域已建立起強大的技術實力和競爭優勢,"全端自研" 的技術路徑為其在全球 AI 競爭中贏得了戰略主動權。隨著技術的不斷演進和應用場景的持續拓展,阿里巴巴有望在人工智慧時代實現更大的發展突破。 (SoC晶片)