第一,通義千問堅定開源開放路線,致力於打造“AI時代的Android”;其二,建構作為“下一代電腦”的超級AI雲,為全球提供智能算力網路。
在杭州召開的2025雲棲大會上,阿里巴巴集團CEO、阿里雲智能集團董事長兼CEO吳泳銘在演講中表示,實現通用人工智慧AGI已是確定性事件,但這只是起點,終極目標是發展出能自我迭代、全面超越人類的超級人工智慧ASI。
吳泳銘闡述了通往ASI的三階段演進路線:
第一階段:“智能湧現”,AI通過學習海量人類知識具備泛化智能。
第二階段:“自主行動”,AI掌握工具使用和程式設計能力以“輔助人”,這是行業當前所處的階段。
第三階段:“自我迭代”,AI通過連接物理世界並實現自學習,最終實現“超越人”。
為實現這一目標,吳泳銘明確了阿里雲的戰略路徑:第一,通義千問堅定開源開放路線,致力於打造“AI時代的Android”;其二,建構作為“下一代電腦”的超級AI雲,為全球提供智能算力網路。
吳泳銘判斷,未來,全世界可能只會有5-6個超級雲端運算平台。
為支撐這一願景,吳泳銘表示,阿里巴巴正在積極推進三年3800億的AI基礎設施建設計畫,並將會持續追加更大的投入。
根據遠期規劃,為了迎接ASI時代的到來,對比2022年這個GenAI的元年,2032年阿里雲全球資料中心的能耗規模將提升10倍。這意味著阿里雲算力投入將指數級提升。
以下為演講內容,經過《科創板日報》刪減:
當前的世界,一場由人工智慧驅動的智能化革命剛剛開始。過去幾百年,工業革命通過機械化放大了人類的體能,資訊革命通過數位化放大了人類的資訊處理能力。而這一次,智能化革命將遠超我們的想像。通用人工智慧AGI不僅會放大人類智力,還將解放人類的潛能,為超級人工智慧ASI的到來鋪平道路。
最近的三年,我們已經清晰地感受到它的速度。幾年時間,AI的智力從一個高中生迅速提升到博士生的水平,還能拿到國際IMO的金牌。AI Chatbot是人類有史以來使用者滲透率最快的功能。AI 的行業滲透速度超過歷史上所有技術。Tokens 的消耗速度兩三個月就翻一番。最近一年,全球AI行業的投資總額已經超過4000億美元,未來5年全球AI的累計投入將超過4兆美元,這是歷史上最大的算力和研發投入,必然將會加速催生更強大的模型,加速AI應用的滲透。
實現AGI——一個具備人類通用認知能力的智能系統,現在看來已成為確定性事件。然而,AGI並非AI發展的終點,而是全新的起點。AI不會止步於AGI,它將邁向超越人類智能、能夠自我迭代進化的超級人工智慧(ASI)。
AGI的目標是將人類從80%的日常工作中解放出來,讓我們專注於創造與探索。而ASI作為全面超越人類智能的系統,將可能創造出一批“超級科學家”和"全端超級工程師"。ASI將以難以想像的速度,解決現在未被解決的科學和工程問題,比如攻克醫學難題、發明新材料、解決可持續能源和氣候問題,甚至星際旅行等等。ASI將以指數級的速度推動科技的飛躍,引領我們進入一個前所未有的智能時代。
我們認為,通往ASI之路將經歷三個階段:
第一階段是“智能湧現”,特徵是“學習人”。過去幾十年的網際網路發展,為智能湧現提供了基礎。網際網路將人類歷史上幾乎所有的知識都數位化了。這些語言文字承載的資訊,代表了人類知識的全集。基於此,大模型首先通過理解全世界的知識集合,具備了泛化的智能能力,湧現出通用對話能力,可以理解人類的意圖,解答人類的問題,並逐漸發展出思考多步問題的推理能力。現在,我們看到AI已經逼近人類各學科測試的頂級水平,比如國際數學奧賽的金牌水平。AI逐漸具備了進入真實世界、解決真實問題、創造真實價值的可能性。這是過去幾年的主線。
第二個階段是“自主行動”,特徵是“輔助人”。這個階段,AI不再侷限於語言交流,而是具備了在真實世界中行動的能力。AI可以在人類的目標設定下,拆解複雜任務,使用和製作工具,自主完成與數字世界和物理世界的互動,對真實世界產生巨大影響。這正是我們當下所處的階段。
實現這一跨越的關鍵,首先是大模型具備了Tool Use能力,有能力連接所有數位化工具,完成真實世界任務。人類加速進化的起點是開始創造和使用工具,現在大模型也具備了使用工具的能力。通過Tool Use,AI可以像人一樣呼叫外部軟體、介面和物理裝置,執行複雜的真實世界任務。這個階段,由於AI能夠輔助人類極大提高生產力,它將快速的滲透到物流、製造、軟體、商業、生物醫療、金融、科研等幾乎所有行業領域。
其次,大模型Coding能力的提升,可以幫助人類解決更複雜的問題,並將更多場景數位化。現在的Agent還比較早期,解決的主要是標準化和短周期的任務。要想讓Agent能解決更複雜、更長周期任務,最關鍵的是大模型的Coding能力。因為Agent可以自主Coding,理論上就能解決無限複雜的問題,像工程師團隊一樣理解複雜需求並自主完成編碼、測試。發展大模型Coding能力是通往AGI的必經之路。
未來,自然語言就是AI時代的原始碼,任何人用自然語言就能創造自己的Agent。你只需要輸入母語,告訴AI你的需求,AI就能自己編寫邏輯、呼叫工具、搭建系統,完成數字世界的幾乎所有工作,並通過數位化介面來操作所有物理裝置。 未來,也許會有超過全球人口數量的Agent和機器人與人類一起工作,對真實世界產生巨大影響。在這個過程中,AI就能連接真實世界的絕大部分場景和資料,為未來的進化創造條件。
隨後AI將進入第三個階段——“自我迭代”,特徵是“超越人”。這個階段有兩個關鍵要素:
目前AI的進步最快的領域是內容創作、數學和Coding領域。我們看到這三個領域有明顯的特徵。這些領域的知識100%是人類定義和創造的,都在文字裡,AI可以100%理解原始資料。但是對於其他領域和更廣泛的物理世界,今天的AI接觸到的更多是人類歸納之後的知識,缺乏廣泛的、與物理世界互動的原始資料。這些資訊是有侷限的。AI要實現超越人類的突破,就需要直接從物理世界獲取更全面、更原始的資料。
舉一個簡單的例子,比如一家汽車公司的CEO要迭代明年的產品,大機率會通過無數次的使用者調研或者內部的討論來決定下一款汽車將要具備什麼樣的功能,與競對相比要實現那些方面的長板,保留什麼方面的能力。現在AI要去做還是很難的,核心點在於它所獲得的資料和資訊,全都是調研來的二手資料。如果有一天AI有機會,能夠連接這款汽車的所有的資料和資料,它創造出來的下一款汽車會遠遠超過通過無數次頭腦風暴所創作出來的。這只是人類世界當中的一個例子,更何況更複雜的物理世界,遠遠不是通過人類知識歸納就能夠讓AI理解的。
所以AI要進入到一個更高的階段,就需要直接從物理世界獲取更全面、更原始的資料,就像在自動駕駛的早期階段,只靠人類的總結,Rule-based的方法去實現自動駕駛,無法實現很好的效果。新一代的自動駕駛,大部分採用端到端的訓練方法,直接從原始的車載攝影機資料中學習,實現了更高水平的自動駕駛能力。即便我們現在看起來相對簡單的自動駕駛問題,僅依靠人類歸納的知識和規則,也無法解決,更何況整個複雜的物理世界。只是讓AI學習人類歸納的規律,是遠遠不夠的。只有讓AI與真實世界持續互動,獲取更全面、更真實、更即時的資料,才能更好的理解和模擬世界,發現超越人類認知的深層規律,從而創造出比人更強大的智能能力。
隨著AI滲透更多的物理世界場景,理解更多物理世界的資料,AI 模型和agent能力也會越來越強,有機會為自己模型的升級迭代搭建訓練infra、最佳化資料流程和升級模型架構,從而實現 Self learning。這會是AI發展的關鍵時刻。
隨著能力的持續提升,未來的模型將通過與真實世界的持續互動,獲取新的資料並接收即時反饋,借助強化學習與持續學習機制,自主最佳化、修正偏差、實現自我迭代與智能升級。每一次互動都是一次微調,每一次反饋都是一次參數最佳化。當經過無數次場景執行和結果反饋的循環,AI將自我迭代出超越人類的智能能力,一個早期的超級人工智慧(ASI)便會成型。
一旦跨過某個奇點,人類社會就像按下了加速鍵,科技進步的速度將超越我們的想像,新的生產力爆發將推動人類社會進入嶄新的階段。這條通往超級人工智慧的道路,在我們的眼前正在日益清晰。隨著AI技術的演進和各行各業需求爆發,AI也將催生IT產業的巨大變革。
我們的第一個判斷是:大模型是下一代的作業系統。我們認為大模型代表的技術平台將會替代現在OS的地位,成為下一代的作業系統。未來,幾乎所有連結真實世界的工具介面都將與大模型進行連結,所有使用者需求和行業應用將會通過大模型相關工具執行任務,LLM將會是承載使用者、軟體 與 AI計算資源互動調度的中間層,成為AI時代的OS。來做一些簡單的類比:自然語言是AI時代的程式語言,Agent就是新的軟體,Context是新的Memory,大模型通過MCP這樣的介面,連接各類Tools和Agent類似PC時代的匯流排介面,Agent之間又通過A2A這樣的協議完成多Agent協作類似軟體之間的API介面。
大模型將會吞噬軟體。大模型作為下一代的作業系統,將允許任何人用自然語言,創造無限多的應用。未來幾乎所有與計算世界打交道的軟體可能都是由大模型產生的Agent,而不是現在的商業軟體。潛在的開發者將從幾千萬變成數億規模。以前由於軟體開發的成本問題,只有少量高價值場景才會被工程師開發出來變成商業化的軟體系統。未來所有終端使用者都可以通過大模型這樣的工具來滿足自己的需求。
模型部署方式也會多樣化,它將運行在所有裝置上。現在主流的呼叫模型API的方式,來使用模型只是初級階段,其實看起來非常原始。類似大型主機時代的分時復用階段,每個人只有一個終端連接上大型主機分時復用。這種方式無法解決資料持久化,缺乏長期記憶,即時性不夠,隱私無法解決,可塑性也不夠。未來模型將運行在所有計算裝置中,並具備可持久記憶,端雲聯動的運行狀態,甚至可以隨時更新參數,自我迭代,類似我們今天的OS運行在各種環境之中。
正是基於這個判斷,我們做了一個戰略選擇:通義千問選擇開放路線,打造AI時代的Android。我們認為在LLM時代,開源模型創造的價值和能滲透的場景,會遠遠大於閉源模型。我們堅定選擇開源,就是為了全力支援開發者生態,與全球所有開發者一起探索AI應用的無限可能。
我們的第二個判斷:超級AI 雲是下一代的電腦。
大模型是運行於 AI Cloud之上新的OS。這個OS可以滿足任何人的需求。每個人都將擁有幾十甚至上百個Agent,這些Agent 24小時不間斷地工作和協同,需要海量的計算資源。
資料中心內的計算範式也在發生革命性改變,從CPU為核心的傳統計算,正在加速轉變為以 GPU為核心的 AI 計算。新的AI計算範式需要更稠密的算力、更高效的網路、更大的叢集規模。
這一切都需要充足的能源、全端的技術、數百萬計的GPU和CPU,協同網路、晶片、儲存、資料庫高效運作,並且24 小時處理全世界各地的需求。這需要超大規模的基礎設施和全端的技術積累,只有超級AI雲才能夠承載這樣的海量需求。未來,全世界可能只會有5-6個超級雲端運算平台。
在這個新時代,AI將會替代能源的地位,成為最重要的商品,驅動千行百業每天的工作。絕大部分AI能力將以Token的形式在雲端運算網路上產生和輸送。Token就是未來的電。
在這個嶄新的時代,阿里雲的定位是全端人工智慧服務商。通義千問開源了300多款模型,覆蓋了全模態、全尺寸,截至目前,通義千問全球下載量超6億次,衍生模型超17萬個,是全球第一的開源模型矩陣,可以說是滲透計算裝置最廣泛的大模型。
阿里雲正在全力打造一台全新的AI超級電腦,它同時擁有最領先的AI基礎設施和最領先的模型,可以在基礎架構設計和模型架構上協同創新,從而確保在阿里雲上呼叫和訓練大模型時,能達到最高效率,成為開發者最好用的AI雲。
AI行業發展的速度遠超我們的預期,行業對AI基礎設施的需求也遠超我們的預期。我們正在積極推進三年3800億的AI基礎設施建設計畫,並將會持續追加更大的投入。從現在我們看到的AI行業遠期發展以及客戶需求角度來看,為了迎接ASI時代的到來,對比2022年這個GenAI的元年,2032年阿里雲全球資料中心的能耗規模將提升10倍。這是我們的一個遠期規劃,我們相信通過這樣的飽和式投入,能夠推動AI行業的發展,迎接ASI時代的到來。
超級人工智慧到來之後,人類和AI會是怎麼樣的協作關係?
未來的AI越來越強,甚至超越人類智能能力的ASI誕生,那我們人類和AI將如何相處?我們對未來充滿樂觀,超級人工智慧到來之後,人類和AI是一個嶄新的協同方式。程式設計師可能已經感受到了,我們可以下一個指令,通過Coding這樣的工具,讓它晚上12個小時就能夠創造出一個我們需要的系統,從這裡我們看到了未來人和AI怎麼樣去共同協同的一種早期的雛形。所以我們覺得,從Vibe Coding到Vibe Working。未來,每個家庭、工廠、公司,都會有眾多的Agent和機器人24小時為我們服務。也許,未來每個人都需要使用100張GPU晶片為我們工作。
正如電曾經放大了人類物理力量的槓桿,ASI將指數級放大人類的智力槓桿。過去我們消耗10個小時的時間,獲得10小時的結果。未來,AI可以讓我們10小時的產出乘以十倍、百倍的槓桿。回顧歷史,每次技術革命解鎖更多生產力之後,都會創造出更多的新需求。人會變得比歷史上任何時候都強大。
最後,我想強調,一切才剛剛開始。AI 將重構整個基礎設施、軟體和應用體系,成為真實世界的核心驅動力,掀起新一輪智能化革命。 (科創板日報)