導讀
人工智慧引領第四次科技革命,是當前最火的、最具前景、最具爆發力的科技賽道。進入到2025年,發生了什麼新的變化?中國人工智慧正告別“百模大戰”的規模競賽,向以DeepSeek等六小虎為代表的頭部大模型集中。AI發展的核心,從追求模型“可用”轉向實現場景的“好用”。
2025年,AI發展有四大核心:
趨勢一是應用革命,未來是執行任務的行動式AI,AI能幫你接近真實的問題,而不僅僅是知識生成的生成式AI。執行任務,在數字世界就是代理AI,AI Agent,在物理世界就是具身智能AI。
趨勢二是代理AI正在重塑互動範式,以後能顛覆當前的軟體APP。 AI正從“對話AI”變成“幹活AI”。AI能自主規劃、呼叫工具、完成複雜任務,成為未來新的流量分配中心。字節、百度等大廠已入局,搶佔生態位。
趨勢三是硬體+AI,具身智能AI多點開花,商業化處理程序加速。智能駕駛是最先落地的成熟場景,正迎來市場滲透率拐點。隨著將高階智駕下放至入門車型,預計2025年高速與城市NOA滲透率有望實現翻倍增長,突破20%大關。人形機器人則處於商業化黎明期,正以汽車和物流工廠為首個試驗場,探索B端應用場景。AI眼鏡賽道被大模型重新啟動,未來中國企業有望憑藉市場消費者興趣度高漲、供應鏈完備和研發速度三大獨特優勢實現跨越式發展。
趨勢四是基礎設施層,算力與資料是支撐產業發展的兩大基石,未來算力國產化加速、打破資料枯竭。中國的AI算力正在圍堵中尋求突圍。在輝達佔據全球資料中心GPU市場98%份額的背景下,美國的三輪精準封鎖使國產算力替代迫在眉睫。國產晶片性能已快速追趕(如華為昇騰910C在性能方面已開始追平先進水平),未來先進製程工藝與核心生態上,依然需要面臨加速國產化替代的挑戰。全球AI界正面臨高品質訓練資料將在2028年枯竭的危機,在資料枯竭預期下,未來需要重構AI資料築護城河。
目錄
1 大模型層:迭代永不停歇
1.1 頭部大模型格局更加穩定
1.2 後訓練是破局關鍵
1.3 推理需求顯著增長
2 應用層:AI應用革命
2.1 軟體應用:通用Agent出圈
2.2 硬體應用:具身智能爆發
2.3 人形機器人:從B端開始商業化
2.4 AI眼鏡:具備三大產業優勢
2.5 智能駕駛:滲透率快速提升
3 基礎設施層:算力與資料仍是兩大發展基石
3.1 算力:GPU自主化迫在眉睫
3.2 資料:巨大資源潛力待挖掘
正文
1.1 頭部大模型格局更加穩定
大模型領域的發展正經歷著從無序競爭到頭部集中的演變。早期“百模大戰”時期,市場充斥著大量技術水平參差不齊的模型,企業間以快速推出產品搶佔市場為首要目標。但隨著應用場景不斷深化,使用者對模型的性能、穩定性和安全性要求大幅提升,單純追求數量的競爭模式難以為繼。在此背景下,阿里巴巴、DeepSeek、字節跳動、騰訊、階躍星辰、智譜AI六家廠商憑藉強大的研發能力、資料資源和資金投入,率先突破技術瓶頸,將大模型從“可用”階段推向“好用”階段。
隨著“六小虎”的崛起,大模型領域的馬太效應開始顯現。強者利用先發優勢不斷擴大領先幅度。阿里巴巴依託電商場景積累的海量資料,持續最佳化通義千問的商業應用能力;Deepseek憑藉在演算法創新上的突破,在科研輔助領域獨樹一幟;字節跳動憑藉火山引擎的算力支援和全球化生態,讓豆包大模型在多語言互動上表現突出。這些企業通過持續迭代模型、拓展應用場景,吸引更多開發者和使用者,進而獲取更豐富的反饋資料用於最佳化模型,形成技術提升-使用者增長-資料反哺的良性循環,使得頭部與其他企業的差距不斷拉大,行業集中度持續提高。
1.2 後訓練是破局關鍵
預訓練的Scaling Law曾是推動大模型發展的重要法則,它表明模型性能與模型規模、資料集大小和計算資源之間存在冪律關係,即隨著這三者的增加,模型性能會相應提升。通俗講就如學英語,背100個單詞只能蹦單詞,背1000個單詞能組句子,背1萬個單詞可能就懂語法和隱喻了,這就是 “學得多 = 能力強” 的樸素 Scaling Law。
然而如今,大模型預訓練Scaling Law的發展趨勢有所放緩。資料面臨挑戰,像是可用的高品質資料增長速度受限,公共網際網路資料預計在不久後被耗盡,且資料標註成本高昂;另一方面,算力提升遭遇瓶頸,建構和維護大規模算力基礎設施的成本極高,技術上也趨近現有硬體的極限,導致通過傳統Scaling Law來提升模型性能的難度增大。
儘管Scaling Law放緩,但探索基礎大模型能力上限仍極具必要性。基礎大模型作為AI發展的基石,其能力的提升能帶動眾多領域的變革。如馬斯克的xAI用全球規模最大的20萬張H100算力叢集訓練出的Grok3,後續預計今年推動的GPT-5、Llama 4等基礎大模型也值得期待。
在AI的持續發展處理程序中,後訓練(Post-training)正逐漸成為推動其進化的關鍵所在。傳統大模型完成預訓練後,雖掌握了基礎能力,但面對複雜場景仍有不足。後訓練的出現,為突破這一困境提供了有效途徑。GPT-o1借助強化學習和測試時間搜尋等後訓練技術,在數學、程式碼等複雜推理任務上成績斐然,有力證實了後訓練擴展律的正確性,彰顯出後訓練挖掘模型潛力、拓展能力邊界的強大功效。
與預訓練的“廣撒網”不同,後訓練聚焦特定任務與場景,精準最佳化模型。醫療領域中,通過病例資料和醫學知識圖譜進行後訓練的大模型,疾病診斷精準率顯著提升;金融投資場景裡,利用市場資料後訓練的模型,對風險評估等任務的處理能力也大幅增強,使模型從通用智能邁向 “專家型”智能。
今年5月,Deepseek發佈了Deepseek-R1-0528版本。根據官網,0528版本在後訓練階段,團隊投入了更多算力,使得模型在數學、程式設計及通用邏輯等方面的表現得到大幅最佳化。更新後的R1模型的整體表現已接近其他國際頂尖模型,如o3與Gemini-2.5-Pro。後訓練同樣遵循Scaling Law,Scaling Laws已從預訓練維度擴展至後訓練+即時推理三個維度。
1.3 推理需求顯著增長
隨著AI應用場景不斷拓展,推理端需求呈爆發式增長態勢。微軟、Google等頭部客戶的日均token呼叫量已突破數兆等級,較傳統chatbot時代的處理規模實現指數級躍升。多模態模型、Agentic AI等創新形態的加速落地,正催生即時推理需求與大規模低延遲計算的新一輪結構性增長,推動AI算力需求從“模型訓練為主”向“推理落地優先”的產業範式遷移。
我們認為推理需求規模有望達到訓練階段的5-10倍。若殺手級應用如AI Agent廣泛落地,推理算力需求將進一步攀升。預計到2026年,消費級AI日活躍使用者(DAUs)將突破10億。到2026年,推理計算的需求可能佔GenAI總計算需求的70%以上,推理計算需求將超過訓練計算需求,並達到後者的4.5倍。
“慢思考”能力(如深度邏輯推理、多步規劃)和多模態理解(文字、圖像、語音等跨模態互動)正成為AI應用的標配。"慢思考"借鑑了人類認知的雙系統理論,強調AI在複雜任務中需進行深度推理與迭代計算,而非僅依賴直覺式響應。這種模式通過引入反思機制、蒙特卡洛樹搜尋等技術,顯著提升了AI在數學推理、策略規劃等領域的表現。
多模態則是人類世界的本來樣貌,大模型的發展趨勢一定是走向多模態。人類通過視覺、聽覺、觸覺等多種感官接收資訊,多模態技術就是模擬這一過程,讓機器能夠同時處理文字、圖像、音訊等多種類型的資料。以自動駕駛為例,車輛不僅依靠攝影機的視覺圖像識別道路狀況,還借助雷達的距離探測資料、感測器的震動反饋等,全方位感知周圍環境,做出更安全、精準的駕駛決策。多模態大模型打破了單一模態的侷限,極大豐富了資訊輸入,使模型對世界的理解更加全面、深入。
技術實現閉環需要應用的落地,軟體領域的代理式AI(Agent)、硬體領域的具身AI,正成為備受矚目的大模型應用方向。
2025年GTC大會上,黃仁勳提出自2012年深度學習革命開始以來AI發展的四個階段:感知AI、生成式AI、代理式AI、具身AI。
一是感知AI,這是人工智慧的初始階段,讓機器能“看見”和“聽見”,即具備電腦視覺和語音識別能力,如人臉識別、語音助手等應用。
二是生成式AI,在過去3年裡發展迅速,主要以內容生成為核心,能夠創造文字、圖像、視訊等等。文字生成的普及度和使用率最高,以Deepseek、ChatGPT等大模型為代表,大大衝擊了傳統的檢索式搜尋引擎,讓人們逐漸習慣了與大模型互動來獲取知識。
Agent和具身AI則被認為是接下來的發展方向。人工智慧發展必然要從“智慧”到“智能”,也就是讓AI具備行動能力,這是發展Agent和具身AI的共同意義。Agent聚焦於電腦世界,給予AI呼叫軟體工具的能力,讓AI在電腦世界中執行工作任務。而具身AI則聚焦於物理世界,把AI裝在新能源汽車、人形機器人這樣的物理實體上,讓AI在物理世界中感知、理解和行動。
2.1 軟體應用:通用Agent出圈
軟體領域,大模型正從單純的“對話AI”向“幹活AI”轉變。2025年,通用Agent迎來爆發元年。
大模型是知識庫,而Agent是行動者。Agent直譯為代理,本質就是由大模型驅動的一套自動化軟體系統,代表使用者完成任務;其在工作中展現出極高的自主性,無需或極少需要使用者介入。如果說大模型如同一個龐大的知識庫,在推理後生成使用者需要的答案;那Agent則如同一個行動者,它能夠拆解任務、呼叫工具、最終交付給使用者成果。
Agent是大模型向前發展的重要一環,是大模型發展的L3階段。Agent可以簡單理解成是讓大模型呼叫各種工具;工具種類豐富,包括資訊檢索類工具、程式碼與計算類工具、軟體與系統操作類工具等。對外部工具的呼叫能極大拓展大模型的能力範疇,拔高大模型的生產力,是從知識庫向行動者躍升的一大顯著標誌。
Manus的空降發佈,推動通用Agent爆火出圈;“幹活AI“成為人工智慧行業新浪潮,並迅速引起了大廠和創企的生態卡位戰。
從應用範疇看,Agent有專用和通用之分。專用Agent即專用於某一特定領域,最成熟的是程式設計Agent。與之相比,通用Agent則不受限於特定任務類型,能執行各種複雜任務。
Manus是最先出圈的通用Agent產品,由中國人工智慧公司Monica於3月發佈,並引起巨大熱度。在官方展示的幾十個案例中,Manus可以完成的任務包括但不限於旅行規劃、股票分析、PPT製作、網頁製作等等,展現出非常高的通用性。Manus空降後,大廠和AI創企迅速拉開了針對通用Agent的生態卡位戰,競相發佈通用Agent產品,大廠如字節跳動和百度、創企如Flowith和天工AI。
通用Agent本質是一場範式革命,未來可能成為最大的流量分配中心,重構當前軟體生態。因此Agent未來的發展不僅是一個技術問題,比如大模型本身的推理決策能力要再一步提升、降低幻覺問題;更是一個生態問題,即有多少應用願意加入通用Agent的生態。值得注意的是,去年11月以來,表示支援Anthropic提出的MCP協議的大模型和應用越來越多,通用Agent的生態建設未來有望逐步強大。
2.2 硬體應用:具身智能爆發
硬體領域,具身智能在2025年熱度高漲,人形機器人、AI眼鏡和智能駕駛三大賽道迎來催化。
2025年政府工作報告提出要“建立未來產業投入增長機制,培育生物製造、量子科技、具身智能、6G等未來產業”。作為人工智慧的重要分支,具身智能浪潮將至。人工智慧有兩條發展路徑:一條是非具身智能,即聚焦於抽象計算所需的智能;非具身智能不具備物理身體,在數字世界運行,通常表現為程序、演算法等;典型案例如Deepseek、ChatGPT等大語言模型。另一條則是具身智能,核心在於“具身”二字,即用物理實體來承載AI,從而構成一個可感知真實世界、可理解問題並制定規劃、可在真實世界中行動的智能系統,特點是形成“感知——行動”閉環;人形機器人、AI眼鏡、智能駕駛是典型案例,依次是“AI+類人機器”、“AI+新能源汽車”、“AI+XR眼鏡”。
2.3 人形機器人:從B端開始商業化
人形機器人承載著人類對“通用性”具身AI的終極願景。傳統的工業機器人和服務機器人通常專用於單一任務,如工業機械臂用於流水線的某一環節、掃地機器人用於家居環境清理等等。然而人形機器人從構型設計開始便承載了人類對於“通用性”具身AI的美好願景,即未來要能像人一樣使用各種各樣的工具、執行各種各樣的任務。人類社會中的許多工具與空間都是圍繞著人類設計的,理論上講完全擬人形態的人形機器人其適用場景會更為廣泛,因此雙足、全尺寸的構型成為目前最受關注的人形機器人形態。
人形機器人要經歷從實驗環境到工廠環境再到家庭環境的跨越,其商業化可分為三個階段:第一個階段是將人形機器人用於科研教育、娛樂表演等。第二個階段面向B端,人形機器人替代人從事重複枯燥性、高危險性的工作。第三個階段面向C端,人形機器人成為智能家居的一環,提升居住生活體驗,甚至滿足人的養老陪護需求。
當前產業發展重心仍在研發製造環節,但已有部分人形機器人進入B端試水,“進廠”成了人形機器人衝鋒商業化的首個試驗場。汽車工廠和物流工廠是人形機器人試點部署最主要的兩大結構化工業場景,人形機器人在其中執行簡易裝配、搬運碼垛、分揀等工作,任務相對重複且單一。也有一些其他場景,比如有部分人形機器人企業和電子製造企業建立了合作,優必選和富士康、Apptronik和Jabil(捷普)等等。此外,部分企業在2024年也透露了其人形機器人的銷售情況或量產計畫,基本在數百或者數千台。
伴隨宇樹科技等企業的出圈,2025年人形機器人賽道迎來浪潮,未來產業發展將圍繞兩大方向展開:一是利用大模型使人形機器人有更強的“大腦”、使用機器學習技術讓其有更強的“小腦”功能。二是諧波減速器、行星滾柱絲槓、六維力感測器等核心上游零部件突破技術壁壘,推動人形機器人做優整機以及降低造價。而諸如人形機器人馬拉松賽、拳擊賽等活動也會越來越多,都是人形機器人走出實驗室要完成的錘煉。
2.4 AI眼鏡:具備三大產業優勢
大模型的廣泛應用,為AI眼鏡帶來了質的飛躍。多模態大模型賦予AI眼鏡強大的功能,使之具備物體識別、即時翻譯、導航等實用功能,顯著提升使用者體驗。
眼鏡是AI落地的良好載體,具備相當的想像空間。表層上,AI眼鏡是對傳統眼鏡的智能升級,融入多模態感測,內建大模型軟體,且仍然可具備MR/AR的現實融合能力。深層上,其核心優勢在於便攜、互動平滑、功能豐富——AI眼鏡既可以相容智慧型手機內容生態,也能此基礎上開發更豐富的智能應用。
2025年,AI 眼鏡成為消費電子領域的熱門話題之一,科技巨頭紛紛佈局這一賽道,蘋果、Meta、小米、百度、華為等公司都在積極研發或推出AI眼鏡產品。Well-sennXR的資料顯示,預計2029年,AI眼鏡的年銷量將達到5500萬副,到2035年有望突破14億副。未來AI眼鏡對傳統眼鏡的滲透率空間極大,部分中國品牌在此領域有可能實現跨越式發展。有三大原因:
一是國內消費電子市場的優勢,不僅使用者基數大,而且創新技術接受度高。根據德勤調研,2024年中國消費者對AI、AR/VR產品的興趣度高達73%,超過美國的58%。
二是供應鏈和產業優勢,中國集合了全球消費電子產品供應鏈的中上游,珠三角和長三角地區產能佔全球70%。品牌實力也不遜色,2025年Q1,中國智慧型手機品牌在全球市場份額超過1/3。
三是技術迭代快,得益於市場擁抱新興技術疊加產業鏈完整,中國廠商的新品研發和改進升級周期短。根據波士頓諮詢,中國廠商的綜合研發周期在6-8個月,而美國品牌在12-18個月。
AI眼鏡賽道方興未艾,技術路線(如Micro LED、光波導)、應用場景(消費級vs工業級)和區域市場(北美、亞洲、歐洲需求差異)的多元化,使得任何具備核心技術突破或生態整合能力的企業都可能塑造未來的行業格局,值得期待。
2.5 智能駕駛:滲透率快速提升
具身AI率先在智能駕駛領域爆發。2025年,高速NOA和城市NOA滲透率或將迎來超預期增長。2025年2月10日,比亞迪高階智駕系統“天神之眼”正式發佈,比亞迪全系車型將搭載該系統,首批有21款車型上市。天神之眼”分為三個版本:“天神之眼A”(DiPilot 600)配備三個雷射雷達,支援全國無圖領航,主要搭載於仰望品牌上;“天神之眼B”(DiPilot 300)配備單雷射雷達,支援全國無圖領航,主要搭載於騰勢、比亞迪等品牌上;“天神之眼 C”(DiPilot 100)為高階智駕三目版,支援高速領航和代客泊車,主要搭載在比亞迪秦PLUS DM-i等入門款車型。天神之眼C最低可搭載於海鷗車型,是行業內首次將高階智駕下放到7萬元級市場的A00級車。
回顧智慧型手機及新能源汽車的發展路徑,科技產品在市場滲透率突破5%之後,通常會迎來加速普及的階段。比亞迪的入局是智駕行業最大預期差,有望推動L2+等級銷量基本盤從100萬輛快速提升至1000萬輛等級,預計2025年高速NOA+城市NOA有望實現翻倍增長,滲透率超20%。
3.1 算力:GPU自主化迫在眉睫
算力是AI的基石,GPU是算力最具象的代名詞。GPU(圖形處理器),最初是為了圖形渲染任務而設計的,它擁有數千甚至數萬個計算核心。與CPU(中央處理器)相比,CPU通常只有幾個到幾十個核心,更擅長邏輯控制和序列處理任務。而大模型訓練和推理過程涉及到大量的矩陣運算,對平行計算有著很高的要求,GPU憑藉其多核架構展現出無可比擬的優勢,因此成為AI領域關鍵的支撐硬體。
縱觀全球GPU版圖,美國的控制力是絕對的,達到壟斷等級。輝達作為全球 GPU 市場的龍頭企業,其市場份額和技術實力遙遙領先。隨著生成式AI大爆發,2023年全球資料中心GPU總出貨量達385萬顆,同比增長44.2%;其中輝達出貨了約376萬個資料中心GPU,市場份額高達98%。輝達憑藉其先進的GPU技術和完善的生態體系(CUDA生態),在AI 算力領域佔據著難以撼動的主導地位。
美國GPU霸權下,中國的AI發展事實上處於受制於人的狀態,隨著全球政治、經濟、科技對峙的加劇,針對中國的GPU封鎖事件也時有發生。自2022年,標誌性的限制事件已經經歷了三輪。
第一輪封鎖(2022年10月):美國首次將AI晶片納入出口管制,直接禁止輝達向中國出售旗艦級AI計算晶片A100和H100。這兩款晶片是訓練大模型的核心硬體,性能屬行業頂尖。面對管制,輝達迅速推出“合規版”A800/H800晶片,通過性能閹割來規避出口限制,勉強維持對華供應。
第二輪封鎖(2023年10月):為封堵“中國特供版”漏洞,美國調整管制標準,將A800/H800納入禁售範圍,同時擴大管制國家至40余國,嚴防轉口貿易。此次封鎖後,輝達又推出中國特供版H20晶片,相當於二次閹割版的H100,性能僅為15%。
第三輪封鎖(2025年1月):建構三極世界體系,將全球劃分為三個等級—— 17個盟友圈可自由獲取GPU;對100多個中間國實施配額制,約能獲得5萬塊GPU;對中國、俄羅斯等敵對國家則全面禁售。
短期看,企業往往通過囤貨實現對GPU出口管制的緩衝,然而非長久之計;中長期看,全力加速國產化替代十分必要。一些國產力量正在站出來,例如華為的昇騰910C性能達輝達H100的60-80%。但是差距仍難以忽視,一方面輝達最新一代GB200算力再次躍升3倍;另一方面在製程工藝上,輝達採用5nm/4nm先進製程,而國產主流仍為14nm等級。未來在設計、製程和生態建設方面都需要持續發力,加速自主化腳步。
3.2 資料:巨大資源潛力待挖掘
資料是Gen-AI時代的燃料;基於神經網路的大模型具備典型的“垃圾進、垃圾出”的特徵,訓練資料的數量和質量直接決定了大模型的性能上限。以OpenAI為例,從GPT-1迭代到GPT-4,隨著模型性能的躍升,訓練資料量也經歷了跨越式增長:2018年GPT-1資料集僅4.6GB,而2023年GPT-4訓練資料量達到驚人的百TB等級,翻了數萬倍。
然而隨著大模型的快速更迭,對於資料枯竭的擔憂也越發明顯。OpenAI原科學家蘇茨克維爾曾表示,“我們只有一個網際網路”,雖然計算在增長,但資料卻沒有增長,預訓練毫無疑問會結束。無獨有偶,2024年研究機構Epoch AI發佈的一份報告預測:人類生成的公開文字資料總有效存量僅約300兆tokens,總量年增速不足10%,而AI訓練資料集規模以每年翻倍的速度擴張,這種剪刀差導致網際網路所有高品質文字資料將在2028年枯竭。
內容屏障日益高築等因素則進一步加劇了資料短缺危機。資料擁有方正通過技術和法律手段限制訪問。技術手段比如通過爬蟲反制來限制內容呼叫;而法律手段則更激進,表現為直接的版權訴訟。例如海外《紐約時報》對OpenAI的版權訴訟、雜誌巨頭康泰納仕集團曾向Perplexity發出的侵權通知;國內也有類似案例,比如知網對秘塔AI的侵權警告。
資料短缺或成為制約大模型技術發展的關鍵瓶頸,應對這一危機,有兩大思路:一是合成資料,即讓大模型生成用於自身訓練的新資料;二則是深入挖掘現有的資料資源。
馬斯克曾在公開演講中表示:“現實世界中用於訓練AI模型的資料幾乎已經耗盡”,並指出合成資料將成為未來唯一的替代路徑。然而,合成資料卻存在著一些難以規避的問題,例如質量參差不齊、偏離真實分佈、並且可能產生模型自噬現象,即模型因反覆學習自身生成的資料而導致性能退化的問題。
相比之下,盤活現有資料資源的巨大潛能,則是一種更務實、更富戰略價值的解法。中國在此方面展現出獨特優勢,不僅具備深厚的資料資源積累,同時正在加速完善國家級的資料要素市場。
一方面,中國的資料資源體量和增量都十分強大。中國擁有全球最龐大的網民群體與最活躍的數位化應用生態,有機構預測到2025年資料總量將佔全球的近30%。當前,中國資料生產總量呈高速增長態勢,2024年同比增長25%。AI相關的資料資源增長尤其快:用於開發、訓練和推理的資料量同比增長超40%。智能家居、智能網聯汽車等智能裝置資料增速位居前列,分別為50%和30%左右。
另一方面,國家級資料標記體系正加速成型,以充分挖掘各行業資料潛力。所謂資料標註,是對資料進行加入標記、說明、解釋、分類和編碼的過程,是提升人工智慧演算法、模型核心能力的關鍵環節。中國資料標註產能全球領先並持續建設:2024年起國家資料局統籌的全國七大標註基地快速推進中,分別位於四川成都、遼寧瀋陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同。2025年3月,七大基地的資料標註總規模達到17282TB,相當於中國國家圖書館數位資源總量的6倍左右。目前已形成醫療、工業、教育等行業的高品質資料集超300個,標註從業人員近6萬人。 (澤平宏觀展望)