野村:全球人工智慧趨勢追蹤報告:人工智慧專題研究

《全球人工智慧趨勢追蹤報告》5個核心觀點。

一、DeepSeek-V4 或許會延續演算法方面的創新路徑,然而並不會再次上演 V3/R1 等級那樣的全球衝擊。

報告表明,DeepSeek-V4預估會在2026年2月中旬進行發佈,有可能在程式設計、超長程式碼處理以及推理可靠性等方面達成突破。然而,和一年前V3/R1所引發的市場震動不一樣,全球主要雲服務商,也就是CSP,已然加快朝著通用人工智慧,即AGI的方面邁進,不間斷的算力投入致使市場對於新模型的衝擊具備更強的韌性。所以,V4更大機率會促使中國AI產業鏈創新周期加快,而不是去顛覆全球AI基礎設施市場的格局。

二、mHC與Engram技術架構代表大模型效率最佳化的新方向

近期,DeepSeek發表了兩篇論文,這兩篇論文揭示了V4可能採用的核心技術,其中,流形約束超連接(mHC)通過改進殘差連接機制實現了更深網路層間的穩定資訊流,Engram條件記憶模組則通過解耦記憶與計算,把靜態知識檢索任務從Transformer計算中剝離。這兩項創新分別從訓練穩定性和記憶體效率角度,為突破”晶片牆“和”記憶體牆“提供了工程化解決方案。

三、演算法創新正在重構AI價值鏈的成本收益結構

通過雙隨機矩陣約束以及Birkhoff多面體投影的mHC機制,在維持深層訊號傳播穩定性之際降低梯度爆炸風險;Engram借助把百億級參數的記憶表解除安裝到CPU記憶體,使得推理吞吐量損失能夠忽略不計(<1%)。這樣一種“以演算法換算力”的路徑,讓國產AI晶片於訓練失敗率較高的當前狀況下,依舊能夠經由架構最佳化達成可用性能,進而加速國產算力的大規模運用。

四、開源模型生態從DeepSeek單極主導走向多元競爭

有資料顯示,DeepSeek V3以及R1,在2024年年底的時候,曾經佔據OpenRouter開源模型token消耗量的50%還要多,然而到了2025年下半年,其份額已經明顯下降,Qwen、Llama、Mistral等模型形成了“夏季拐點”之後的碎片化局勢。這表明開源大模型市場正從單一技術領先者的紅利時期,進入到多玩家技術迭代與生態競爭的新的階段。

五、AI應用層正從對話工具向複雜任務執行體演進

觀察到有報告稱,豆包AI手機,還有阿里通義APP,已然能夠自動開展多步驟任務,這意味著AI智能體(也就是Agent)開始從那種”對話式互動“狀態朝著”任務型助手“方向轉型。這種演進會明顯使得token消耗量和算力需求有所增加,原因在於複雜任務的執行需要更加頻繁地與大模型進行互動,這樣一來,就有可能把模型效率提升所帶來的單次呼叫成本下降給抵消掉。


(TOP行業報告)