智譜深度：模型層定價權的中國樣本，程式碼 Agent 與 API 飛輪能否跑贏算力成本

2026/06/21

•

智譜深度：模型層定價權的中國樣本，程式碼 Agent 與 API 飛輪能否跑贏算力成本

智譜的定價分歧不在“是不是中國大模型公司”，而在它能否反覆把前沿模型能力轉化為高價值工作流、API 價格和可持續 ARR。程式碼 Agent 是第一塊試金石，GLM-5.2 是最新證據；真正的證偽點則在算力供給、模型迭代速度、雲 API 毛利率和客戶留存。

內容概括

智譜最值得追問的地方，不是它已經成為稀缺的上市大模型標的，而是它在模型層裡暴露出一個更難回答的問題：當基礎智能不斷降價，模型公司還能不能靠前沿能力漲價。UBS 把它稱作“中國版 Anthropic”，BofA 強調程式碼資料飛輪，JPM 則用 GLM-5.2 解釋“成熟智能降價、前沿能力漲價”的價格分層。三份報告共同指向同一件事：智譜的估值不是傳統軟體股估值，也不是一次性項目制 AI 公司估值，而是一種仍在驗證中的模型層期權。

這篇報告的判斷是：智譜的核心資產屬性正在從“公共部門和企業本地化部署服務商”遷移到“程式碼 Agent 與開放平台 API 的能力變現平台”。如果這個遷移成立，收入模型會從低頻項目驗收轉向高頻 token 消費和訂閱 ARR，估值錨也會從本地化部署收入倍數轉向 API ARR、遠期利潤和能力迭代的可持續性。但這條路並不輕鬆。雲 API 收入擴張會先壓毛利率，R&D 和推理算力會繼續吃掉利潤，DeepSeek、Kimi、MiniMax 等模型迭代會不斷壓低“夠用智能”的價格。智譜要證明的，不是有能力做出強模型，而是能夠反覆把更強模型賣給更高價值任務。

最關鍵的跟蹤時鐘有四個：GLM-5.2 提價後 API 用量是否穩定；GLM-5.5 能否繼續拉開長程編碼和 Agent 任務能力；2026-2028 年雲 API 收入是否按 UBS/BofA/JPM 預測完成從數億元到百億元等級的跳遷；以及毛利率能否在算力成本壓力下恢復。看多智譜，是押注“程式碼 Agent 是模型層的第一個企業級殺手應用”；看空智譜，則是認為中國模型層最終會被價格戰和算力約束拖回低利潤基礎設施生意。

一句話判斷

智譜不是簡單的“國產大模型上市稀缺標的”，而是中國模型層能否出現 Anthropic 式定價權的公開樣本：如果程式碼 Agent 和企業工作流能持續把 GLM 升級轉化為 ARR、提價和更高毛利，智譜會被重估成前沿能力平台；如果模型能力很快被同業追平，它會回到高投入、低毛利、項目與 API 混合的激烈競爭生意。

一、市場最容易看錯的地方：智譜不是賣“模型”，而是在賣完成任務的機率

模型層最危險的敘事，是把所有 token 當成同一種商品。聊天、摘要、簡單改寫、低風險程式碼補全，最終都會走向價格戰；一旦多個模型能提供接近的結果，客戶自然會比價。這是 DeepSeek 給行業打下的底線，也是中國模型層繞不開的現實。

但程式碼 Agent 和企業工作流不是同一種需求。客戶真正買的不是每百萬 token 便宜幾塊錢，而是任務能不能一次完成、出錯後能不能自己修、長上下文裡能不能保持目標、能不能在真實程式碼庫和業務系統裡閉環。這裡的單位不是 token，而是“完成一件工作的機率”。這也是智譜被反覆拿來和 Anthropic 對比的原因。

UBS 的短句是 “China's Anthropic”。BofA 的短句是 “coding data flywheel intact”。JPM 的短句更直接：“Mature intelligence deflates, frontier capability can price up.” 三句話合在一起，就是智譜這篇深度的核心問題：基礎智能會降價，但前沿能力有沒有可能漲價。

智譜的資產屬性遷移可以分成三層：

這也是報告不能唯寫“智譜是國產大模型龍頭”的原因。龍頭只是靜態位置，定價權才是動態問題。大模型行業的龍頭如果不能持續做出下一代能力，龍頭位置會很快被價格戰吞掉；但如果它能在高價值任務上持續領先，模型能力就不只是研發成果，而是商業化槓桿。

二、三家機構的共同點與分歧

三份研報的出發點不同，但它們對智譜的核心變數其實高度一致。

UBS 給的是“從小 ARR 到大 ARR”的路徑，BofA 給的是“收入結構和成本結構”的拆解，JPM 給的是“為什麼價格戰不必然毀掉所有模型公司”的理論。真正的分歧在三個地方：

1. 智譜的雲 API 收入能漲多快；

2. 雲 API 毛利率會不會因為規模與效率提升而改善；

3. 估值到底應該看 2026 年收入、2026 年 ARR，還是 2030 年遠期利潤。

這三個問題都沒有靜態答案。智譜的股票會隨著模型發佈、API 用量、價格變化和同業追趕不斷重定價。它不是那種一年只看一次財報的公司，而是一個模型發佈周期驅動估值的資產。

三、舊資產屬性：本地化部署給智譜底座，但不給它高估值

智譜 2025 年收入 7.24 億元，其中本地化部署仍佔 74%。這部分業務並不差，甚至是它區別於純消費 AI 應用公司的重要底座。公共服務、企業客戶、資料安全要求、定製化交付和私有化部署，讓智譜有真實客戶、真實項目、真實收入確認。

BofA 把這部分定義為 on-premise deployment：客戶把模型部署在自己的基礎設施中，智譜提供模型訓練、微調、實施支援和交付服務。2025 年本地化部署收入 5.34 億元，同比增長 102%；公共服務客戶佔比從 2023 年 9% 上升到 2025 年上半年的 29%。這說明智譜不是純靠開發者熱度講故事，它已經在高合規場景裡證明交付能力。

但本地化部署不是智譜高估值的核心。原因有三個。

第一，項目收入天然不連續。項目制收入取決於驗收節奏、預算周期和交付資源，無法像 API 用量一樣隨模型呼叫自然放大。UBS 也提醒，2025 年應收帳款周轉天數從 2024 年 107 天升到 153 天，這意味著項目制擴張會帶來回款與現金流壓力。

第二，交付越多，人力和實施越重。BofA 指出，2025 年本地化部署毛利率從 2024 年的 66.0% 降至 48.8%，原因是為滿足多樣化客戶需求投入更多交付資源。這個變化很重要：如果智譜只是項目公司，規模放大未必自動帶來利潤率提升。

第三，本地化部署可以給客戶關係，但不能單獨證明模型層定價權。公共服務和企業客戶願意買智譜，是對安全、部署、服務和能力的綜合認可；但資本市場給高倍數，押的是“這個客戶未來會不會通過 API、Agent、開發者平台持續用模型”。項目是入口，ARR 才是估值槓桿。

因此，本地化部署更像智譜的第一張門票：它證明智譜能進入企業和公共服務客戶體系，能做複雜交付，也能積累垂直場景資料。但它不是最終的重估邏輯。

四、新資產屬性：開放平台和 API 才是估值彈性的主戰場

智譜真正開始被重新定價，是因為開放平台和 API 收入斜率突然變陡。

UBS 預計，開放平台和 API 收入將從 2025 年 1.9 億元增長到 2027 年 61.88 億元，2025-2027 年 CAGR 達 470%；總收入則從 2025 年 7.24 億元升到 2027 年 79.41 億元，CAGR 達 231%。BofA 的節奏稍有不同，但方向一致：雲收入從 2025 年 1.9 億元升至 2026E 23 億元、2027E 75 億元、2028E 169 億元，成為最主要增長引擎。

這張表的重點不是精確到個位數，而是斜率。三家機構都認為智譜 2026 年會進入收入跳遷期，只是 JPM 更激進，UBS 更強調 2026 年 ARR 和分部估值，BofA 更重視雲收入擴張後的毛利率修復。

為什麼 API 收入會突然變陡？有三個觸發器。

第一，模型矩陣補齊。智譜從 GLM-4.5、GLM-4.7、GLM-5、GLM-5 Turbo 到 GLM-5.1、GLM-5.2，不是在單點發佈模型，而是在圍繞編碼、Agent、長上下文和工作流任務持續迭代。模型發佈越密集，開發者試用和遷移的機會越多。

第二，程式碼計畫開始把模型能力打包成訂閱。UBS 提到，智譜 2025 年 9 月推出 Coding Plan，2026 年 3 月又推出 Claw Plan。Coding Plan 分 Lite、Pro、Max，月費分別為 49 元、149 元、469 元；Claw Plan Basic 和 Pro 月費分別為 39 元和 99 元。它們的意義不在價格本身，而在於把“模型呼叫”變成“開發者工作流入口”。

第三，Agent 框架帶來新的 token 消費。OpenClaw、AutoClaw 和 GLM-5-Turbo 這類 Agent-native 設計，使模型不只是回答問題，而是持續規劃、呼叫工具、讀取程式碼庫、修改檔案、驗證結果。只要任務持續時間變長，token 消耗、上下文長度和失敗重試就會自然抬升 API 用量。

這就是“程式碼資料飛輪”的真正含義：更強模型吸引更多開發者和企業工作流，更多工帶來更多真實互動資料，資料再反哺模型後訓練和產品最佳化，模型能力改善後繼續支撐更高價格和更高用量。這個飛輪一旦成立，智譜的收入質量會發生質變。

五、GLM-5.2 為什麼重要：它不是單純漲價，而是一次單位經濟驗證

JPM 的 GLM-5.2 報告是三份材料裡最有增量的部分。它提出一個很重要的判斷：模型價格不是單向下行，而是分層。

成熟智能會降價。基礎聊天、簡單總結、標準內容生成、低風險程式碼輔助、常規工具呼叫，只要多個模型能做，價格就會被 DeepSeek 式低價策略壓下去。客戶不會為同質能力支付高溢價。

前沿能力可能漲價。長程編碼、複雜工程、企業自動化、長上下文文件和程式碼庫處理、多步驟任務執行，如果能顯著提高完成率、減少重試、節省人力時間，客戶仍願意付更高價格。這裡的價格錨不是 token 成本，而是節省的工程師時間、替代的外包成本和減少的系統錯誤。

GLM-5.2 的價值就在這裡。JPM 指出，GLM-5.2 與 GLM-5.1 表麵價格相近，但 GLM-5.1 有分層定價，部分用量可享受低價；GLM-5.2 則把更高價格應用到所有工作負載，因此混合價格提升。JPM 估算 GLM-5.2 的 API 混合價格較 GLM-5.1 高約 13%，並且由於 GLM-5.2 仍屬於同一 GLM-5 模型家族，性能提升主要來自強化學習和後訓練最佳化，而不是模型規模大幅增加，這意味著成本端未必同步大幅上升。

因此，GLM-5.2 不是一個普通版本號，而是一個測試題：客戶會不會為更好的任務完成率接受更高混合價格。如果答案是會，智譜的商業模型就從“模型越強越燒錢”變成“模型越強越能提價”。如果答案是否，GLM-5.2 就只是短暫發佈窗口優勢，價格戰會很快把溢價吃掉。

六、程式碼 Agent 是第一塊試金石

為什麼三家機構都反覆強調 coding？因為程式碼是大模型商業化裡最早具備付費閉環的場景之一。

程式碼任務有幾個天然優勢。第一，結果可驗證，程式碼能不能跑、測試能不能過，反饋比普通知識問答更清楚。第二，付費人群明確，開發者和企業研發部門能直接把工具價格和人力成本對比。第三，任務複雜度可持續提升，從補全到重構、偵錯、遷移、測試生成，再到多檔案和多倉庫任務。第四，程式碼任務天然需要長上下文、工具呼叫和多步驟推理，這正是前沿模型能拉開差距的地方。

UBS 做了一個很有用的測算：如果中國前十大網際網路公司全部員工使用智譜 Coding Plan Max，年化收入機會可達約 45.5 億元；如果只滲透研發員工，機會約 22.75 億元。它還進一步用軟體開發者薪酬佔比測算，中國軟體開發者 AI coding TAM 可達 142 億美元。這些數字當然不是預測，但說明程式碼 Agent 的價格錨可以從“token”切到“研發工資”。

這裡要克制。不是所有測算都會實現，也不是所有大型網際網路客戶都會把核心程式碼工作流交給外部模型。相反，這恰恰是智譜的關鍵風險：它的 KA 客戶裡有很多網際網路大廠，而這些客戶也在自研模型和 coding agent。一旦自研模型能力追上，智譜可能會失去最高價值客戶。

但從投資角度，程式碼 Agent 仍然是最好的觀察窗口。它能同時驗證四件事：模型能力、使用者付費、API 用量、資料飛輪。普通聊天產品很難證明這些變數；程式碼產品可以。

七、財務模型：高增長是真的，高投入也是真的

智譜的財務模型不能用成熟軟體公司方式看。它現在仍處在重投入階段，收入斜率很陡，但虧損也很深。

2025 年智譜收入 7.24 億元，BofA 預計 2026 年 33.97 億元、2027 年 94.72 億元、2028 年 199.73 億元；JPM 更激進，預計 2028 年收入 308.62 億元；UBS 則預計 2028 年 135.74 億元。三家機構在絕對數上差距很大，但都認為 2026-2028 年是收入跳遷期。

這張表本身就是智譜的估值分歧。JPM 相信 GLM-5.2 提升了高品質收入能見度，所以把 2026-2030 年收入上調 7%-16%，並把 2028 年調整後淨利潤從虧損改為盈利。BofA 更謹慎，認為雲 API 收入會快速增長，但 2028 年公司仍處於虧損狀態。UBS 則把估值重心放在 2026 年收入和 ARR。

看智譜不能只看收入，還要看毛利率結構。2025 年雲部署收入只有 1.9 億元，佔 26%，但云毛利率從 2024 年 3.3% 改善到 2025 年 18.9%。本地化部署毛利率則從 2024 年 66.0% 降到 2025 年 48.8%。這說明兩個事實同時成立：

1. API 業務還沒有成熟，但改善速度很重要；

2. 本地化部署看起來毛利更高，但規模擴張也會帶來交付成本壓力。

投資者真正要盯的，不是總毛利率單點，而是雲 API 毛利率能不能持續上行。如果雲收入佔比上升而云毛利率不能改善，智譜會變成“收入越高、推理成本越高”的高燒錢模型公司；如果雲 API 毛利率隨規模、價格和推理效率改善，智譜才有可能走向軟體化利潤結構。

八、估值：三種世界觀

智譜的估值方法本身也在變。它還沒有穩定利潤，傳統 P/E 沒有意義；但用 P/S 又會忽略 API ARR 的質量差異。三家機構各自代表一種世界觀。

UBS 目標價 HK$1,160，假設 145x 2026E P/S，並用 SOTP 交叉驗證，其中開放平台和 API 用 100x P/ARR、本地化部署用 60x P/S。BofA 目標價 HK$1,250，採用 DCF，更強調收入增長、毛利率改善和長期自由現金流。JPM 目標價 HK$1,800，用 2030 年調整後淨利潤和 30x P/E 折現，隱含 2026-2030 年收入 CAGR 超 100%。

這些估值聽起來都很高，但高估值不是問題本身，問題是用什麼變數去驗證高估值。對於智譜，最好的驗證順序不是先問“貴不貴”，而是先問：

1. 2026 年 ARR 能否從 2.5 億美元繼續向 6-10 億美元甚至更高推進；

2. 雲 API 收入佔比上升後，毛利率能否從 2025 年 18.9% 繼續提升；

3. GLM-5.2 提價後，用量是否保持韌性；

4. GLM-5.5 或後續模型能否繼續在 coding、agentic task 和 long-horizon 任務上領先；

5. 公司是否需要持續大規模融資來支撐推理和訓練成本。

如果這些變數都改善，高估值會被增長消化；如果其中兩三個變數惡化，估值會從遠期利潤錨退回短期收入錨，股價彈性會很大。

九、同業比較：智譜、MiniMax、Kimi、DeepSeek 不是同一類風險

中國模型層競爭很激烈，但不能把所有公司放在同一張表裡簡單比參數、價格和榜單。

DeepSeek 的價值在於拉低“夠用智能”的價格地板。它對整個行業構成壓力，因為客戶會用它作為基礎任務的價格錨。智譜如果拿基礎聊天、普通總結和低風險程式碼補全去競爭，很難保住溢價。

Kimi 的風險在於下一輪模型迭代。JPM 特別提示要關注 Kimi K3 和 DeepSeek V4.1，因為 GLM-5.2 的溢價不是永久產權，而是一個發佈周期裡的領先窗口。如果同業在下一輪追平，智譜的價格權會被重新測試。

MiniMax 則是另一個稀缺上市 AI 資產參照。BofA 同時覆蓋智譜和 MiniMax，認為兩者 ARR 都在快速增長，並預計都將在 2026 年底達到 10 億美元 ARR 量級。但二者資產屬性不同：智譜更偏 coding/agent 和企業 API，MiniMax 更偏多模態和全球使用者觸達。智譜的 R&D 金額更高，MiniMax 的單人 R&D 薪酬更高；智譜雲 API 佔比預計更快上升，但毛利率短期承壓也更明顯。

智譜的競爭策略不能是“比所有人都便宜”，也不能是“所有任務都領先”。它要做的是在程式碼 Agent、企業工作流、長程任務和高可靠性場景裡持續做出差異。只要這些場景足夠大，基礎模型價格戰就不會完全摧毀智譜的模型層利潤池。

十、核心模型表：智譜這筆帳怎麼成立

智譜的投資模型可以壓縮成一張帳。

這張表的結論很直接：智譜的股票不是“便宜買盈利”，而是“高價買驗證”。驗證速度越快，估值越合理；驗證失敗越多，估值越脆弱。

十一、證偽清單

看多智譜必須帶著證偽清單，否則容易被“AI 稀缺資產”敘事帶走。

其中最重要的是前三項。只要模型能力、價格權和雲毛利率同時成立，其他問題可以通過融資、營運和客戶結構緩慢消化；如果這三項同時轉弱，智譜的資產屬性就會從“前沿能力平台”退回“高投入模型服務商”。

十二、未來四個季度怎麼跟蹤

智譜這種公司，季度跟蹤不能只看收入增速。收入是結果，模型能力和 API 用量才是前導指標。

這些指標裡，最優先看的是 GLM-5.2 用量和雲毛利率。前者回答“客戶願不願意為更強模型付錢”，後者回答“公司能不能從客戶付錢裡留下錢”。兩者缺一不可。

十三、公司能力遷移：清華系實驗室、公共服務交付、開發者平台，三種能力要合成一張網

智譜的能力遷移不能只看模型榜單。大模型公司最容易陷入一種誤區：每一次發佈會都能證明技術進步，但只有少數技術進步能沉澱為商業資產。智譜真正有價值的地方，是它同時有三種能力來源，並且這三種能力有可能互相增強。

第一種能力是研究組織能力。BofA 強調智譜的清華背景和研發人才密度：CEO 張鵬、首席 AI 官唐傑等核心人員與清華長期相關，2025 年 R&D 費用約 32 億元，同比增長 45%，相當於收入的 439%；截至 2025 年 6 月，研發人員佔員工比例超過 74%。這不是成熟公司喜歡展示的利潤率指標，而是模型公司早期的“產能指標”：它說明公司把資源集中投向模型迭代、訓練基礎設施和演算法工程，而不是只做銷售交付。

第二種能力是複雜客戶交付。公共服務、傳統企業、網際網路大客戶都不是輕量級 SaaS 客戶。它們要安全、合規、私有化、系統整合、流程定製和持續服務。智譜在這類客戶裡已經拿到收入，這讓它比純開發者社區模型更容易進入真實預算。但這也是雙刃劍：交付能力能換收入和客戶關係，卻會消耗人力、拖累回款、壓低本地化部署毛利率。

第三種能力是開放平台和開發者生態。程式碼計畫、Claw Plan、AutoClaw、GLM-5 系列 API，把智譜從“為客戶做項目”推向“讓客戶持續呼叫模型”。這部分能力最難，也最值錢。項目交付能證明客戶願意買一次，API 和訂閱能證明客戶願意反覆買。只有反覆買，才有 ARR；只有 ARR，才有模型層的高估值錨。

這三種能力如果分開看，都不足以支撐智譜的高估值。研究能力沒有商業化，會變成燒錢；交付能力沒有平台化，會變成重服務；平台能力沒有前沿模型，會被價格戰拖下去。智譜真正的看點，是三者能不能合成一張網：研究能力帶來模型升級，模型升級帶來開發者和企業工作流，工作流帶來資料和收入，收入再支撐下一輪模型迭代。

這就是“飛輪”這個詞不能濫用的地方。真正的飛輪不是有使用者、有模型、有客戶就叫飛輪，而是每一環都能加強下一環。智譜現在看起來有飛輪雛形，但還沒有完全閉環。2026 年之後，市場會用 API ARR、雲毛利率和大客戶留存來判斷這個飛輪是真轉起來，還是只是在模型發佈窗口裡短暫加速。

十四、算力和資金約束：智譜的利潤表不是被銷售費用拖住，而是被能力軍備競賽拖住

智譜的虧損不能簡單理解成“早期網際網路公司虧損”。模型公司的虧損結構更硬，因為它來自訓練、推理、研發人員和算力基礎設施。傳統 SaaS 公司邊際成本較低，一旦收入放大，毛利率和經營槓桿會比較自然地釋放；模型公司則不同，收入每增長一塊錢，背後可能伴隨更多推理呼叫、更多上下文、更多 GPU 或國產算力資源、更多工程最佳化。

BofA 的資料能說明這個問題。2025 年智譜 R&D 費用約 32 億元，佔收入 439%；2026 年毛利率預計從 2025 年 41% 下降至 32%，原因不是業務不增長，而是雲 API 佔比提升後推理成本更重。到 2028 年，BofA 才預計總毛利率修復至 38%，雲部署毛利率改善至 35%左右。換句話說，智譜不是先有利潤再擴張，而是先用算力和研發換模型能力，再用模型能力換 API 收入，最後才嘗試把推理效率和價格權轉成毛利率。

JPM 對 GLM-5.2 的樂觀，也正建立在這個成本框架上。GLM-5.2 如果主要靠強化學習和後訓練最佳化提升能力，而不是靠模型規模顯著擴大，就有可能形成更好的單位經濟：價格提高，但成本基座相對穩定。這種升級比單純發佈更大模型更重要，因為更大模型不一定改善利潤表，可能只是把收入和成本同時放大。

智譜的資金問題也不能忽視。BofA 提到，和 MiniMax 相比，智譜淨現金餘額更低，潛在再融資需求更高。JPM 模型裡 2026 和 2027 年仍有融資現金流假設。對這類公司來說，融資不是旁枝末節，而是商業模式的一部分：只要模型軍備競賽還在繼續，外部資本窗口、股價表現和投資者信心都會影響公司能否持續投入。

這也是智譜的估值波動可能很大的原因。它一方面是稀缺 AI 資產，另一方面又需要不斷證明自己配得上融資和高估值。股價上漲可以降低融資成本，融資改善可以支撐算力投入，算力投入可以幫助模型升級，模型升級可以支撐股價。這是正循環。但如果股價下跌、融資困難、算力受限、模型迭代放緩，也可能形成反循環。

因此，智譜的深度研究不能唯寫技術，也不能唯寫財務。技術決定收入想像空間，財務決定它能不能活到想像空間兌現。 (404K)

港股