#Token
Token出海或迎風口!Kimi+DeepSeek+智譜+MiniMax,籌碼集中概念股出爐
AI大模型服務正面臨嚴峻的算力考驗。進入2026年,人工智慧大模型行業競爭步入白熱化階段。春節前,騰訊元寶、阿里千問、字節跳動豆包等大廠集中發力C端市場,通過各類福利活動掀起使用者“爭奪戰”。春節假期至今,全球大模型賽道融資消息也密集落地,資本熱度持續攀升。然而,伴隨使用者規模與使用頻次的激增,Token(詞元)消耗量顯著增長,大模型服務正面臨嚴峻的算力考驗。春節期間,豆包因春晚高頻互動導致算力承壓,一度暫停視訊通話功能;智譜AI等廠商也因高並行請求採取了API限流等措施。算力供給不足、推理資源緊張,已成為當前大模型規模化落地過程中亟待解決的核心難題。中國國產大模型霸榜OpenRouter自2025年初DeepSeek橫空出世、驚豔全球以來,中國大模型產業快速崛起,憑藉獨特的技術與場景優勢持續霸榜全球。據全球最大的大模型API聚合平台OpenRouter資料顯示,2月平台內前十模型總Token消耗量已突破27兆,國產模型貢獻超過14兆,市場佔比超過50%。其中,MiniMax M2.5以超過5兆的Token消耗位居全球榜首;Kimi K2.5緊隨其後,2月Token總消耗量超過4兆;DeepSeek V3.2、GLM 5分別位列第四、第八位。這些頭部國產大模型,普遍聚焦於程式碼能力與智能體(Agent)自動化任務的能力提升。從春節期間的消耗量來看,2月16日至22日(農曆除夕至正月初六),OpenRouter平台Token消耗量前十的大模型中,中國大模型份額佔比已超60%。其中,MiniMax M2.5、GLM-5 消耗量環比大幅增長,增幅分別達到197%和158%。反觀全球市場,Google、xAI、OpenAI等海外廠商旗下大模型的Token消耗量增速明顯低於國內模型,全球市場份額增長乏力,部分甚至出現負增長。Token消耗量或開啟多年增長模式Token(詞元),即AI處理資訊的最小單位。大模型每生成一個Token,後端的伺服器就得高速運轉,這不僅需要強大的算力,更需要大量的電力。根據業內測算,Token生成的成本結構中,電力及算力的成本佔比超過七成。摩根大通的報告顯示,基於使用者情境的預測,從應用採用的角度出發,Token消耗量或開啟多年增長期。中國的AI推理Token消耗量預計將從2025年的超10千兆增長至2030年的約3900千兆,增幅接近369倍,主要受兩個復合要素推動,一是隨著AI成為搜尋、內容生成、客戶服務和生產力的默認介面,AI在消費者使用者和企業工作負載中的滲透率都在提高;二是用例從對話AI擴展到智能體和多模態輸出(更長的上下文、更多的工具呼叫、更豐富的輸出),即使使用者數量增長放緩,這也會實際增加每個會話的Token。從細分領域來看,隨著時間的推移,推理需求的佔比發生明顯變化。對話AI佔2025年預期Token總消耗量的近一半,預計到2030年逐步下降至高個位數百分比;生活情景AI智能體的份額預計將從2025年的個位數提高至2030年的10%至20%。國產大模型具備電力的算力的雙重優勢對於開發者而言,性價比是硬道理。從國內來看,無論是電力還是算力,都具備顯著的成本優勢,並有望重構AI定價權。從電力來看,國家能源局資料顯示,截至2025年底,中國累計發電裝機容量達38.9億千瓦,同比增長16.1%,發電量佔全球總量的三分之一。中國也成為全球首個全社會用電量突破10兆千瓦時的國家,電力供給充足且成本優勢顯著。AI熱潮之下,美國電價呈現明顯上漲趨勢,進一步凸顯中國電力成本的競爭力。從算力來看,早在2025年10月份,央視網報導,“十四五”時期以來,中國開啟新一輪數字基礎設施大佈局,全國一體化算力網連通東西南北,算力總規模躍居全球第二,不僅為中國數字經濟的成長澆築新的基座,也創造了增長的新機遇。目前,國內多家頭部算力企業已建構起完備的適配體系,在推理環節有效突破海外技術壟斷,伺服器、光模組、散熱等關鍵硬體環節也基本實現自主可控。依託規模化部署、低成本電力供給與演算法持續迭代,國產方案在主流應用場景中的Token生產成本具備明顯優勢。業內普遍認為,國產大模型憑藉更高效的架構設計,逐步降低對高端GPU的剛性依賴;而全球開發者對中國大模型的廣泛選用,進一步拉動國產算力需求呈現爆發式增長。14隻籌碼集中大模型概念股出爐儘管在最近幾個交易日的行情中,算力類股表現有明顯分化,但不可否認的是,算力需求提升是必然趨勢。在以周度進行統計的周期中,國產大模型Token消耗量更是一度超過美國(2026年2月9日至15日),後續優勢持續擴大,多重利多因素的加持下,Token出海有望成為趨勢。證券時報·資料寶根據萬得、同花順等公開資訊梳理,A股市場中屬於智譜、Kimi、DeepSeek及MiniMax主流大模型的概念公司有140余家。從市場表現來看,截至2月27日,這140餘隻概念股今年以來平均漲幅超過13%,傑創智能、藍色游標及中控技術今年以來累計漲幅均超過60%,前2隻個股涉及智譜概念,中控技術則涉及DeepSeek概念。首都線上、金現代、優刻得-W今年以來累計漲幅均超過40%,3家公司均涉及智譜概念。從籌碼變化情況來看,最新股東戶數較2025年年末下降的概念股有14隻,3隻概念股的股東戶數下降幅度超過10%,分別是世紀天鴻、恆為科技及遠光軟體。世紀天鴻最新股東戶數較去年末下降近24%,公司以自身戰略定位和資源稟賦為出發點,結合人工智慧技術已推出了基於大語言模型研發的專注於服務老師的AI智能體“小鴻助教”,並投資了基於人工智慧NLP(自然語言處理)技術、聚焦中小學寫作場景的人工智慧輔助寫作產品“筆神作文”。恆為科技最新股東戶數較去年末下降超過21%。公司2025年2月份表示,其推出的昇騰、DeepSeek一體機分為訓推一體機與推理一體機兩種類型,以“開箱即用+高並行低時延”為核心優勢,覆蓋金融、政務、科研、醫療等眾多垂直行業,助力行業實現智能化升級。遠光軟體最新股東戶數較去年末下降10.6%。目前公司主要接入或適配了智譜、阿里千問、DeepSeek、盤古等大模型。這14隻概念股今年以來平均漲幅超過9%,恆為科技、世紀天鴻、值得買漲幅居前,均超過15%。太極股份、浪潮資訊、宇信科技表現較弱,今年以來股價均呈下跌局面,其中浪潮資訊伺服器市佔率全球領先,涉及DeepSeek及MiniMax概念。(資料寶)
Token 出海,將中國電力賣給全世界
1858 年的夏天,一根銅芯電纜橫穿大西洋海底,把倫敦和紐約連在了一起。這件事的意義從來不在於傳輸速度,而在於權力結構,誰鋪設了海底電纜,誰就能在資訊流動中抽水。大英帝國靠著這張全球電報網,把殖民地的情報、棉花的價格、戰爭的消息都攥在手裡。帝國的強大不僅是有艦隊,還有那根電纜。一百六十多年後,這個邏輯正在以一種意想不到的方式重演。2026 年,中國大模型正在悄悄吃掉全球開發者市場。OpenRouter 最新資料顯示,平台前十模型的 Token 消耗中,中國模型獨佔 61%,前三名清一色來自中國。舊金山、柏林、新加坡的開發者每天發出的 API 請求,正穿越太平洋海底光纜抵達中國資料中心,算力在那裡消耗,電力在那裡流動,結果傳回來。電力從未離開中國電網,但它的價值通過 Token 完成了跨境交付。AI 模型大遷徙2026 年 2 月 24 日,OpenRouter 發佈了一份周度資料:平台前十模型的總 Token 消耗約 8.7 兆,中國模型獨佔 5.3 兆,佔比 61%。MiniMax M2.5 以 2.45 兆 Token 空降榜首,Kimi K2.5、智譜 GLM-5 緊隨其後,前三名清一色來自中國。2 月 26 日最新資料這不是偶然,一根導火索點燃了一切。今年初,OpenClaw 橫空出世,一個讓 AI 真正開始"幹活"的開源工具,可以直接控制電腦、執行命令、平行完成複雜工作流,GitHub 星標數周內突破 21 萬。金融從業者 John 第一時間安裝 OpenClaw,並接入了 Anthropic API,開始自動監控股市資訊,並及時匯報給出交易訊號,幾個小時後,他盯著帳戶餘額愣了幾秒:幾十美元,沒了。這就是 OpenClaw 帶來的新現實。過去跟 AI 聊天,一次對話幾千個 Token,費用忽略不計。OpenClaw 接入之後,AI 在後台同時跑十幾個子任務,反覆呼叫上下文、循環迭代,Token 消耗不是線性的,是指數級的。帳單像開著引擎蓋的車在加速,油表往下掉,停不下來。開發者社群裡隨即流傳出一個“妙招”:用 OAuth 令牌把 Anthropic 或 Google 的訂閱帳戶直接接進 OpenClaw,把月費制的“無限”額度變成 AI Agent 的免費燃料,這也是很多開發者採取的方法。官方的反制隨即到來。Anthropic 在 2 月 19 日更新協議,明確禁止將 Claude 訂閱憑證用於 OpenClaw 等第三方工具,要接入 Claude 功能,必須走 API 計費通道。Google 更是大面積封禁了通過 OpenClaw 接入 Antigravity 和 Gemini AI Ultra 的訂閱帳號。“天下苦秦久矣”,John 隨即投入了國產大模型的懷抱。在 OpenRouter 上,國產大模型 MiniMax M2.5 在軟體工程任務上的得分是 80.2%,Claude Opus 4.6 是 80.8%,差距幾乎可以忽略。但價格天差地別,前者輸入端每百萬 Token 0.3 美元,後者 5 美元,差了約 17 倍。John 切了過去,工作流依然運轉,帳單縮水了一個數量級,這種遷徙正在全球範圍內同步發生。OpenRouter 的 COO Chris Clark 說得很直接,中國開源模型之所以能拿下大量市場份額,是因為它們在美國開發者運行的代理工作流中佔比異常之高。電力出海要理解 Token 出海的本質,必須先搞清楚一個 Token 的成本結構。它看起來很輕,一個 Token 大約等於 0.75 個英文單詞,你跟 AI 的一次普通對話,消耗的也不過幾千個 Token。但當這些 Token 以兆為單位堆疊,背後的物理現實就變得沉甸甸。拆開 Token 的成本,核心只有兩項:算力和電力。算力是 GPU 的折舊攤銷,你買下一塊輝達 H100,花大約三萬美元,它的壽命換算到每一次推理,就是折舊成本。電力是資料中心持續運轉的燃料,GPU 滿載時每塊耗電約 700 瓦,加上冷卻系統的開銷,一個大型 AI 資料中心的電力帳單可以輕鬆超過年均數億美元。現在,把這個物理過程在地圖上畫出來。一個美國開發者在舊金山發出一條 API 請求。資料從加利福尼亞出發,經由太平洋海底光纜抵達中國某地的資料中心,GPU 叢集開始工作,電從中國的電網流向那些晶片,推理完成,結果回傳。整個過程,也許只用了一兩秒。電力,從未離開中國的電網,但電力的價值,通過 Token,完成了跨境交付。這裡有一個普通貿易無法企及的神奇之處:Token 沒有形體,不需要經過海關,不會被關稅打到,甚至不在任何現行的貿易統計口徑裡。中國出口了大量算力與電力服務,但在官方的商品貿易資料上,它幾乎是隱形的。Token 成為了電力的衍生品,Token 出海本質是電力出海。這也得益於中國地相對低廉的電價,綜合電價比美國低約 40%,這是物理層面的成本差,競爭對手能輕易複製的。此外,中國 AI 大模型也有演算法和“內卷”優勢。DeepSeek V3 的 MoE 架構讓推理時只啟動部分參數,獨立測試顯示其推理成本比 GPT-4o 低約 36 倍,MiniMax M2.5 同樣是 229B 總參數隻啟動 10B。最上一層是內卷,阿里、字節、百度、騰訊、月之暗面、智譜、MiniMax……十幾家公司在同一條賽道上互相踩踏,價格早就跌破了合理利潤區間,賠本賺吆喝已經是行業常態。細看一下,這和中國製造出海一樣,利用供應鏈優勢和行業內卷,將 Token 價格狠狠打下去。從比特幣到 Token在 Token 之前,還有一次電力出海。大約在 2015 年前後,四川、雲南和新疆的電站管理者,開始迎來一批奇怪的客人。這些人租下廢棄的廠房,裝進密密麻麻的機器,24 小時通電運轉。機器什麼都不生產,只是不停地做一道數學題,偶爾,會從這道無窮無盡的數學題裡,算出一枚比特幣。這是電力出海的第一代形態:把廉價水電和風電,經由礦機的雜湊運算,兌換成全球流通的數位資產,再在交易所上變現為美元。電力沒有穿越任何邊境,但電力的價值,以比特幣為載體,流向了全球市場。那幾年,中國算力一度佔到全球比特幣挖礦算力的 70%以上。中國的水電和煤電,以這種迂迴的方式,參與了一場全球資本的重新分配。2021 年,這一切戛然而止。監管重錘落下,礦工四散,算力遷徙到了哈薩克、美國德克薩斯和加拿大。但這個邏輯本身從未消失,只是在等待一個新的外殼,直到 ChatGPT 橫空出世,大模型群雄逐鹿,曾經的比特幣礦場搖身一變成為了 AI 資料中心,礦機變成了算力 GPU,曾經生產的比特幣變成了 Token,不變的只有電力。比特幣出海和 Token 出海,在底層邏輯上是同構的,但 Token 在當下更有商業價值。礦機挖礦是一個純粹的數學計算,產出的比特幣是一種金融資產,它的價值來自於稀缺性和市場共識,與“算了什麼”毫無關係。算力本身沒有生產性,更像是一個信任機制的副產品。大模型推理不一樣。GPU 消耗電力,產出的是真實的認知服務,程式碼、分析、翻譯、創意。Token 的價值直接來自於它對使用者的效用。這是一種更深層的嵌入,一旦開發者的工作流依賴了某個模型,切換的成本會隨時間積累而變高。當然,還有一個關鍵差異:比特幣挖礦是被中國驅逐出去的,而 Token 出海,是被全球開發者主動選擇的。Token 戰爭1858 年鋪設的那根海底電纜,代表的是大英帝國對資訊高速公路的主權,誰擁有基礎設施,誰就能定義遊戲規則。Token 出海,同樣是一場沒有宣戰的戰爭,阻力重重。資料主權是第一道牆,一個美國開發者的 API 請求經由中國資料中心處理,資料物理上流經了中國。對個人開發者和小型應用來說,這不是問題,但涉及企業敏感資料、金融資訊、政府合規的場景,這是一道硬傷。這也是為什麼中國模型的滲透率在開發工具和個人應用領域最高,在企業核心系統裡幾乎沒有存在感。晶片禁令是第二道牆,中國 AI 發展面臨輝達高端 GPU 的出口管制,MoE 架構和演算法最佳化只能部分抵消這一劣勢,天花板依然存在。但眼前的阻力,只是序章,更大的戰場正在成形。Token 和 AI 模型,已經成為中美之間新的戰略博弈維度,不亞於 20 世紀的半導體、網際網路,甚至更接近一個更古老的比喻:太空爭霸。1957 年,蘇聯發射斯普特尼克一號,美國舉國震驚,隨即啟動阿波羅計畫,砸下相當於今天數千億美元的資源,要在太空競賽中絕不落敗。AI 爭霸的邏輯與此驚人地相似,但激烈程度將遠超太空競賽。太空畢竟是物理空間,普通人感受不到,AI 滲透的是經濟的毛細血管,每一行程式碼、每一份合同、每一個政府決策系統背後,都可能跑著某個國家的大模型。誰的模型成為全球開發者的基礎設施默認選項,誰就在無形中獲得了對全球數字經濟的結構性影響力。這正是中國 Token 出海讓華盛頓真正感到不安的地方。當一個開發者的程式碼庫、Agent 工作流、產品邏輯都圍繞某個中國模型的 API 建構起來,遷移成本會隨時間指數級上升。屆時,即便美國立法限制,開發者也會用腳抵制,就像今天沒程式設計師無法拋棄 GitHub 一樣。今天的 Token 出海,也許只是這場漫長博弈的開篇。中國大模型沒有宣稱要顛覆什麼,它們只是以更低的價格,把服務送到了全球每一個有 API Key 的開發者手裡。這一次,鋪設電纜的,是那些在杭州、北京、上海寫程式碼的工程師團隊,和在南方某個省份晝夜運轉著的 GPU 叢集。這場爭霸沒有倒計時,它每天 24 小時都在進行,單位是 Token,戰場是每一個開發者的終端。 (深潮 TechFlow)
中國AI大模型霸榜!
春節期間國產大模型的使用情況可謂如火如荼。OpenRouter最新周度資料顯示,平台前十模型總token量約8.7兆,中國模型獨佔5.3兆,佔比61%。當周token呼叫量前三模型均為國產大模型,分別為Minimax M2.5、Kimi K2.5、GLM-5,呼叫量環比上周分別變動增加197%、下降20%、增加158%。其中,MiniMax M2.5以2.45兆token空降榜首,Kimi K2.5以1.21兆緊隨其後,智譜GLM 5和DeepSeek V3.2分列第三、第五。OpenRouter是全球最大的大模型API聚合平台,可為開發者提供統一API介面,以訪問全球數百種大語言模型。其核心功能包括多模型呼叫、智能路由最佳化和透明的性能排行榜,旨在解決多模型整合複雜和廠商封鎖問題。從該平台提供的資料看,程式設計(Coding)和智能體(Agent)正成為大模型的兩大核心比拚點。OpenRouter整體呼叫量近期大幅攀升。官方確認,M2.5帶動了100K至1M長文字區間的增量呼叫需求,這個區間正是智能體工作流的典型消耗場景。論token呼叫量,在此平台排名前三的國產大模型都聚焦於提升程式設計能力和智能體(Agent)任務的自動化水平,是2026年初國產大模型在應用層面的重要突破。稀宇科技(MiniMax)於2月13日發佈MiniMax M2.5,稱該模型為全球首個為智能體場景原生設計的生產級旗艦模型。其發佈後七天的呼叫量即突破3.07T tokens,憑藉在程式設計和Agent工作流中的卓越性能與極低的成本,成為開發者首選。月之暗面(Moonshot AI)於1月27日發佈KimiK2.5,該模型採用原生多模態架構,能通過調度多達100個“Agent分身”平行工作,將複雜任務效率提升3到10倍。該模型在多個細分榜單(如程式設計、工具呼叫)中均排名第一,其呼叫量遠超Gemini 3和Claude模型。據澎湃新聞報導,該大模型發佈不到一個月,Kimi近20天累計收入已超過2025年全年總收入,增長主要受全球付費使用者及API呼叫量大漲共同推動,其中海外付費使用者數快速增長。智譜於2月12日發佈GLM-5,該模型參數規模進一步擴展,採用了稀疏注意力機制,是其專為複雜系統工程與長程Agent任務設計的旗艦模型。憑藉免費、200K上下文窗口等優勢,該模型發佈後使用者迎來高速增長,智譜對Coding Plan先後進行了限售、漲價等動作,除夕當天官宣全網尋找“算力合夥人”。隨著AI模型應用場景深化,使用者從簡單問答轉向複雜工作流,如讓模型重構程式碼、改寫檔案、生成文件等,以及智能體模式普及,當前token消耗呈現明顯的“通膨”趨勢。性能提升的同時,國產模型仍以性價比優勢出圈。如MiniMax M2.5和智譜GLM-5相比Claude Opus 4.6具備顯著的成本優勢:在輸入環節,MiniMax M2.5與GLM-5的價格均為0.3美元/百萬token,而Claude Opus 4.6則高達5美元/百萬token,是前兩者的約16.7倍;在輸出環節,MiniMax M2.5的價格為1.1美元/百萬token,GLM-5為2.55美元/百萬token,而Claude Opus 4.6的輸出價格達25美元/百萬token,分別是MiniMax M2.5的約22.7倍和GLM-5的約9.8倍。上述國產模型並不能完全反映國內模型廠商的token呼叫量情況。據海通國際證券,資料顯示,火山引擎的大模型日均token呼叫量已從2024年底的2兆增長至2025年底的63兆;阿里雲外部客戶2025年日均token呼叫也已接近5兆,2026年目標至少15-20兆,內部業務日均呼叫則計畫從16-17兆拉到100兆。從全行業看,中國整體日均token消耗2024年初為1000億,2025年中突破30兆,2026年2月主流大模型合計日均token消耗已到180兆等級。東莞證券最新研報表示,隨著國產模型的程式設計、智能體能力提升,其呼叫量大幅增加,國產大模型在程式設計、智能體領域對標全球頭部模型,有望進一步加快應用落地,加速token消耗量上漲。長江證券此前表示,隨著程式設計和多模態模型和產品的逐步成熟,下游應用場景有望被真正打開,帶來大量的高品質token需求。參照海外AI產業發展規律,從資本開支投入到token需求爆發存在約兩年的滯後期。國內大廠的AI資本開支周期較海外滯後約一年,於2024年下半年開啟。因此,國內雲廠商收入已開始兌現增長,而token數量的真正爆發預計將在2026年到來。 (科創板日報)
Token:最純粹的電力衍生品,中國低電價正在重塑全球AI定價權
當美國使用者點選滑鼠呼叫智譜或Kimi的API,資料通過太平洋海底光纜抵達中國資料中心,GPU消耗中國電力完成推理——電力從未出境,但價值已通過Token完成跨境交付。2026年1月,全球雲端運算行業發生了一場靜默革命。亞馬遜AWS悄然將其EC2機器學習容量塊價格上調約15%,配備八個NVIDIA H200加速器的p5e.48xlarge實例價格從每小時34.61美元跳漲至39.80美元。這一調整打破了雲服務行業延續二十年的“只降不升”鐵律,標誌著雲端運算定價策略的根本性轉變。01 電力變數字在AI時代,Token就是AI工作的“工作量單位”。使用者每問一句話、每生成一張圖、每寫一段程式碼,都在消耗Token。而製造Token的成本結構中,電力+算力佔比超過70%,遠高於其他任何成本。這就是為什麼說Token是最純粹的“電力衍生品”——本質就是電力轉化而來的數字產品。與石油、鋼鐵等傳統商品不同,Token無需物理加工、無需長途運輸,製造過程高度集中:GPU消耗電力,將資料轉化為有用結果,每一份結果都對應固定數量的Token。簡單公式就是:Token = 電力 × 算力效率。電力是“燃料”,算力是“生產工具”,兩者結合就能源源不斷地產出Token。02 跨境新範式美國使用者呼叫中國大模型API的場景,最顛覆之處在於“電力不出境,價值已交付”。長期以來,電力跨境貿易面臨巨大挑戰:特高壓輸電會損耗5%-10%的電力,建設線路成本高昂;使用電池儲存再運輸,不僅容量有限,還會產生自耗電,經濟性極差。Token的出現完美解決了這一難題。中國的電力驅動GPU製造Token,Token通過網際網路(海底光纜)傳輸到全球,使用者付費購買Token對應的AI服務,實際上就是在購買“中國電力轉化而成的數字價值”。這種模式形成了“中國供電、全球使用”的閉環。以海外開發者常用的OpenRouter平台為例,最近一周使用量最高的五個Token模型中,四個來自中國公司,其中MiniMax的M2.5模型一周處理了1.44兆個Token,位居榜首。03 定價權轉移中國電力價格的優勢正在轉化為全球AI服務的“定價話語權”,這是對行業影響最為深遠的變化。中國電力價格低廉並非偶然。西部地區工業電價可低至0.1-0.3元/度,比美國便宜60%以上,比歐洲更具成本優勢。國家推動的“東數西算”工程將資料中心佈局在內蒙古、甘肅等風電、太陽能資源豐富的地區,幾乎可以實現100%使用綠色電力,進一步降低電力成本。電力價格優勢直接轉化為Token成本優勢。製造100萬Token,中國資料中心的電力成本僅為歐美地區的1/4到1/5。再加上中國資料中心的高效率(如上海臨港的海底資料中心,PUE值穩定在1.15以下,電力主要用於計算而非散熱),中國大模型的API定價具有絕對競爭力。DeepSeek通過技術最佳化,每百萬Token定價僅為0.14美元,而OpenAI同類服務高達7.5美元;MiniMax的定價也只有國外同類產品的1/10。04 行業大變革AWS作為全球最大的雲服務提供商,打破二十年“只降不升”的慣例,漲價15%不是孤立事件,而是明確訊號:Token需求爆發性增長,成本壓力正向上游傳導,AI行業的定價邏輯已徹底改變。過去二十年,無論是AWS還是阿里雲,都遵循“使用者越多,價格越低”的邏輯——規模擴大降低單位算力成本,服務價格持續下降。但AI時代改變了這一規則。Token需求暴增,AI智能體、視訊生成等應用日益普及,對算力的需求呈指數級增長,而算力的核心成本(電力、GPU)持續上漲,導致雲服務營運成本大幅上升。AWS漲價本質上是“算力成本上漲倒逼雲服務提價”,背後是Token需求的爆發:Token消耗越多,所需算力越多,消耗的電力、使用的GPU就越多,上游成本(電費、GPU、資料中心維運)隨之上漲。這種成本壓力從AWS等雲服務商傳導至算力提供商、電力供應商,形成閉環:Token需求增長 → 算力成本上漲 → 電力需求增加。05 未來新格局結合當前AI行業現狀——Token需求暴增、算力供應緊張、各國電力價格差異顯著——未來5-10年,AI行業將進入全新階段,“電力+算力”將成為決定性因素,行業格局和盈利模式都將發生根本性變化。隨著AI智能體、多模態大模型(能處理文字、圖片、視訊)、工業AI、自動駕駛等場景日益普及,Token需求將呈指數級增長。摩根大通預測,2025-2030年,中國AI推理使用的Token量每年將增長330%,從10兆增至3900兆,五年增長370倍。全球範圍內,AI智能體普及後,Token消耗量將更加驚人——一個簡單的AI智能體比普通聊天機器人多消耗10倍Token,多個AI智能體協作則可能多消耗100倍Token。Token消耗量增加意味著算力需求增長;算力需求增長則推動電力消耗上升:一個萬卡級算力叢集每年消耗的電力相當於一個小型城鎮的日常用電量。預計到2030年,全球資料中心電力消耗將超過日本全國一年的用電總量。未來,電力不再是AI行業的“次要成本”,而將成為制約行業發展的最大瓶頸——誰能解決“電力價格低廉、供應穩定”的問題,誰就能抓住AI行業的機遇。AWS漲價只是一個開始。未來,無論是阿里雲、騰訊雲還是其他全球雲服務商,都將打破“持續降價”的慣例,進入“適時調價”的新階段——核心原因是算力成本持續上漲,Token需求帶來的成本壓力不斷傳導。雲服務定價邏輯將從“規模擴大就降價”轉變為“成本上漲就調價”:不再單純依賴規模效應降低成本、降低價格,而是根據電力、算力成本變化靈活調整定價,確保盈利能力。這種定價邏輯的轉變將影響整個AI產業鏈的價格體系:從上游的電力、GPU,到中游的算力、Token,再到下游的AI應用,都將面臨成本上漲的壓力。而那些具有成本優勢的企業——擁有低廉電力、高效算力——將在競爭中脫穎而出。 (吐故納新溫故知新)
為什麼所有人都覺得 MiniMax、智譜「太貴了」?
Token,正在變成新時代的「電」。2 月 20 日,港股馬年第一個交易日,恆生科技指數跌了近 3%,一片慘淡。但兩家公司完全無視大盤——智譜暴漲 42.72%,市值衝破 3200 億港元;MiniMax 漲超 14%,市值同樣突破 3000 億港元。一天之內,智譜漲出來的市值就相當於一個 B 站。這兩家公司,一家上市剛 43 天(MiniMax),一家上市剛兩個月(智譜)。它們的市值已經超過了攜程、快手、京東,正在逼近百度。社媒評論區一方面認為,兩家公司漲得太誇張——MiniMax 上市 43 天漲了 487%!一方面,是充滿了「沒上車」的悔恨。根本原因,可能是人們沒有看明白,這波 FOMO 背後,國內 AI 公司上漲的邏輯,是什麼?01反常識:Token 漲價 30%,還被搶空理解這輪暴漲的鑰匙,不在股價本身,而在 8 天前的一則漲價公告。2 月 12 日,智譜發佈了一份價格調整函:GLM Coding Plan 套餐價格結構性上調,整體漲幅自 30% 起,同時取消首購優惠。海外版更猛——Coding Plan 訂閱價格提高 30%-60%,API 呼叫價格直接翻倍。這在半年前是不可想像的。2024 年下半年到 2025 年初,國產大模型打價格戰打得頭破血流:字節豆包報價低到 0.0008 元/千 Token,阿里通義千問 GPT-4 級模型降價 97%,智譜自己也曾把 GLM-4-Plus 降了 90%。但這一次,漲價 30% 之後,套餐上線即售罄。國產 AI 程式設計模型的付費套餐被搶空,這在行業裡還是頭一次。漲了價還限購——這說明需求彈性極低,使用者寧可多掏錢也不能沒有。中金公司在研報裡用了一個精準的描述:行業定價邏輯正從「流量消耗」轉向「算力價值變現」。MiniMax 這邊的情況也類似。2 月 12 日發佈的 M2.5 模型,定位為全球首個 Agent 場景原生設計的生產級模型。隨後上線的 Highspeed 極速推理版本,同樣引發了開發者搶購。兩家公司幾乎同時出現了同一個現象:不是賣不出去需要降價,而是供不應求需要限購。02700 倍 PS,在賭什麼?先說一個讓人不太舒服的事實。MiniMax 2025 年前 9 個月的營收是 5344 萬美元。按當前 3000 億港元(約 385 億美元)的市值算,PS(市銷率)超過 700 倍。智譜的情況也類似——這不是傳統意義上任何估值模型能合理化的數字。對比一下:Anthropic 最新估值約 3800 億美元,年化收入已經超過 20 億美元,PS 大約 190 倍。OpenAI 估值約 8500 億美元,年收入據報導約 130 億美元,PS 約 65 倍。智譜和 MiniMax 的估值倍數,比 OpenAI 高出一個數量級。如果市場不是瘋了,那它一定在賭一個非線性增長的故事。這個故事是什麼?筆者覺得核心不在於「模型變好了」這種顯而易見的敘事,而在於一個更深層的結構性變化:Token 的消耗模式正在從「人類按次使用」,變成「Agent 持續燃燒」。一個程式設計師用 AI 程式設計助手,一天可能消耗幾十萬 Token。但一個 Agent 7×24 小時不停運行——寫程式碼、搜尋資料、執行任務——一天的 Token 消耗可能是千萬級。而在可見的未來,一個人背後可能同時跑著 10 個、甚至 100 個 Agent。虎嗅上有一篇文章把這個邏輯說得很直白:「供給是線性的,需求是指數的。」 每一次模型能力的提升,都會解鎖新的使用場景,打開 10 倍的 Token 消耗空間。人會睡覺,Agent 不會。人一天工作 8 小時,Agent 一天工作 24 小時。這意味著大模型公司的商業模式,可能正在從「按次付費的軟體」,變成一種「持續消耗的能源」。如果這個邏輯成立,那用傳統的 PS 來估值就不合適了——你不會用 PS 倍數去給一家電力公司估值。你看的是產能、負荷率、定價權、以及需求增長曲線。智譜漲價 30% 後被搶空,證明的就是定價權。03 被忽略的另一面但筆者也想說一些不那麼樂觀的部分。MiniMax 的招股書裡有一個資料:2025 年前 9 個月,收入同比增長 170% 的同時,淨虧損 5.12 億美元。通俗地說,賣 1 塊賠 10 塊。雖然虧損在縮小,但距離盈虧平衡還很遠。更關鍵的是,這兩家公司的收入結構揭示了一個隱憂。MiniMax 超過 70% 的收入來自海外,其中最大的產品 Talkie(星野)是一款 AI 社交應用——這類產品的使用者粘性和付費轉化率,在全球市場都還沒有被驗證。智譜的 Coding Plan 雖然火爆,但程式設計助手市場的天花板有多高?當 Claude、Gemini、GPT 都在同一個賽道上時,定價權能維持多久?OpenAI 最新一輪融資估值 8500 億美元,背後站著亞馬遜、軟銀、輝達、微軟這樣的戰略投資者——這些投資者投的不僅是財務回報,更是 AI 基礎設施的入場券。智譜和 MiniMax 的股東名單裡雖然也有阿里、騰訊、米哈游,但體量和戰略深度不在同一層級。所以,700 倍 PS 定價的,是 Agent 時代全面到來後的 Token 消耗量。 這是一個正確的方向,但它發生的速度——是明年,還是五年後——會極大地影響這個估值是否能站住腳。還有一個容易被忽略的事實。這波暴漲發生在港股,而港股 AI 類股的一個特殊之處在於:可投標的極度稀缺。想要在港股配置中國 AI 純正標的,選項只有智譜、MiniMax,以及剛上市不久的海致科技。當大量資金湧入一個極窄的賽道時,估值溢價會被急劇放大。這不完全是基本面驅動的,也有資金結構的因素。04Token 經濟學的黎明?回到一開始的問題:這兩家公司貴嗎?如果你用今天的收入去衡量,貴得離譜。但如果你接受一個前提——Token 正在成為一種新的基礎設施級消耗品——那當前的定價邏輯就變得可以討論了。一個值得思考的對比:2000 年,中國移動的使用者才 8000 多萬,簡訊業務剛剛起步,誰也說不清移動通訊的商業模式最終長什麼樣。但到了 2007 年,中國手機使用者突破 5 億,移動網際網路徹底改寫了所有人的生活方式。Token 可能正處在類似的拐點。當模型能力足夠強、Agent 開始大規模部署、每個人背後有幾十個 AI 在不間斷地消耗算力——那時候 Token 的供需關係,會讓今天的價格戰看起來像一個笑話。智譜和 MiniMax 今天的 3000 億港元市值,本質上是市場在為這個未來投下的一張選票。這張選票可能投對了方向,但出價是否合理,恐怕要等 Agent 時代真正到來的那一天才能驗證。不過有一件事是確定的:當一家公司敢漲價 30%,使用者還排著隊搶購的時候,某種新的供需關係已經開始形成了。Token 正在變成新時代的「電」。而我們,都才剛剛開始學會用電。 (極客公園)
重磅,中國 Token 出海首次超越美國
導讀網際網路時代,“流量”是產業繁榮的標尺;大模型時代,這把尺正在被一個更細粒度、更工程化的單位替代:Token(詞元)。當 Token 的日消耗量突破“兆”級關口,它的意義早已超出“計費口徑”。所謂“出海”,也不再侷限於 App 或軟體的跨境擴張,而是一種接近工業品貿易的新形態——智能產能出海:以可計量、可計價、可交付的方式,向全球輸出推理能力。01. Token 海嘯:從“千億”到“數十兆”的工業級躍遷通過OpenRouter 資料圖可以明顯看出全球大模型的 token 用量在 OpenClaw 發佈之後急劇上升,最新的 OpenClaw 每天呼叫量超過 307B,此外 2026 年 2 月份的詞元呼叫量是 2025 年 2 月份的 13 倍。Token 呼叫量前三名全是中國的大模型 MIniMax、KiMi、GLM,中國第一次在生產型 Token 呼叫量上反超美國,這意味著全球 AI 發展進入了一個新的中美博弈期。在過去的一年半里,我們目睹了一場無聲的資料海嘯。關於 Token 增長的“硬資料”,正在勾勒出一條驚人的指數曲線:國家資料局披露:2024 年初,中國日均 Token 消耗量約 1000 億;僅一年半後的 2025 年 6 月,這一數字突破 30 兆(增長 300 倍)。人民日報:截至 2025 年 9 月底,日均消耗突破 40 兆。產業一線:火山引擎公開資料顯示,截至 2025 年 12 月,僅豆包大模型的日均使用量已突破 50 兆。市場側:IDC 報告指出,2025 上半年中國公有雲大模型呼叫量已達 536.7 兆。這意味著什麼?這些數字共同指向一個事實:大模型呼叫已告別“實驗室玩具”階段,正式進入工業級規模。在如此體量下,Token 不再只是模型參數的副產品,它開始外溢,成為算力、能源、工程體系聯動的核心變數。02. 出海新航道:兩條路徑,兩種野心“Token 出海”並非單一模式,而是存在兩條截然不同的經濟路徑:路徑 A:Token-as-a-Service(推理即服務)模式:海外使用者通過 API 直連,Token 在國內或中資海外節點被“生產”出來。出口品:實打實的推理產能。核心約束:這是一場關於延遲、合規、跨境支付與 SLA(服務等級協議)的硬仗。路徑 B:Stack-as-a-Standard(標準即生態)模式:海外開發者下載中國開源模型,進行微調或私有化部署。Token 在海外“生產”,但標準與生態位屬於中國。出口品:權重、工具鏈與工程範式。資料佐證:OpenRouter 的研究顯示,其統計窗口內,中國開源模型(Chinese OSS)的周 Token 份額在 2025 年部分時段接近 30%。洞察:即便不爭論“誰的總消耗量世界第一”,中國模型通過開源生態對全球標準的滲透,正在發生實質性外溢。03. 重新定義成本:為什麼 Token 是“工業品”?Token 的價格不是由單一技術參數決定的,它是一個典型的“工程—資源”耦合問題。我們可以將“單位 Token 的完全成本”抽象為以下公式:Cost≈吞吐×利用率硬體折舊+(能耗×電價×PUE)+規模工程維運+合規成本因此,Token 出海的競爭力不再僅靠模型聰明程度,而是取決於四個工業槓桿:吞吐(Throughput):同樣的卡,如何榨出更高的 tokens/s?(涉及量化、KV cache、投機解碼等技術)。利用率(Utilization):如何削峰填谷,拒絕算力空轉?能效(Energy Efficiency):Token/kWh 將成為 AI 時代的“油耗標準”。工程規模化:將工程師經驗沉澱為平台能力。一句話總結:Token 出海賣的不是“參數”,而是可規模交付的推理能力;而這種能力的背後,是算力、電力與工程體系的綜合國力。04. 趨勢:Agent 化與多模態帶來的“Token 通膨”雖然推理成本在下降,但我們正在迎來結構性的“Token 通膨”。這不是單價變貴,而是單任務消耗量的劇增。有報導指出,Seedance 2.0 生成一條 10 秒視訊,消耗約 35 萬 Token。隨著長上下文、深度推理、工具呼叫(Agent)的普及,計費邏輯將從“對話成本”推向昂貴的“任務成本”。這將進一步支撐 Token 市場的總盤子持續暴漲。05. 產業重塑:未來競爭的七大戰場當 Token 成為跨境可貿易的計量單位,它將如何重塑全球產業版圖?1. 貿易形態升級:從“賣軟體”轉向“賣產能”。產業價值鏈從單純賣 Token,向解決方案、流程重構與治理能力遷移。2. 競爭焦點轉移:從“訓練軍備競賽”轉向“推理工業化”。這更像製造業——拼良率、拼能效、拼折舊。字節跳動被傳佈局推理晶片,正是為了掌控這條供應鏈的成本底線。3. 能源地理學改變:“電力—資料中心—AI”繫結更緊。算力建設從“堆規模”走向“拼利用率”,否則巨額的電力與折舊將吞噬所有利潤。 4. 市場分層不可避免:強監管/敏感行業→本地部署(生態出海)。成本敏感/交付優先→雲端服務(產能出海)。5. 開源即軟實力:金融時報指出中國開源模型下載量佔比上升。這意味著,即使硬體受限,我們仍可通過軟體棧佔據全球標準位。6. 人才結構重排:系統工程能力(編譯最佳化、平行調度、可靠性工程)將與“模型演算法”並列,成為核心資產。7. 合規即成本:版權(如迪士尼對 AI 視訊的警示)、內容安全不再是虛無的口號,而是直接影響跨境交付成本的法律實體。06. 結語:一場關於“供給能力”的長期博弈在日均數十兆 Token 的規模之上,行業競爭已經從單純的“模型能力展示”進入了殘酷的“工業體系對抗”。未來的 12 到 36 個月,我們要關注的指標將不僅僅是 Token 總量,更是 Tokens/kWh(能效)、端到端時延以及單位成本曲線。當 Token 逐漸成為新一代的工業計量單位,所謂“出海”,本質上是一場貿易升級:我們出口的不只是程式碼,而是持續、穩定、高性價比的智能供給能力。 (清新研究)
科普:摩根大通說中國AI將暴漲370倍,到底在說什麼?
最近一條AI資料刷爆全網,中國AI推理Token消耗,5年將增長370倍。沒有難懂術語,用最通俗的話,一次性講明白。一、先搞懂:Token是什麼?可以把Token理解成AI的最小計量單位。你問AI一句話、AI回你一段文字、生成一張圖片、跑一次行業計算,都在消耗Token它就像AI世界的“糧食”,用多少,算多少Token消耗量越大,代表全社會用AI越頻繁、越深入簡單說:Token = AI使用量。二、370倍有多誇張?摩根大通預測:2025年:約10千兆2030年:約3900千兆5年增長:≈370倍這不是小幅度上漲,是指數級爆發。意味著五年後,我們用AI的強度,是今天的幾百倍。三、為什麼會漲這麼快?三個最核心原因:1. AI全面普及:手機、電腦、辦公、工業、政務全場景上線AI2. 從聊天變幹活:AI不再是閒聊工具,開始做設計、寫報告、跑資料、控裝置3. 多模態爆發:文字+圖片+視訊+3D+語音,消耗的Token遠高於純文字對話一句話:AI從玩具,變成生產工具。四、兩個關鍵真相(別被帶偏)1. 報告裡沒有“國企採購”這是市場自行聯想,摩根大通原文只講中國整體AI Token需求,不特指某類企業。2. Token漲≠晶片同比例漲演算法、模型、架構會持續最佳化,同樣的工作,未來會更省算力,不會完全按370倍去買晶片。五、對普通人意味著什麼?未來AI會像水電一樣無處不在幾乎所有工作都會和AI繫結算力、大模型、AI應用,會是未來增長最快的行業這不是遙遠的未來,就是未來5年。 (舟已過)
AI:正在復刻2006年房地產的“黃金十年”
2006年的房地產,是公認的黃金賽道,需求爆發、資本扎堆,房價與投資熱度一路走高,成為拉動經濟、創造財富的核心引擎,開啟了長達十餘年的繁榮周期。如今2026年,AI應用正迎來類似的爆發期,從工業製造、企業辦公到消費終端、民生服務,AI全面滲透各領域,降本增效、提質升級的效果肉眼可見。資料顯示,2025-2030年全球AI市場規模將從2440億美元飆升至8270億美元,復合年增長率高達24%,遠超物聯網和公共雲等熱門領域。再者,技術迭代加速、政策持續加持、資本密集佈局,AI商業化落地與規模化應用全面提速,滲透廣度與增長潛力堪比當年的房地產,正成為新一輪產業升級與經濟增長的核心驅動力,長期發展前景十分廣闊。01技術迭代+政策護航,AI產業迎來全方位賦能AI產業的快速發展,離不開技術突破與政策支援的雙重驅動。全球範圍內,大模型性能持續提升,各主流模型在語言理解、程式碼生成、電腦視覺等核心領域的差距不斷縮小,為廣泛應用奠定了堅實基礎。2025年7月底,AI大模型Token總使用量已達3.41T,相較年初增長近10倍,直觀反映出技術落地的加速態勢。在政策層面,國務院發佈的《關於深入實施“人工智慧+”行動的意見》,明確了“發展——應用——安全——治理”的清晰路徑,規劃了到2027年、2030年和2035年的三階段里程碑目標。從算力統籌、資料創新到開源生態、人才建設,八大基礎支撐為AI產業保駕護航,推動智能經濟核心產業規模快速增長。與此同時,AI產業鏈生態日趨完善。上游的AI晶片、伺服器等算力基礎設施持續升級,中游的通用大模型與行業解決方案不斷創新,下游的網際網路、金融、教育、醫療等應用領域加速滲透,形成了協同發展的良好格局。這種全產業鏈的協同發力,讓AI技術的落地效率大幅提升,為產業爆發提供了充足動力。02多場景落地開花,AI重塑產業價值格局AI技術的價值,最終體現在豐富的應用場景中。目前,AI已在內容創作、行銷推廣、軟體開發、遊戲產業等多個領域實現規模化落地,不僅帶來了效率的革命,更催生了全新的商業模式。在內容創作領域,AI的賦能效果最為顯著。從圖片生成、視訊剪輯到文案撰寫、劇本創作,AI工具讓內容生產的門檻大幅降低。2025年上半年,全球生成式AI應用下載量接近17億次,應用內購買收入高達19億美元,使用者總使用時長達到156億小時。國內市場同樣火爆,AI漫劇成為新風口,2024第四季度到2025第三季度,中國AI漫畫流水增長900%,月新增劇集數增長567%,抖音、快手等平台紛紛推出AI創作工具與流量扶持計畫,推動全民創作時代的到來。行銷領域更是AI應用的核心戰場。AI驅動的智能投放系統能夠精準分析使用者畫像,實現廣告素材的自動化生成與即時最佳化,大幅提升行銷ROI。藍色游標2025年前三季度AI驅動業務收入達24.7億元,Mobvista核心平台Mintegral的AI智能競價系統貢獻了80%以上的收入,易點天下打造“服務+產品”雙輪驅動戰略成效顯著,跨境電商領域市佔率穩步提升同時,深耕智能家居、新消費、短劇、AI產品等高潛力賽道,頭部客戶的LTV海外市場中AI類應用的數字廣告支出也實現翻倍增長,充分證明了AI在行銷領域的商業價值。此外,AI在軟體開發、遊戲研發等領域的應用也成效顯著。82%的開發者使用AI工具編寫程式碼,工作效率提升超120%;遊戲行業中,86.36%的企業在研發環節應用AI技術,實現了內容生成、系統設計等環節的降本增效。AI正全方位重塑各產業的價值創造方式。03平台+企業雙輪驅動,商業化變現路徑清晰AI產業的蓬勃發展,離不開平台型企業與垂直領域龍頭的共同推動,兩者形成的雙輪驅動格局,讓商業化變現路徑愈發清晰。在平台端,抖音、快手、B站等新媒體平台成為AI應用的重要載體。抖音以豆包大模型為核心,將AIGC技術嵌入內容生產、剪輯、發佈、行銷的全流程,推出“AI創作浪潮計畫”扶持創作者;快手可靈AI全球使用者規模突破4500萬,2025年第二季度收入超2.5億元,其文生視訊模型在全球市場佔據30%的份額;B站、小紅書等平台也紛紛上線AI創作工具,推動內容生態的智能化升級。這些平台憑藉龐大的使用者基數與流量優勢,成為AI技術落地的“試驗場”與“放大器”。在企業端,各類市場主體積極擁抱AI,實現了業務增長與效率提升的雙重突破。美圖憑藉AI圖像、視訊、設計等四大模組的佈局,全球VIP會員數突破千萬,生產力工具付費訂閱使用者達180萬。多鄰國通過AI驅動的高端套餐Duolingo Max,2025年第二季度營收同比增長41%,淨利潤增長84%,股價單日飆升32%;Palantir推出的人工智慧平台AIP,推動公司2025年第二季度收入同比增長48%,“40法則”得分高達94%。這些企業的成功案例,印證了AI技術商業化的巨大潛力。同時,AI產品出海成為新的增長點。在圖像、視訊編輯和社交領域,美圖系、字節系應用佔據全球流量入口,國內模型通過與海外平台合作分發,影響力持續擴大,為行業增長開闢了新的空間。04投資建議:聚焦核心賽道,把握AI成長紅利AI產業的爆發式增長,為投資者提供了豐富的投資機會。結合行業發展趨勢與企業表現,建議重點關注以下三大方向:一是內容與流量平台型企業。這類企業憑藉龐大的使用者基礎與完善的生態佈局,在AI應用落地中具備天然優勢。二是AI行銷與商業化落地龍頭。行銷領域是AI技術率先實現規模化變現的賽道,相關企業業績增長確定性強。三是垂直領域AI應用先鋒。在遊戲、教育、設計等垂直領域,AI技術的應用正在催生新的增長機遇。 (格隆)