#TOKEN
超越DeepSeek-V4!羅福莉交出小米最強開源模型,首日適配5家中國國產晶片
免費100兆Token,開源模型新王登場。▲圖片由AI生成智東西4月28日報導,剛剛,小米開源羅福莉帶隊研發的MiMo-V2.5系列模型,採用MIT協議,允許商用推理部署與二次訓練,無需額外授權。▲MiMo-V2.5-Pro在Hugging Face的開源頁面截圖此前,該系列模型於4月23日開啟公測,包括MiMo-V2.5-Pro、MiMo-V2.5兩款模型。模型具備更強Agent能力,支援100萬上下文,且Token效率大幅提升。MiMo-V2.5-Pro的完整基準測試結果今日公佈,小米稱其在GDPVal-AA(Elo)、Claw-Eval(pass^3)等多項測評中超過了最新開放原始碼的DeepSeek-V4-Pro模型,也超過了發佈不久的Kimi K2.6等主流閉源模型,實現總體最佳。▲MiMo-V2.5-Pro的最新測評成績開源首日,MiMo-V2.5-Pro宣佈已完成與阿里平頭哥、亞馬遜雲科技、AMD、百度崑崙芯、燧原科技、沐曦、天數智芯多個晶片廠商的接入適配。MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0適配。與此同時,小米還推出百兆Token創造者激勵計畫,計畫30天內免費發放總計100兆Token權益;推出Agent生態共建計畫,目前已與OpenCode、Hermes Agent、KiloCode等Agent框架廠商展開合作。01. 模型技術細節公佈 測評超越DeepSeek-V4由小米最新公開的模型卡可知,小米迄今為止最強模型MiMo-V2.5-Pro是一款擁有1.02兆(1.02T)個參數的混合專家模型,其中420億(42B)個啟動參數,基於混合注意力架構,相比前代模型在通用智能能力、複雜軟體工程和長時域任務處理方面均實現了顯著提升。MiMo-V2.5-Pro繼承了MiMo-V2-Flash的混合注意力機制和多標記預測(MTP)設計。局部滑動窗口注意力(SWA)和全域注意力(GA)以6:1的比例交錯使用,窗口大小為128個Token,在長上下文情況下,通過可學習的注意力池偏置,將鍵值快取儲存空間減少了近7倍,同時保持了性能。一個輕量級的MTP模組,採用密集前饋神經網路(FFN),原生整合用於訓練和推理,輸出吞吐量大約提升了三倍,並加速了強化學習(RL)的部署。▲MiMo-V2.5-Pro的模型架構及訓練過程該模型預訓練使用27兆(27T)個Token,採用FP8混合精度,原生序列長度為32K,上下文擴展至1M個Token。後訓練遵循MiMo-V2-Flash中引入的三階段範式:1、監督式微調,在精心挑選的資料對上建立基礎的指令跟蹤;2、領域專精訓練,其中不同的教師模型分別通過針對特定領域的強化學習進行最佳化,涵蓋數學、安全、智能工具使用等領域;3、多教師策略蒸餾(MOPD),其中單個學生模型在每位專精教師的Token級指導下,從自身的展開中學習策略,並將所有教師的能力融合到一個統一的模型中。再來看看MiMo-V2.5,這是一個3100億(310B)參數的稀疏MoE模型,擁有150億(15B)啟動參數,在48兆(48T)個Token上進行訓練。它的語言主幹框架繼承了MiMo-V2-Flash的混合滑動窗口注意力機制,並搭載自研預訓練視覺、音訊編碼器,兩類編碼器通過輕量化投影模組完成跨模組融合。▲MiMo-V2.5架構訓練過程分為五個階段:1、基於多樣化語料開展文字預訓練,搭建大語言模型主幹網路;2、進行投影層預熱訓練,實現音視訊、視覺投影器與語言模型的對齊融合;3、依託高品質跨模態資料集,開展大規模多模態預訓練;4、執行監督微調與智能體後訓練,在此過程中將上下文窗口從32K逐步擴容至256K,最終達到100萬Token;5、最後是通過強化學習(RL)與多目標偏好蒸餾(MOPD),進一步強化模型的感知、邏輯推理與智能體執行能力。從小米最新公佈的測評結果來看,MiMo-V2.5在Claw-Eval Text、Terminal-Bench 2.0、SWE-Bench Pro等多項測評中大幅超越了DeepSeek最新發佈的DeepSeek-V4-Flash。▲MiMo-V2.5最新測評情況02. 開源首日,完成阿里平頭哥沐曦 等7家晶片廠商適配小米還公佈了晶片生態與推理框架最新適配情況,MiMo-V2.5-Pro開源首日完成多個晶片廠商的接入適配:阿里平頭哥:基於真武810E及全端自研AI軟體棧實現深度適配。亞馬遜雲科技:基於Trainium2晶片與Neuron SDK+vLLM推理框架完成深度適配,實現開源即全球可用的首日適配。下一代3nm製程Trainium3將進一步釋放模型性能。AMD:依託ROCm開放原始碼軟體棧提供Day-0適配及全面最佳化支援。百度崑崙芯:通過底層算子最佳化與軟硬體協同加速,保障模型穩定高效運行。燧原科技:基於自研馭算TopsRider軟體棧深度最佳化,在燧原L600上完成全量適配。沐曦:基於曦雲C系列及全端自研MXMACA軟體棧,實現Triton語法到沐曦GPU指令集的端到端原生支援。天數智芯:實現Day 0級深度適配。此外,MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0適配。03. 免費發放100兆Token 已與Hermes Agent等合作與此同時,小米還同步推出MiMo Orbit計畫,包含兩部分:“百兆Token創造者激勵計畫”,與面向Agent框架團隊的“Agent生態共建計畫”。在百兆Token創造者激勵計畫方面,小米面向全球AI使用者免費發放Token,30天內發放總計100兆Token權益,贈完即止。該計畫採取申請制,通過者最高獲得Max檔位Token Plan,包含16億Credits,價值659元。活動時間:台北時間2026年4月28日00:00至5月28日00:00。Agent生態共建計畫方面,小米面向全球Agent框架團隊提供專項支援,為框架提供MiMo Token限免支援,同時參與和贊助框架平台的AI Hackathon等共創活動。其目前已與OpenCode、Hermes Agent、KiloCode等Agent框架廠商展開深度合作。04. 結語:多款國產開源模型“亮劍”交鋒近期,大模型行業開源力度持續加碼,模型與國產及國際晶片的“Day 0”適配已從亮點變為剛需,推理效率和部署成本成為下一階段競爭的核心。同時,百億級Token免費激勵與Agent框架生態共建,反映出行業正從“拼參數”轉向“拼應用”。值得關注的是,小米MiMo-V2.5-Pro在多項基準評測中直接超越DeepSeek最新開放原始碼的DeepSeek-V4-Pro模型,可謂與DeepSeek在開源賽道發起“亮劍”交鋒,有望倒逼行業更快降低推理成本、提升Agent真實任務完成率。 (智東西)
DeepSeek又當“價格屠夫”,但這次“屠”的不僅是價格
本文為《Token經濟學》系列第六篇。Token正重塑AI時代的價值坐標,DeepSeek V4預覽版發佈,又一次成為了“價格屠夫”,但是帶來了token定價的新的命題。同樣數量的Token,在不同系統中的實際成本可相差一個數量級,大模型正在走向系統級定價。DeepSeek V4預覽版終於發佈,又一次把大模型的價格打了下來,這很符合DeepSeek的“特性”。V4-Flash定價輸入1元、輸出2元/百萬tokens,快取命中後輸入僅0.2元;V4-Pro定價輸入12元、輸出24元/百萬tokens,快取命中輸入1元,發佈時給出限時75折,截至5月5日。兩款模型均原生支援百萬tokens上下文。這周末,DeepSeek-V4-Pro 繼續開啟限時優惠,把價格打到2.5折,快取命中率的輸入價格再打1折。一位AI工程師半開玩笑地說,“周末過後,DeepSeek-V4-Pro離免費只差0.025元”。目前距離2024年那一輪以DeepSeek V2為起點的價格戰,已經過去了整整兩年。這兩年,大模型的推理成本出現了指數級的下降,在考慮快取命中等因素後的有效成本口徑下,累計降幅甚至達百倍。但今天,把價格打下來的意義比之前更為重要。AI已經切換到以長程複雜任務為主的Agent範式,一次任務背後是幾十次、上百次模型呼叫。在這個行業語境下,DeepSeek V4預覽版的發佈,同時也伴隨著兩個值得劃重點的資訊。一是百萬上下文成為兩款模型原生標配;二是強調了快取價格,折上摺。疊加標準輸入輸出價格壓到了同規格模型的梯度下沿,目標是把Agent完成一次任務的總帳單壓到最有競爭力。圖片由AI生成01 Token已經有了新的價格體系回看2024年的降價,本質上是把大模型從“昂貴實驗”拉進“可用工具”。當時,依靠架構創新帶來的推理效率提升,模型呼叫價格從GPT-4時代每百萬token 10至30美元的區間,快速壓縮到1美元量級。圖:過去兩年token價格指數級下降這是一種典型的“絕對價格下探”:開發者可以低成本呼叫大模型,應用層開始真正被打開。但在那個階段,價格仍然對應“單次呼叫成本”,token被視為統一計價單位,呼叫次數與成本基本線性相關。兩年後的DeepSeek V4,價格結構本身也發生了改變。隨著快取(cache)機制進入主流計費體系,token開始被拆分為“新計算”和“重複計算”兩類成本。在高快取命中率的場景中,同樣的輸入價格可以下降到原來的十分之一甚至更低。價格從一個靜態標價,變成一個與系統設計強相關的變數。圖:token被拆成“新計算”和“重複計算”如果只看標價,V4依然延續了DeepSeek一貫的低價策略。在國內市場,阿里通義、智譜GLM、月之暗面Kimi等同檔模型的定價大致在輸入1—4元、輸出4—12元區間,而V4-Flash輸入1元、輸出2元,處在行業平均價的1/3到1/4。Pro版本12元/24元與旗艦模型接近,但百萬級上下文是默認能力而非加價選項。放到全球範圍,對比更加明顯,價格大致僅為部分競品的十分之一到五十分之一。比如GPT-5.5官網價格為:輸入 5 美元 / 百萬 token,快取輸入(cached input) 0.5 美元 / 百萬 token,輸出 30 美元 / 百萬 token。Claude Opus 4.7延續 Opus 4.6 的價格體系,大致為輸入 5 美元 / 百萬 token,輸出 25 美元 / 百萬 token。雖然海外旗艦模型在能力上限、生態成熟度、token利用率等方面並不完全可比,價格並非唯一維度。但在同一組Agent任務中,呼叫成本的差距會直接影響商業可行性。海外廠商也承受著定價壓力:Sam Altman曾公開承認ChatGPT Pro訂閱處於虧損狀態,Dario Amodei也警告行業存在“過度激進定價”。一定程度上,價格背後系統性包含了算力供給、研發攤銷和市場策略。這也是為什麼這一次的價格優勢更有意義。在2024年,行業解決的是“能不能用”;在今天的Agentic AI範式下,更核心的問題是“能不能規模化運行”。一個Agent任務往往包含幾十到上百次模型呼叫,大量輸入來自system prompt、工具schema和歷史記憶,這些內容高度可復用,也恰恰是成本最容易“膨脹”的部分。DeepSeek V4重點壓縮的,正是這一塊“重複計算”的成本。圖:DeepSeek V4把“成本”變成了一個可以被工程最佳化的變數。左側是能力對齊,右側是成本斷崖。在百萬上下文下,推理算力和快取佔用大幅下降,使得長程任務不再以指數級成本增長。這也是本輪價格戰背後的真正驅動力。從自身產品的具體價格演進來看,這種變化也有跡可循。上一代V3.2的輸入價格為2元(未命中快取)、0.2元(命中快取),輸出3元;而V4-Flash將輸入降至1元,輸出降至2元,最直接的變化是“未命中輸入價格腰斬”。在多輪呼叫的Agent場景中,累計輸入成本往往佔大頭,這一調整的槓桿效應遠大於表面降價。Pro版本輸入12元、輸出24元的定價表面看比Flash貴了一個數量級,但DeepSeek在技術報告中寫道,“Pro版本受高端算力產能約束,預計下半年昇騰950超節點批次上市並部署後,Pro的價格會大幅下調”。可以理解為,Pro現在的價格反映的是供給瓶頸,不是真實成本。兩款模型的定位也很清晰:Flash面向高並行、低延遲的批次任務,Pro承擔複雜Agent流程、長鏈路程式碼生成和深度推理。從技術報告看,DeepSeek 已開始用真實研發任務評估 V4 的 code agent 能力,並在內部評估中將其直接對標Claude系列。02 “價格屠夫”的背後DeepSeek如何做到了把價格打下來?傳統注意力機制處理長文字時,計算量隨序列長度的平方增長,比如1M tokens的計算量是128K的64倍。這就是過去“百萬上下文”很難真正商用的原因,KV cache的視訊記憶體佔用會隨序列長度線性堆疊,跑滿1M要麼砍掉並行量、要麼加幾倍機器,帳面上完全不划算。這也是為什麼海外廠商普遍採取“默認短窗口、長窗口加價”的策略,Anthropic甚至直接把200K以上單獨做成一檔收費,價格翻倍。圖:DeepSeek V4 的CSA(壓縮稀疏注意力)通過先壓縮KV快取、再用Top-k選擇關鍵上下文,只計算最重要的資訊,從而在長文字場景下大幅降低算力與快取開銷。簡單理解V4的解法,是把“壓縮”和“稀疏”疊加。先把每m個token的KV快取壓成一個壓縮條目(CSA壓縮率4,HCA壓縮率128),再讓每個query只關注其中top-k個關鍵條目做注意力計算。前一步可以降視訊記憶體,後一步降算力,同時攻克兩個瓶頸。圖:DeepSeek V4 的HCA(重壓縮注意力)通過將更長序列的KV快取極限壓縮為少量表示,在保留局部窗口資訊的同時進一步減少計算與儲存開銷,是支撐百萬級上下文成本下降的關鍵路徑。技術報告顯示:1M上下文下,V4-Pro的單token推理FLOPs僅為V3.2的27%,KV cache佔用僅為10%;V4-Flash更激進,FLOPs為V3.2的10%,KV cache為7%。再疊加FP4量化感知訓練、Muon最佳化器、自研mega-kernel MegaMoE等基礎設施層最佳化,V4把成本從訓練到推理整條鏈路都最佳化壓縮了一遍。低價是架構成本的自然結果。國內大模型公司的一位核心成員告訴騰訊科技:“國內大模型的API定價(包括他們自己),主要還是看成本能力。還沒有那家不計成本地‘卷價格’。所以,從技術底層做到的成本優勢就極為重要。”阿里雲智能CTO周靖人也曾強調:“每一次降價都是一個非常嚴肅的過程,要從整個產業發展、開發者、企業使用者的反饋等各方面進行權衡,不是價格戰。”03 為什麼這次“降價”更重要?從需求端來看,在當下系統性把“價格打下來”更為迫切。Deloitte最新一份Token Economics報告裡舉了AT&T的例子:這家公司在引入Agent系統後,單日Token消耗從80億漲到了270億。Stevens理工的一份分析指出,Agent系統在多輪對話中存在“二次方Token增長”陷阱:到第10輪時,單次呼叫的Token量可能達到第1輪的7倍。模型價格決定一個Agent能不能在商業上跑通。CIO雜誌在三周前的報導裡引用了AI解決方案公司Addo AI的CEO Ayesha Khanna的判斷“如果你跑一個持續性Agent對接前沿模型API,高Token消耗、長上下文、多步推理、重輸出,經濟性會迅速惡化。某些情況下,單任務成本會比讓一個人做這件事還貴。”這是Agent商業化目前最現實的瓶頸,技術能跑通,帳算不過來。回顧V4這次的幾個動作,幾乎全部對準行業這個瓶頸:百萬上下文做成默認能力,讓Agent不必再為長上下文支付溢價;快取命中輸入價壓到行業最低水位,匹配Agent場景裡反覆使用相同系統提示的特點。技術報告裡還特別提到,V4在工具呼叫場景下完整保留全部reasoning content(V3.2會在每個新使用者消息開始時丟棄),這也是為了適配Agent的多輪呼叫需求。04 V4能把整個Agentic AI的成本線拉低嗎?最終,還有一個重要問題,V4能不能把整個Agentic AI行業的成本線壓下去?這次可能情況也複雜得多。首先看其他廠商是否跟進。V4這一輪如果引發類似的同步降價,行業整體成本曲線才會真正下移。但這一次如上文分析,模型的價格更由成本結構決定,模型廠商的毛利率短期內沒有壓縮空間,跟進的空間比較有限。二是高端算力的供給。也如DeepSeek在技術報告中所說,V4-Pro目前的服務吞吐有限。Pro的低價能不能穩定供給,取決於昇騰950超節點等國產算力下半年的批次部署進度,以及DeepSeek在跨硬體平台上的工程化進展。技術報告第3.1節明確寫道,DeepSeek在輝達GPU和華為昇騰NPU兩個平台上均驗證了細粒度專家平行方案,這也是DeepSeek首次將昇騰與輝達並列寫入硬體驗證清單,也是嘗試把推理路徑從單一硬體依賴中解耦出來。這件事如果真的被驗證有效,長期對國內大模型產業的價值更大。三是Agent場景的Token結構能否被進一步最佳化。當下的Agent很消耗token,其中相當一部分Token浪費來源於Agent架構本身。在模型降價之外,Agent本身怎麼用Token又是另一回事。即便V4把單價壓到了地板,糟糕的Agent設計還是有可能會讓帳單失控。這也是當下大熱的Harness系統的意義。Deepseek V4預覽版確實是在價目表上把價格打了下來,把百萬上下文可以做成默認能力,輸出價格可以做到一美元以下/百萬tokens量級,並且這件事是有架構基礎、不依賴補貼的。但是這一次,全行業把成本打下來並不是那麼簡單,面對了一個更複雜的系統性命題。 (騰訊科技)
深圳1000億新貴:投資人賺了500倍,騰訊為大贏家
創投圈又一筆超級回報誕生。這要從4個月前說起——“Token第一股”迅策科技登陸港交所,但彼時股價起伏不定。沒想到短短百餘天後,公司市值竟一舉突破1000億港元,上市以來股價最新累計上漲高達500%。乍聽起來有些陌生,迅策背後站著一對父子——劉呈喜在2016年出資創立公司,卻由其子劉志堅一手帶隊,歷經十年站上IPO敲鐘舞台。一路走來,迅策科技身後的投資人隊伍浩浩蕩蕩,如今市值已較A輪估值翻了500余倍。這當中,第一大機構股東騰訊無疑是最大贏家,一筆投資締造超50億浮盈;知名PE機構KKR回報40多億;其他早期投資方,動輒帳面回報超百倍。如此盛況,令人驚訝。01 深圳新貴,Token第一股市值千億這一切要追溯到十年前。時間回到2016年4月,劉呈喜在深圳南山正式創立迅策科技。行事低調,他在公眾視野中鮮少露面,就連招股書中也沒有提及個人簡歷。雖然劉呈喜身為公司最大股東,但並未擔任任何職務,而是將公司交給了其子劉志堅一手打理。現年46歲的劉志堅,2004年本科畢業於清華大學電子科學與技術專業,此後又來到香港科技大學,繼續攻讀電機及電子工程碩士學位。畢業後,劉志堅進入蘇格蘭皇家銀行工作,從一名實習生做到公司董事。2012年9月,他加入國開國際投資有限公司,擔任執行董事一職。直到2016年,劉志堅開始成為迅策科技的掌舵者,出任董事會主席兼CEO。同時,他還邀請了一位清華校友耿大為加盟迅策,由後者任職公司總經理。創立之初,迅策科技從資產管理行業起步,在成立次年推出即時資料分析解決方案XOne,提供訂單執行及投資組合監控服務;後面相繼發佈了即時資料基礎設施解決方案Done、VOne。2021年至2022年,迅策科技又接連推出了四款資料分析解決方案Pone、Tone、Cone、Rone,分別提供投資組合監控、估值、風險管理及合規監管服務。招股書顯示,按2024年收入計,迅策科技於中國資產管理行業的即時資料基礎設施及分析市場中排名首位,於中國即時資料基礎設施及分析市場排名第四。目睹AI浪潮席捲,迅策科技逐步向AI Agent服務商轉型。同時,公司開始採用Token付費模式,建構出一個“單次呼叫價格×token呼叫次數×模組應用數”的定價體系,即客戶在使用其AI資料服務時,按模型推理過程中實際消耗的Token數量進行計費。由此,迅策科技成為港交所“Token第一股”。其實,迅策科技的IPO之路一波三折。2024年,公司曾在3月和9月兩次向港交所遞表但均告失效;時隔一年第三次遞交上市申請,終於在2025年12月成功登陸港交所,沒想到開啟一場暴漲之路。02 騰訊為大贏家,A輪投資人回報500倍其實迅策科技在港股的開局並不美妙。在上市前一日的暗盤交易中,迅策科技股價較48港元發行價一度大跌超35%,與當日其它幾隻新股形成鮮明對比。儘管上市首日開盤後,股價有所回升,但最終收盤僅微漲1.04%,首日市值也定格在156億港元。此後,迅策科技股價時常在60港元上下徘徊,二級市場的質疑聲不絕於耳。然而很快,轉折點出現了。大洋彼岸橫空出世的OpenClaw,不僅點燃一場AI狂歡,更是引爆了“龍蝦三兄弟”的股價——迅策、MiniMax、智譜,三家企業憑藉著OpenClaw概念,紛紛沖上市值高峰。吃到這波紅利的迅策科技,市值先是在3月份站上500億港元,後一舉突破1100億港元,此時距離其IPO敲鑼僅僅過去100天。以4月24日收盤價計算,迅策科技股價自上市以來較發行價累計漲幅高達500%,市值在1000億港元上下浮動。如此大漲一幕,也牽動著迅策科技身後投資人的心情。梳理過往,迅策科技早早便進入到一級市場投資人的視野裡,尤其在2017年迎來了A輪融資。當年7月,雲鋒基金旗下雲鋒新呈、深圳賽達仁、北京創新工場、無錫海盈佳、中南荷多、星羅景佑、南昌海創勝、珠海誠昊共同完成7600萬元投資,彼時投前估值僅有1.5億元。隨後在2019年4月,迅策科技完成A+輪融資,其中無錫海盈佳及中南荷多投資5500萬元;高盛旗下GSPSI認購新增註冊資本281.24萬元,總代價為3374.87萬元。本輪投後估值達到約6.9億元。很快,騰訊也出手了——2020年6月,迅策科技獲得2.11億元B輪融資,投資方包括PAC資本、大灣區基金、中山火炬、深圳騰訊、羽信資本、深圳眾投及雲鋒麒泰,此時迅策科技估值已經翻倍來到12億元。不到一年,迅策科技又在2021年5月完成總規模約6.54億元C輪融資,其中老股東騰訊、羽信資本再度加碼,新進投資方包括時代百富、陽光家族投資、浦發銀行、廣州由山、CPE源峰、合力投資、粵財創投、北京中關村、北京歌華、通瑞長盈及泰康人壽等。緊隨其後,上海域愷出資6400萬元成為C+輪投資方。2022年4月,迅策科技又完成7.98億元D輪融資,投資方包括KKR、天津熙華、中金浦成、金浦投資、羽信資本、橫店資本和高盛。次年11月,洪泰基金又在交叉輪融資中出資2.2億元,迅策科技IPO前估值也達到62.2億元。至此,迅策科技市值已較A輪投前估值漲了超530倍。回顧這場長達近十年的陪跑,有人提前遺憾離場,留下的人則等到了時間的餽贈。據招股書披露,創新工場、南昌海創勝、珠海誠昊和中山火炬在IPO前已完成退出。而騰訊身為第一大機構股東,在IPO後仍持股7.02%,對應市值約57億元人民幣,以此計算浮盈超過50億元;KKR持股市值則約為47億元,浮盈也已超過40億元。此外,其他早期投資方也大都斬獲豐厚回報,其中雲鋒基金在IPO前累計投資約4300萬元,以此計算回報約為100倍;A輪投資方深圳賽達仁則以500萬元投資款持股0.76%,回報高達120倍……當然,贏家還是迅策科技創始人劉呈喜,他在IPO後仍控制迅策科技26.84%股權,持股市值高達近250億港元。不過,港股沒有解禁落袋的回報都可能只是鏡中水月,經歷泡沫洗禮後的市值才是真正實力。03 AI造富時代此情此景,正是“Token經濟學”最生動的寫照。首先我們先要搞清楚什麼是Token?作為模型處理資訊的最小基礎單元,單個漢字、詞語、標點均可視為一個Token,小到一次AI提問、大到企業級模型訓練,都以其完成結算。國家資料局資料顯示:到今年3月,中國日均Token的呼叫量,已經突破140兆,相比2024年初的1000億增長了1400倍;相比2025年底的100兆,三個月時間增長了40%多。開年AI智能體的爆紅,直接成為Token指數級增長的催化劑,因為每一次的任務規劃、工具呼叫等互動都大幅增加了Token消耗。而Token已不單單是一個計數單位,其消耗量越大,意味著AI被使用得越頻繁,商業化程度越高。換言之,AI時代的底層敘事邏輯已悄然改變。誠如在今年3月輝達GTC大會上,黃仁勳所強調,在這個全新的AI時代,Token就是新的基礎貨幣,生成Token的成本與效率直接決定了科技企業的營收與生死。他甚至提出,“在未來,我們公司的每位工程師都需要一個年度Token預算。他們的基礎年薪可能是幾十萬美元,我會在此基礎上再拿出大約一半的金額作為Token額度給他們,讓他們實現10x的效率提升。”前不久,官方公佈Token的中文譯名——詞元,並明確其作為智能時代的價值錨點,是連接技術供給與商業需求的“結算單位”。這意味著Token從技術名詞轉變為經濟要素,具備了標準化的計量屬性。如果說工業時代的“硬通貨”是千瓦時(電量),網際網路時代的“硬通貨”是GB(手機流量),那麼AI時代的“硬通貨”就是Token。說到底,這背後仍是一場不容有失的AI時代之爭。最近我們看到太多這樣的盛況:港股上智譜市值4000億、MiniMax最高也破4000億;A股則是“易中天”為代表,中際旭創本周市值一度破10000億,大普微IPO首日同樣破1000億。正所謂無AI不性感,這是前所未有的財富時代。 (華爾街見聞)
深圳千億新貴:投資人賺了500倍
5個月漲500%。創投圈又一筆超級回報誕生。這要從4個月前說起——“Token第一股”迅策科技登陸港交所,但彼時股價起伏不定。沒想到短短百餘天後,公司市值竟一舉突破1000億港元,上市以來股價最新累計上漲高達500%。乍聽起來有些陌生,迅策背後站著一對父子——劉呈喜在2016年出資創立公司,卻由其子劉志堅一手帶隊,歷經十年站上IPO敲鐘舞台。一路走來,迅策科技身後的投資人隊伍浩浩蕩蕩,如今市值已較A輪估值翻了500余倍。這當中,第一大機構股東騰訊無疑是最大贏家,一筆投資締造超50億浮盈;知名PE機構KKR回報40多億;其他早期投資方,動輒帳面回報超百倍。如此盛況,令人驚訝。深圳新貴Token第一股市值千億這一切要追溯到十年前。時間回到2016年4月,劉呈喜在深圳南山正式創立迅策科技。行事低調,他在公眾視野中鮮少露面,就連招股書中也沒有提及個人簡歷。雖然劉呈喜身為公司最大股東,但並未擔任任何職務,而是將公司交給了其子劉志堅一手打理。現年46歲的劉志堅,2004年本科畢業於清華大學電子科學與技術專業,此後又來到香港科技大學,繼續攻讀電機及電子工程碩士學位。畢業後,劉志堅進入蘇格蘭皇家銀行工作,從一名實習生做到公司董事。2012年9月,他加入國開國際投資有限公司,擔任執行董事一職。直到2016年,劉志堅開始成為迅策科技的掌舵者,出任董事會主席兼CEO。同時,他還邀請了一位清華校友耿大為加盟迅策,由後者任職公司總經理。創立之初,迅策科技從資產管理行業起步,在成立次年推出即時資料分析解決方案XOne,提供訂單執行及投資組合監控服務;後面相繼發佈了即時資料基礎設施解決方案Done、VOne。2021年至2022年,迅策科技又接連推出了四款資料分析解決方案Pone、Tone、Cone、Rone,分別提供投資組合監控、估值、風險管理及合規監管服務。招股書顯示,按2024年收入計,迅策科技於中國資產管理行業的即時資料基礎設施及分析市場中排名首位,於中國即時資料基礎設施及分析市場排名第四。目睹AI浪潮席捲,迅策科技逐步向AI Agent服務商轉型。同時,公司開始採用Token付費模式,建構出一個“單次呼叫價格×token呼叫次數×模組應用數”的定價體系,即客戶在使用其AI資料服務時,按模型推理過程中實際消耗的Token數量進行計費。由此,迅策科技成為港交所“Token第一股”。其實,迅策科技的IPO之路一波三折。2024年,公司曾在3月和9月兩次向港交所遞表但均告失效;時隔一年第三次遞交上市申請,終於在2025年12月成功登陸港交所,沒想到開啟一場暴漲之路。騰訊為大贏家A輪投資人回報500倍其實迅策科技在港股的開局並不美妙。在上市前一日的暗盤交易中,迅策科技股價較48港元發行價一度大跌超35%,與當日其它幾隻新股形成鮮明對比。儘管上市首日開盤後,股價有所回升,但最終收盤僅微漲1.04%,首日市值也定格在156億港元。此後,迅策科技股價時常在60港元上下徘徊,二級市場的質疑聲不絕於耳。然而很快,轉折點出現了。大洋彼岸橫空出世的OpenClaw,不僅點燃一場AI狂歡,更是引爆了“龍蝦三兄弟”的股價——迅策、MiniMax、智譜,三家企業憑藉著OpenClaw概念,紛紛沖上市值高峰。吃到這波紅利的迅策科技,市值先是在3月份站上500億港元,後一舉突破1100億港元,此時距離其IPO敲鑼僅僅過去100天。以4月24日收盤價計算,迅策科技股價自上市以來較發行價累計漲幅高達500%,市值在1000億港元上下浮動。如此大漲一幕,也牽動著迅策科技身後投資人的心情。梳理過往,迅策科技早早便進入到一級市場投資人的視野裡,尤其在2017年迎來了A輪融資。當年7月,雲鋒基金旗下雲鋒新呈、深圳賽達仁、北京創新工場、無錫海盈佳、中南荷多、星羅景佑、南昌海創勝、珠海誠昊共同完成7600萬元投資,彼時投前估值僅有1.5億元。隨後在2019年4月,迅策科技完成A+輪融資,其中無錫海盈佳及中南荷多投資5500萬元;高盛旗下GSPSI認購新增註冊資本281.24萬元,總代價為3374.87萬元。本輪投後估值達到約6.9億元。很快,騰訊也出手了——2020年6月,迅策科技獲得2.11億元B輪融資,投資方包括PAC資本、大灣區基金、中山火炬、深圳騰訊、羽信資本、深圳眾投及雲鋒麒泰,此時迅策科技估值已經翻倍來到12億元。不到一年,迅策科技又在2021年5月完成總規模約6.54億元C輪融資,其中老股東騰訊、羽信資本再度加碼,新進投資方包括時代百富、陽光家族投資、浦發銀行、廣州由山、CPE源峰、合力投資、粵財創投、北京中關村、北京歌華、通瑞長盈及泰康人壽等。緊隨其後,上海域愷出資6400萬元成為C+輪投資方。2022年4月,迅策科技又完成7.98億元D輪融資,投資方包括KKR、天津熙華、中金浦成、金浦投資、羽信資本、橫店資本和高盛。次年11月,洪泰基金又在交叉輪融資中出資2.2億元,迅策科技IPO前估值也達到62.2億元。至此,迅策科技市值已較A輪投前估值漲了超530倍。回顧這場長達近十年的陪跑,有人提前遺憾離場,留下的人則等到了時間的餽贈。據招股書披露,創新工場、南昌海創勝、珠海誠昊和中山火炬在IPO前已完成退出。而騰訊身為第一大機構股東,在IPO後仍持股7.02%,對應市值約57億元人民幣,以此計算浮盈超過50億元;KKR持股市值則約為47億元,浮盈也已超過40億元。此外,其他早期投資方也大都斬獲豐厚回報,其中雲鋒基金在IPO前累計投資約4300萬元,以此計算回報約為100倍;A輪投資方深圳賽達仁則以500萬元投資款持股0.76%,回報高達120倍……當然,贏家還是迅策科技創始人劉呈喜,他在IPO後仍控制迅策科技26.84%股權,持股市值高達近250億港元。不過,港股沒有解禁落袋的回報都可能只是鏡中水月,經歷泡沫洗禮後的市值才是真正實力。AI造富時代此情此景,正是“Token經濟學”最生動的寫照。首先我們先要搞清楚什麼是Token?作為模型處理資訊的最小基礎單元,單個漢字、詞語、標點均可視為一個Token,小到一次AI提問、大到企業級模型訓練,都以其完成結算。國家資料局資料顯示:到今年3月,中國日均Token的呼叫量,已經突破140兆,相比2024年初的1000億增長了1400倍;相比2025年底的100兆,三個月時間增長了40%多。開年AI智能體的爆紅,直接成為Token指數級增長的催化劑,因為每一次的任務規劃、工具呼叫等互動都大幅增加了Token消耗。而Token已不單單是一個計數單位,其消耗量越大,意味著AI被使用得越頻繁,商業化程度越高。換言之,AI時代的底層敘事邏輯已悄然改變。誠如在今年3月輝達GTC大會上,黃仁勳所強調,在這個全新的AI時代,Token就是新的基礎貨幣,生成Token的成本與效率直接決定了科技企業的營收與生死。他甚至提出,“在未來,我們公司的每位工程師都需要一個年度Token預算。他們的基礎年薪可能是幾十萬美元,我會在此基礎上再拿出大約一半的金額作為Token額度給他們,讓他們實現10x的效率提升。”前不久,官方公佈Token的中文譯名——詞元,並明確其作為智能時代的價值錨點,是連接技術供給與商業需求的“結算單位”。這意味著Token從技術名詞轉變為經濟要素,具備了標準化的計量屬性。如果說工業時代的“硬通貨”是千瓦時(電量),網際網路時代的“硬通貨”是GB(手機流量),那麼AI時代的“硬通貨”就是Token。說到底,這背後仍是一場不容有失的AI時代之爭。最近我們看到太多這樣的盛況:港股上智譜市值4000億、MiniMax最高也破4000億;A股則是“易中天”為代表,中際旭創本周市值一度破10000億,大普微IPO首日同樣破1000億。正所謂無AI不性感,這是前所未有的財富時代。 (投資界)
梁文鋒把token價格打下來了!DeepSeek V4暴降75%,百萬token只要兩毛五
DeepSeek-V4滿血版性價比無敵了。智東西4月26日報導,昨晚,DeepSeek官網更新API文件,宣佈DeepSeek-V4-Pro降價,開啟2.5折限時優惠。根據DeepSeek官網,調價後,DeepSeek-V4-Pro每百萬Tokens輸入價格(快取命中)為0.25元,輸入價格(快取未命中)為3元,輸出價格為6元。此次優惠活動將持續至5月5日23點59分。相比幾家國內大模型企業的API價格,DeepSeek的價格仍有一定優勢,價格對比如下:DeepSeek發佈當日,對國內大模型企業的股價造成衝擊,智譜和MiniMax均跌超9%。截至4月24日港股收盤,智譜股價跌9.05%,至每股935港元(約合人民幣815.78元),是指為4169億港元(約合人民幣3637.41億港元);MiniMax股價跌9.44%,至每股777.5港元(約合人民幣678.36元),是指為2439億港元(約合人民幣2128億港元)。這個周末,DeepSeek的產業影響力還在蔓延。截至今日,據智東西不完全統計,已經有華為昇騰、寒武紀、海光資訊、摩爾線程、崑崙芯、平頭哥真武、沐曦股份、天數智芯、燧原科技、壁仞科技、雲天勵飛、清微智能等12家國產晶片企業以及輝達適配DeepSeek-V4模型。華為雲、騰訊雲、阿里雲、百度智能雲、天翼雲、京東雲、聯通雲、移動雲等8家雲巨頭,PPIO派歐雲、超算網際網路、優刻得等3家獨立雲及智算企業,寧暢、長江計算、百信、崑崙技術、新華三等5家伺服器企業均已適配或上架DeepSeek-V4模型服務。 (智東西)
肖風香港演講:未來所有商業機構都將變成“Token 工廠”
嘉賓 |肖風,萬向區塊鏈董事長、HashKey Croup 董事長兼 CEO來源 |2026 香港 Web3 嘉年華TL;DR三代幣模型:HashKey 提出的股權代幣、功能型代幣與 NFT 代幣經濟激勵框架,已在集團內部全面實踐,為 2.0 版本奠基。智能體經濟創新路徑:AI Token(生產資料)+ 區塊鏈 Token + ZK/全同態加密隱私計算三者疊加,實現無需信任、無需許可的顛覆式商業模式。Token 工廠模式:商業機構將資料 Token 化,通過區塊鏈特性全球開放呼叫,即時微支付,徹底打破線下談判與地域限制。隱私計算商用突破:全同態加密晶片下半年達 1000 筆/秒性能,未來 3–5 年公鏈可滿足最高合規要求,推動私有鏈/聯盟鏈向公鏈全面回歸。原生數位資產與新金融體系:AI 智能體經濟下將湧現全新原生數位資產,需要專為機器設計的可程式設計貨幣、支付與資本市場體系,商業成本大幅下降。《代幣經濟學白皮書》與三代幣模型各位嘉賓,大家下午好!今天下午是有關 RWA 的主題論壇,首先開場會發佈 2026 年《代幣經濟學白皮書》。如果回顧一下,2023 年 HashKey 開始發佈《代幣經濟學白皮書》,在 2024 年白皮書上特別提出過“三代幣模型”,即股權代幣、功能型代幣、NFT 等非同質化代幣這三個代幣的經濟模型。HashKey 集團本身就在踐行“三代幣模型”。我們有自己的功能型代幣,當然在某些活動場合裡也有 NFT 發售,同時 HashKey 集團是有股權的,其股權在港交所 IPO 上市的權益架構。我們發現在過去十多年的時間裡,對於最基礎的基礎協議而言,一層代幣也許就已經足夠了。但是,當面嚮應用、面向客戶、面向 B 端和 C 端使用者時,僅僅只有一層代幣,比如只有功能型代幣,並不能建立健全、完善、有效的經濟激勵機制。功能型代幣是面向社區的激勵機制,股權代幣是面向創業者團隊及股東的激勵機制,這是我們在《代幣經濟學白皮書》1.0 版本中的內容。邁向 3.0 版本:智能體經濟模式創新現在進入到 3.0 版本,我們聚焦於 AI Agent 所帶來的智能體經濟如何與 Crypto、Blockchain 結合。所以,我今天的開場演講題目是:智能體經濟模式創新 — — AI 的 Token、區塊鏈的 Token 和以 ZK、全同態加密等隱私計算技術結合在一起,可能帶來的智能體經濟模式上的創新。區塊鏈技術的商業特性與隱私挑戰回顧一下區塊鏈技術從商業創新角度來看,主要特性在於兩點:第一,區塊鏈網路是無需信任的網路,也就是說任何人不需要事先 KYC、簽署合同,任何人都是公開開放的網路,無需信任、無需許可是區塊鏈原生商業活動最主要的技術特點。但是,僅僅有這樣一個技術特點顯然不夠,區塊鏈的另一個特點是公開透明。我們很難設想銀行或其他對隱私保護、對合規有非常高要求的金融機構,如果要把他們整體的業務流程全部上鏈的話,會面臨一個巨大的問題,即“資料裸奔”。“資料裸奔”是銀行及其他金融機構,包括對隱私保護有非常高要求的醫療資料,不大可能直接在數字原生的區塊鏈上運行的。但是,到今天為止,AI 確實帶來了巨大的經濟創造活力,尤其是 AI 從大模型走到 AI Agent 之後,大家現在談論的都是 AI 智能體經濟如何在未來 10 倍以上地釋放商業價值。但遇到的問題是資料透明,在資料透明之下,AI 智能體經濟顯然存在巨大缺陷,而要解決這一缺陷必須依靠隱私計算技術。區塊鏈發展歷程:從公鏈到聯盟鏈再到回歸回顧一下區塊鏈技術的發展過程,最早是 2009 年比特幣區塊鏈上線以來,將近 16 年的發展已經證明了區塊鏈技術的巨大商業價值和經濟價值。但是,以比特幣為代表的區塊鏈技術確實具有公開透明的技術特性,所以在 2015 年時,傳統銀行和各國政府監管部門開始提出“聯盟鏈/許可鏈”概念。聯盟鏈和許可鏈正是因為公鏈資料公開透明,使得很多合規業務無法在分佈式帳本上、在公鏈上運行。但是,聯盟鏈這種許可鏈技術的出現,雖然隱私保護得到了一定程度上的緩解 — — 因為聯盟鏈上只有被許可的人才能成為區塊鏈的節點,並且互相之間只能在被許可的範圍內瞭解各自的資訊、看到各自的資料 — — 但它也有巨大缺陷。過去十年時間裡,隨著聯盟鏈概念的提出,我們看到了兩個非常大的聯盟鏈組織,一個是全球銀行之間的 R3,一個是 IBM 的 Hyperledger 聯盟鏈組織。最後發現,十年時間過去了,他們並沒有做出什麼有商業前景的應用。於是當時出現了一種看法:聯盟鏈也許不是區塊鏈,在當時的語境下確實如此。但現在,隨著 Tokenization 的出現,隨著傳統金融資產代幣化的出現,聯盟鏈開始回歸。我們幾乎可以瞭解到,全球主要銀行都已經運行了自己內部的一條許可鏈。只是銀行內部運行的許可鏈可能只是單一節點,只是銀行給自己行內確認區塊鏈的運行,這種單一節點的許可鏈被稱為“私有鏈”。為什麼私有鏈能夠回歸呢?一家全球著名的銀行為自己的客戶提供區塊鏈的代幣化服務,比如存款代幣化,它不需要解決信任的問題,不需要第三方作為區塊鏈節點來背書信任,因為客戶已經信任這家銀行,已經是其客戶,只是在銀行的帳戶體系內用代幣化完成紐約到香港的匯款,跨境匯款只需 2 分鐘。如果沒有存款代幣化,這樣的匯款可能需要 2 天時間,所以私有鏈首先復甦。但私有鏈復甦也存在問題,當兩個銀行的客戶跨行進行跨境匯兌時,仍然需要私有鏈之上的其他區塊鏈,於是聯盟鏈正在被探討當中。我們知道 SWIFT 聯合全球最主要的 9 家銀行正在探討如何用區塊鏈技術、存款代幣化的工具來解決跨行跨境資金的匯兌,目前還在探討中,但我們已經看到聯盟鏈技術又重新回歸了,首先是以單一節點的私有鏈方式回歸。隱私計算技術的突破與三技術融合如果涉及到跨行,仍然有一個巨大問題,就是你能允許你的合作夥伴看到多少銀行內部的資料?現在有一個新的技術開始出現,即隱私計算、零知識證明、全同態加密 — — 這些技術在隱私保護之後同樣還能進行計算,並且計算結果與明文時的計算結果完全一致。這種新技術早就存在。我記得 2016 年以太坊 Devcon 在上海舉辦時,就有許多演講者提到了零知識證明、形式化驗證等隱私計算技術,但至今沒有看到廣泛應用,因為性能不夠,在商業應用的成本、時間、效率和成本上,都不足以支援商業應用。但現在我瞭解的情況是,全同態加密的晶片可能在今年下半年就能推出,能達到每秒大概 1000 筆的性能,這顯然已經可以滿足一部分商業應用場景,因為有些場景並不需要即時得到計算結果,你可能可以等 10 分鐘、半小時甚至一小時。全同態加密之下,區塊鏈 Token + AI Token + 零知識證明和全同態加密的隱私計算技術,三者融合在一起,才可能真正在智能體經濟方面的商業模式上做出完全顛覆式的創新,必須把三個技術疊加在一起才能夠出現這種顛覆式創新。同時,如果我們設想零知識證明和全同態加密演算法在商業上的效率、性能、成本都已經足夠支援商用,那麼區塊鏈技術可能又會出現一次回歸。那時可能真的不需要私有鏈,不需要聯盟鏈,所有的資料加密之後都上到公鏈上去,即使在公鏈上運行隱私保護也足夠滿足目前全球最高的合規要求,這也就是未來 3 年或 5 年會發生的事情。昨天以太坊創始人 Vitalik Buterin 也在這個舞台上講到過以太坊未來五年的發展路徑,他提到以太坊並不需要競爭誰是最快的鏈,只要守住去中心化和安全性。他不需要做任何性能上的提升。因為區塊鏈的“不可能三角”:去中心化、安全性、性能。以太坊解決去中心化和安全性,性能的問題交給別人來解決 — — 交給硬體加速、演算法最佳化,以及 L2、L3 根據不同應用場景決定自己的共識機制。Token 工廠模式:醫療資料案例與全球應用舉一個例子來說明 AI Token、區塊鏈 Token 加上零知識證明和全同態加密的密碼學隱私保護如何創造出新的商業模式。比如一家醫院,其醫療資料非常有價值,但同時對隱私保護有特別嚴格的要求。根據現在的 Token 經濟學模型,我們設想未來所有的商業機構都會是“Token 工廠”。如果這些醫療資料有足夠好的零知識證明或全同態加密的隱私計算技術加持,那麼任何一家醫院就可以把醫療資料變成 Token,成為 Token 工廠。任何人都可以呼叫其資料算出需要的某種技術特徵,但同時不可能掌握任何一個個人需要隱私保護的資料。三個技術加持在一起,才有可能是對傳統商業模式的顛覆,才有可能是智能體經濟的終極形態。如果僅僅只有 AI Token + 隱私計算技術,當然這個商業也是成立的,一家醫院也可以在沒有區塊鏈 Token 加持下創新商業模式,但其商業範疇不可能擴大到全球。我們知道,所有數位化技術基本上都是全球服務,數位化產品和數位化服務歷來都是全球化的。如果沒有區塊鏈加持,即使一家醫院的資料使用了同態加密,任何一個想要使用醫院資料的人都需要線下找到那家醫院,跟他談判、簽協議,通過銀行付款,這不是 Token 工廠的做法。Token 工廠的做法應該是:用區塊鏈的無需許可、無需信任的技術特性,把這家醫院的所有資料都變成 Token,變成 AI Token,以無需許可、無需信任的方式開放給全球使用者。任何有需求的人都可以像我們現在使用比特幣網路、以太坊網路那樣,隨時地 7×24 小時、無需簽署協議也無需 KYC onboarding 的情況下呼叫資料。你呼叫資料就消耗 Token,從而付費給這家醫院,這家醫院就變成了 Token 工廠。這三者結合在一起才是智能體經濟的終局表現方案和終局結果。如果任何一個個人的所有隱私資料 — — 過往多少年的體檢資料、醫療資料 — — 在加密之後,就可以用無需許可、無需信任的商業模式,在網上、鏈上向全球保險公司發出需求。我的資料經過加密都在這裡,你們有你們的精算模型,可以到我這裡,在同態加密之下用你們的精算模型計算我的資料,然後給我提供一個適合我的、個性化的、成本最優、效果最好的保險方案。因此,也許金融服務的方式在這樣三個技術加總融合之下,智能體經濟金融服務的方式就徹底改變了。不再有保險經紀人,不再有中介,你也不屬於任何一家金融機構,你不是他的客戶,但你也是所有金融機構的客戶,因為你的資料在那裡,你可以全網尋求對你來說的“最優解”,以無需信任、無需許可的方式。AI Token 的本質與智能體經濟的支付體系尤其是這段時間我在探討隱私計算、零知識證明、全同態加密技術發展過程中得到的這些資訊,結合我對區塊鏈技術無需信任、無需許可的商業技術特點,以及 AI Token 所帶來的 AI Agent 智能體經濟,這三者之間的結合融合得出的結論。我還特別強調一下,現在有一種誤解,把 AI Token 叫做 AI 智能經濟體的貨幣單位。不是這樣的, AI Token 是智能體經濟的生產資料,不是智能體經濟的貨幣單位。從電力、到晶片算力、到大模型、到演算法、到應用,這是輝達黃仁勳提出來的 Token economics 的五層結構。這五層結構實際上描述的是智能體結果的生產過程,描繪的是如何產生智能體的產品或服務。但是,你去獲取產品或者服務、購買產品或者服務、享受產品或者服務,需要付貨幣,這個貨幣只能是數字貨幣。因為 AI Agent 能夠使用的貨幣不是人所方便使用的貨幣,一定是可程式設計的貨幣、可以細分的貨幣、能夠即時結算的貨幣。因為 AI Agent 呼叫別人提供的 API 時,比如一個 AI Agent 在呼叫一家醫院的資料 Token 時,他不可能通過銀行帳戶體系說我先付你錢,明天到帳以後我們再來看你提供什麼服務。我必須即時確認錢已到帳,並且我可能每一次呼叫只是幾分錢、一毛錢、一塊錢。不管是一塊錢、一毛錢還是一分錢,銀行目前支付系統的成本不可能支撐一個 AI Agent 呼叫 API 做這麼微小的一筆支付。所以數字貨幣是其中的“血液”,是智能體經濟的“血液”。當然,智能體經濟還會形成另外一個數位資產。在智能體經濟裡,數字貨幣和數位資產不僅僅是貨幣需要被改造被代幣化。不管是央行的 CBDC,還是銀行的存款代幣化,還是商業機構所發行的 Stablecoin 穩定幣,其實都是在做同一件事,就是把貨幣/資金代幣化。之所以要把貨幣或資金代幣化,是因為如果你不代幣化的話,你就不可能被機器所使用,因為機器使用的貨幣必須是機器能夠讀懂、能夠理解的。一個 AI Agent 要能使用這個貨幣就必須是可程式設計的。現在的美元、港幣、人民幣都是不可程式設計的,必須把它代幣化之後才可程式設計,才可以被機器識別、被機器使用。總結:新商業模式、新資產與未來金融體系總結一下。AI 智能體經濟是無需信任的商業,無需信任、無需許可,這會使得商業成本大幅下降。因為我們知道,為了建構商業中的信任,整個社會有龐大的體系在運轉,這個龐大的體系龐大到連監獄都是為了確保商業信用而準備的。一旦傷害了背信,觸犯刑法,你可能要坐牢。會計師、律師、法院、公安局,整個社會運行了一個龐大的體系來保證商業當中大家不會背信,或者成本上不至於背信。但如果是無需信任、無需許可的商業,這樣龐大體系運行的成本大家都要分擔,你就不需要了。在這樣新的商業模式基礎上會生產出新的資產類別。在 AI 智能體的無需信任、無需許可、成本大幅下降的新商業體系當中,新的資產類別叫“原生數位資產”。所以 Crypto 有原生數位資產,像比特幣、以太坊;也有孿生數位資產,比如各種代幣化的金融資產,都是現實世界已經有的,只是 Digital Twin 有個孿生體在鏈上而已。AI 也會有,AI 的原生數位資產和孿生的數位資產。AI 孿生的數位資產可以用 Tokenization,以資產代幣化來概括它;AI 原生的數位資產未來幾年一定會湧現出來。AI 原生的數位資產會建構全新的商業模式,同時也需要全新的金融服務體系,因為那是一個要讓機器能夠使用的金融服務,而不是人去使用的金融服務。目前為止,我們運行得很好的金融服務體系是為人而設計的,將來一定會出現為 AI、為機器、為 AI 原生的數位資產所建立的新金融服務體系,甚至資本市場體系。以上就是我今天的分享,謝謝大家! (吳說Real)
Token大躍進
詞元(Token)呼叫量的指數級增長,正在帶來一批公司估值的飆升。被稱為“Token第一股”的迅策科技,上市僅108天,股價較發行價上漲近6倍,最新總市值已經達到1050億港元。今年1月8日登陸港股的智譜,上市首日市值約580億港元,交出首份年度成績單後股價迅速,突破1000港元大關,市值也衝破4000億港元。智譜CEO張鵬將2026年的關鍵詞定義為“Token量”,認為智能上界突破與Token消耗的指數級增長一起,共同構成了AGI時代的商業價值。尚未上市的公司之中,月之暗面上個月剛完成新一輪超10億美金融資,估值達到180億美元,而在去年底的一輪5億美元融資中,其估值僅為43億美元。這種估值的短時間躍遷,與今年2月OpenClaw宣佈將Kimi K2.5設為其官方主力模型有著直接聯絡。K2.5發佈僅一個月,月之暗面ARR(年度經常性收入)即突破1億美元,業績增速不僅支撐了估值提升,也打開了公司IPO的可能性。無論國內國外,資本市場都在以驚人的熱情為Token經濟的騰飛定價,未來幾個月裡,我們將有機會聽到各種各樣的財富神話。這場轟轟烈烈的Token經濟大繁榮,正在以“大躍進”的方式完成對所有人的認知普及,以及對風險的累積。增長聊天Bot剛問世的時候,很少有人能想到2年之後,僅僅豆包這一款大模型的日均Token使用量就可以突破120兆。即便按照每百萬Token兩塊錢這個有點便宜的價格來計算,這也意味著每天有3億元的真實經費在豆包上空燃燒。事實上,國內外各家大模型公司都在上演著類似的劇本,全球範圍內的Token日均消耗量都在以指數級規模增長。工信部旗下中國資訊通訊研究院發佈的資料顯示,截至2026年3月,中國日均Token呼叫量已突破140兆,較2024年初暴漲超過1000倍。全球最大的AI模型API聚合平台OpenRouter則統計到,其平台每周處理的Token數量從2025年3月的1.62兆飆升至2026年3月的16.90兆,一年之內增長超過10倍。OpenRouter連接著Anthropic、OpenAI、Google、Meta等幾乎所有主流模型廠商的API介面,它的周度Token消耗曲線,本質上就是全球AI應用活躍度的即時監測圖。這條Token消耗曲線幾乎是垂直向上的,既不像GDP的線性增長,也不像網際網路使用者滲透率的S型曲線,完全走出了人工智慧經濟自己的發展趨勢。是什麼在驅動Token需求的大爆發?答案是人工智慧的技術演進。早期AI應用以聊天機器人(Bot)為主,使用者輸入一句話,模型返回一段回答,一個來回消耗幾百到幾千Token,完事即止。但從去年下半年開始,以Agent和Claw為代表的新型應用範式以更快的速度、更廣的範圍流行開來。它們的共同特徵是讓AI不再只是“一問一答”的對話工具,而是一個能夠自主規劃、呼叫工具、長周期執行任務的數字員工。這種技術架構底層的變化,讓Token消耗量以很多使用者意想不到的方式大幅增長。行業內部測算表明,完成同一個業務目標的情況下,Agent模式消耗的Token大約是Bot模式的50到200倍。這是因為,Agent在執行任務時需要將整個歷史對話上下文全量攜帶,一個複雜任務動輒累積數十萬Token的上下文窗口。而且Agent每次思考都需要經過多輪推理,都會觸發API請求,還需要持續載入系統配置檔案和記憶庫,以維持任務的一致性和個性化體驗。這導致Agent模式下的Token消耗,更像是個不受使用者主觀控制的黑箱操作。更值得警惕的是,這個階段Token表面的消耗量,並不等同於真實的需求量。當AI轉型成為企業的政治正確,當Token消耗量被越來越多的公司納入員工的考核指標,一種“Token偽需求”的情況就誕生了。Meta內部已經有團隊將Token消耗量作為AI滲透率的衡量標尺,部分員工為了“顯得自己很懂AI”,會故意運行大量冗餘的模型呼叫任務;國內騰訊等大廠也被爆料存在類似現象,一些業務線甚至發明了“Token刷量”的灰色操作。這種為了不被時代拋棄而製造多餘的消耗、誇大不存在的業績的行為,充滿了大躍進式的荒誕。核心當Token消耗量以指數級增長,一個嚴肅的產業問題也浮出水面——誰來買單,誰會受益?4月15日,國家資料局就《關於推進行業高品質資料集建設行動的實施方案(徵求意見稿)》公開徵求意見,首次在官方政策檔案中提出“探索詞元交易等新型交易模式,建構以詞元為基礎,可量化、可定價的資料集價值體系”。從“詞元交易”被寫入國家頂層設計的那一刻起,Token就不再僅僅是一個技術概念,而是會逐漸成為人工智慧經濟的法定計價單位。某種意義上來說,Token化收費是人工智慧經濟的核心。迅策科技被稱為“Token第一股”,就是因為其率先在商業模式上做出了調整,全面轉向了按Token消耗付費與分成的新模式,建構了“收入=Token價格×呼叫次數×模組應用數”的增長模型。目前,Token付費收入佔迅策科技總營收的5%左右,公司預計到年底這一比例將快速提升至20%至30%。市場對迅策的估值邏輯也因此發生了重大變化,脫離了傳統市銷率的限制,有了更大的想像空間。迅策科技的模式也說明,在人工智慧經濟中,大模型廠商大機率會扮演“精煉廠”的角色,即將底層的算力與資料,加工成可以被直接消費、以Token計價的“成品”、“結果”,並掌握著價值分配體系中的關鍵生態位。而云服務廠商大概會扮演著“發電廠”和“電網”的角色,它們不直接定價Token,卻決定了Token的底層成本。以阿里雲為例,截至2026年2月底,阿里雲2026財年累計外部商業化收入突破1000億元,AI相關產品收入延續高增長態勢,實現連續第十個季度三位數同比增長。緊隨需求而來的就是漲價,上周阿里雲四天連發三條產品漲價公告,調整百煉部分模型單元服務價格及DataWorks部分API免費額度——雲服務廠商對Token成本的影響力,可見一斑。雲服務廠商在傳統架構中主要收入來自虛擬機器、儲存與網路等基礎設施計費,進入Agent時代後,它們完全可以推動按資源(Token)使用量計費,並通過Agent平台訂閱、開發者生態套件、行業級解決方案等獲得長期合同收入。算力廠商則像是更上游的原材料、燃料供應方,輝達的高端GPU至今仍然處於產業鏈中最核心位置,高頻寬記憶體(HBM)如今更是供應緊張,三星、SK海力士及美光三大儲存原廠一邊產能受限,一邊毛利率抬高。也許有人會擔心算力實際已經過剩,輝達和儲存廠商的股價已經過高,但是這都不影響Token化收費的歷史處理程序。Token收費,讓整條產業鏈的價值分配有了清晰的計算依據。就像千瓦時的確立讓電力市場得以形成,流量/曝光量成為抖音和視訊號的收費標準單位一樣,Token正在讓人工智慧經濟從“感覺有用”走向“可以算帳、可以收稅”,成為一種真實存在的經濟構成。狂歡Token化收費,讓人工智慧經濟運轉的邏輯變得清晰起來,但是人工智慧作為一種劃時代的技術革命,其經濟運轉的邏輯,是否與傳統的經濟學規律一致呢?至少傳統經濟學的供需平衡理論,在人工智慧經濟中並不完全適用。傳統模型中,供給和需求是兩條獨立的曲線相交,而在人工智慧經濟中,供給本身會通過資料飛輪改進供給質量。需求曲線向右移動不是因為外部收入變化,而是因為供給曲線本身向下、向右移動了。目前這個階段,我們更可能看到蒸汽時代的“傑文斯悖論”在人工智慧時代重演。所謂的傑文斯悖論是指,當蒸汽機效率提升、單位馬力耗煤量下降時,煤炭的總消耗量反而暴增,因為更便宜的蒸汽動力催生了更多工廠、火車和輪船。現在Token的單位生產成本越低,願意消耗Token的群體就越多,捨得使用Token而非人力的場景就越多,最後Token的總成本就越高,或者說人工智慧經濟的總價值就越大。根據國內媒體的資料統計,過去兩年多,Token生產成本下降了超過99%,GPT-4每百萬Token的成本已經從37.5美元下降到了2025年的0.14美元。但根據矽谷知名風投Menlo Ventures,全球企業2025年在AI上的支出反而比2024年增長了3.2倍。如果這種趨勢延續下去,那麼那怕單位 Token的價格趨近於零,全人類消耗的 Token 總價值(總量 × 單價)以及它撬動的 GDP 比重,也可以成百上千倍的增長。這正是智譜、MiniMax等公司在巨額虧損的情況下,仍然被資本市場賦予超過許多傳統網際網路企業估值的深層原因——市場定價的不是今天的利潤,而是未來Token經濟總價值。更何況,用Token生產出來的東西,本身也會越來越有價值。同一百萬個Token,在不同場景下創造的價值差距可達十萬倍,其價值完全因執行的任務而異——用於閒聊的Token只值幾分錢,用於寫程式碼的Token值幾百幾千元,用於量化投資、企業併購的Token完全可以價值幾萬元。史丹佛大學2026年AI指數報告估算,僅2024年生成式AI就為美國消費者創造了約1720億美元的消費者剩餘,而使用者獲得的價值遠超實際支付的費用。值得警惕的是,在AI代替了大量人類的腦力勞動後,傳統的勞動力供給理論也會面臨挑戰。傳統的需求曲線會因為購買力萎縮而整體坍塌,而供給端因為自動化依然強勁,這就是凱恩斯所說的“技術性失業導致的有效需求不足”。只不過在這個階段,圍繞著Token消耗量指數級增長的一切都還披著繁榮的外衣,引領著產業鏈上下游和資本市場的狂歡。但是歷史已經反覆證明了,每當一種新技術被資本市場賦予無限想像空間,泡沫總是比價值更先抵達終點。 (巨潮WAVE)
“token工廠”是個什麼廠?科技圈這是又在玩什麼新“黑話”
最近這段時間,“token工廠”一詞在科技圈有點火。事情的起因是,在不久前舉辦的美國輝達公司年度GTC大會(GPU技術大會)上,輝達創始人兼首席執行長黃仁勳表示,當前的行業競爭已從大模型時代發展到token產能時代,“未來的資料中心不再是儲存檔案的倉庫,而是生產token的‘工廠’”。對相關企業來說,“計算能力等同於收入”。“token工廠”是什麼?科技圈這是又在玩什麼新“黑話”?要瞭解“token工廠”,首先得明白什麼是token。簡單來說,token是人工智慧(AI)世界裡最小的語義單元,也即模型處理和生成資訊的基本單位。它可以是一個詞、一段程式碼,也可以是圖像或視訊中的一個像素區塊。3月22日,在北京舉行的“騰訊雲社區龍蝦公開課”活動上,參與者體驗使用騰訊AI智能體工具Workbuddy。鞠煥宗攝(新華社)和許多人想像的不同,AI其實既不識字,也聽不懂人話。每當它需要理解人類的意圖,需要先把資訊切割成token,再生成它自己可以理解的數字資訊,處理完成後再反向執行這一流程,合成人類能夠理解的資訊表達出來。不嚴謹地說,token有點像動畫電影《神偷奶爸》流水線上的“小黃人”,觀眾雖然弄不清每一隻小黃人具體在做什麼,但卻明確地知道,當一群小黃人聚在一起,奇蹟就會發生。理解token之後,就可以嘗試理解“詞元”了。在不久前舉辦的中國發展高層論壇2026年年會上,中國國家資料局局長劉烈宏明確將Token稱為“詞元”,並將它定義為“結算單位”。對此,多位業內專家表示,這意味著,中國AI正在從能力佈局邁向能力結算,從模型好不好,轉向智能服務如何計量、如何定價、如何交易。一個譯名為什麼會引起業界如此高的關注?答案可以從兩個方面拆解。第一,觀測層面。資料顯示,2024年初,中國日均詞元呼叫量為1000億;到2025年底,躍升至100兆;到2026年3月,已突破140兆,兩年增長超過1000倍。日均超140兆的詞元呼叫量,相當於1000兆個中文詞彙,相當於250個中國國家圖書館的資源量。同時,中國AI大模型周呼叫量已連續多周領跑全球,且國產詞元價格僅為海外同類產品的十幾分之一。兩組資料說明,詞元不再只是技術術語,而成為AI商業化速度、應用深度和產業景氣度的重要觀測指標。圖源:千圖網第二,計費層面。詞元作為最小的語義單元,天然就具備量化計算的屬性。它就像工業時代的電、網際網路時代的流量一樣,是AI時代核算成本的新度量衡。過去,很多企業採購軟體,買的是許可證、帳號數和部署周期;如今,越來越多企業開始按照可呼叫、可核算、可復盤的智能服務量計費。這種標準化、精細化的結算方式,將使得AI服務的商業化路徑變得清晰。因此,真正值得重視的,不只是“詞元”這個譯名,更是一個新的計量系統。正如賽迪研究院人工智慧研究中心副研究員鐘新龍在其署名文章中所言,詞元一詞的誕生意味著,“人工智慧開始被納入更成熟的經濟敘事”。搞清楚token和詞元之後,“token工廠”也就不難理解了。如果我們將詞元比作數字經濟時代的“硬通貨”,那麼在既定的電力和空間資源約束下,資料中心拼的是產出詞元的速度、質量和成本,每瓦特電力帶來的詞元吞吐量將替代傳統的伺服器數量、儲存容量,成為決定資料中心競爭力的核心指標。從這個意義上講,資料中心的角色正在發生根本性轉變。傳統意義上的資料中心主要用於資料的靜態儲存和網路交換,可以被簡單視作“電子倉庫”;如今隨著AI智能體的發展,資料中心正全面轉變為持續吞吐海量資料並輸出智能內容的“電子工廠”。本質上說,資料中心已經變成了一條“智能生產線”:輸入的是電力、資料、模型和調度系統,輸出的則是AI智能體的執行能力和行業場景中的實際生產率。圖源:千圖網至此,真正值得關注的關鍵詞“實際生產率”出現了。根據AI的“工作流程”,人類說出一句話之後,模型要先把文字切分成詞元,再把詞元對應成編號,隨後才能完成關聯、推斷和生成。由於切分規則不同,相同的資訊會被不同的模型拆解為不同數量的詞元,相應的,模型處理問題的速度、效率甚至結果也不會完全相同。因此,詞元消耗量與模型智能程度並不能完全畫等號,真正決定結果的,仍然是模型演算法、資料質量、任務設計和提示組織方式。換言之,未來的“token工廠”,比拚的並不只是詞元呼叫能力,而是詞元呼叫與使用的綜合能力,這才是“token工廠”真實的競爭力。 (經濟日報)