#智能體
比龍蝦更強?它一夜沖上全球第一! 圖片
最近,Hermes(愛馬仕智能體)橫空出世,上線不到兩個月,GitHub星標突破6.6萬。社區裡有人說:這大概是OpenClaw誕生以來,第一個真正意義上的競爭對手。一時間,朋友圈裡、技術論壇上,到處都是“Hermes愛馬仕真香”、“OpenClaw藥丸(要完)”的聲音。我想潑一盆冷水:Hermes(愛馬仕智能體)火了,但企業不必急著遷移。真正的競爭壁壘來自團隊對工具的使用深度,而非工具本身。看完後你會知道,什麼時候該追新工具,什麼時候該按兵不動。這篇文章,會給3類使用者各一個明確的判斷。更重要的話,我寫在了文章結尾,趕時間的朋友可以直接拉到文末閱讀。下面,我們展開說說。一、Hermes愛馬仕智能體為什麼會火?愛馬仕智能體的五層記憶系統:重新定義了Agent的“智商”。Hermes(愛馬仕智能體)的核心技術,是它的五層記憶系統——工作記憶、語義記憶、情景記憶、過程記憶和集體記憶。這不是花哨的概念,它解決的是一個真實的、讓所有Agent框架使用者頭疼的問題:長對話後,Agent開始“失憶”,上下文越多,智商越低。傳統解法是給Agent喂更多的上下文。上下文窗口越開越大,Token(詞元)費用越燒越多,但效果卻越來越差。Hermes(愛馬仕智能體)的解法不同:不給Agent更多的記憶,而是讓Agent學會“復盤”。每次任務完成後,系統自動復盤:那裡做對了,那裡繞了彎路,為什麼某個策略沒有生效。把這些經驗壓縮成可復用的Skill(技能),下次遇到同類任務,直接走捷徑,不再從零推理。這意味著:Agent的進步,不需要靠更大的模型,靠的是“經驗積累”。這才是正確的方向。什麼人可以立刻上Hermes(愛馬仕智能體),不用等?第一種,你正在選Agent框架,本來就要花時間搭,Hermes(愛馬仕智能體)的記憶系統是更先進的方向,現在直接用Hermes(愛馬仕智能體)等於站在更高的起點上。第二種,你的核心痛點就是長對話失憶,用OpenClaw(龍蝦)時80%的問題都是上下文混亂、記憶丟失,遷移到Hermes(愛馬仕智能體)能直接解決你的核心問題,這筆帳算得過來。第三種,你是個人或小團隊,沒有複雜的歷史工作流包袱,試錯成本幾乎為零,玩一玩沒損失,真踩坑了自己消化。除了這3類人,其他已經跑通OpenClaw(龍蝦)工作流的企業級團隊,我都建議你再等等。二、OpenClaw(龍蝦)沒有死,它在加速進化外部衝擊,真的動搖了OpenClaw(龍蝦)的根基嗎?判斷一個框架有沒有前途,從來不是看它有沒有被封禁、被唱衰。而是看三個指標:它的核心能力有沒有人在真正需要?它的社區還在不在活躍?它的團隊還在不在迭代?答案是:都在。OpenClaw的核心能力,是把AI能力封裝成一套可本地部署、可自訂工作流的Agent執行系統。這個需求,沒有因為一次衝擊而消失。真正讓一個框架走向衰落的,從來不是競爭對手,而是它自己停止迭代。OpenClaw的核心槽點,圈內早有共識:記憶系統容易崩潰,長對話後上下文丟失,記憶檔案越滾越大。這是真實痛點,承認就行。但這不代表框架要死。讓我們看看資料:據GitHub公開的提交記錄,2026年第一季度,OpenClaw(龍蝦)在記憶管理模組的程式碼提交量,就超過了過去半年的總和。每次更新,都在針對性修補記憶碎片化、上下文溢出等問題。這不是修修補補。這是系統性的迭代。這說明團隊知道問題在那裡,也知道怎麼修。一個框架被真正拋棄的標誌是什麼?沒有人再關心它。沒有人再提Bug。沒有人再提需求。沒有人再罵它。而OpenClaw現在的情況恰恰相反:罵得越多,迭代越快。GitHub上的Issue(問題清單)列表在持續更新,官方文件在持續修訂,Skills生態的貢獻者在持續增長。這才是判斷框架生命力的真正指標。這和人的成長規律一樣:被罵醒,往往是進步的開始。從歷史經驗看,這種外部競爭倒逼內部迭代,往往是一個框架走向成熟的加速器。三、遷移的成本,遠比你想像的高這是本文最核心的方法論之一。很多人換工具的理由很簡單:新的更強。這個判斷在邏輯上成立,但在現實中漏掉了最關鍵的一個變數:切換成本。我們來做一個簡單的盤點:你的團隊花了多少時間,才把OpenClaw配置到今天這個狀態?Skills指令碼寫了多少行?自訂的MCP(模型上下文協議)服務接了幾個?Prompt(提示詞)記憶體系裡積累了多少關於團隊工作方式的上下文?自動化工作流跑了多久才穩定下來的?MCP服務,全稱是Model Context Protocol,即模型上下文協議,是讓Agent與外部工具無縫協作的標準化介面。這套體系一旦建立,就成了團隊工作流的核心血管。這些東西,不是天上掉的。是時間和精力堆出來的。是踩過坑、調過錯、熬過夜之後,一點一點磨出來的。而換到Hermes(愛馬仕智能體),這一切都要重新來過。環境變數要重配,MCP服務要重調,工具集邏輯要重新理解。Hermes(愛馬仕智能體)內建的一些Skill(技能)目前還存在詭異的Bug。對於企業級團隊來說,排雷是需要時間的,業務等不起。你的團隊好不容易磨合出了一套工作節奏,大家知道怎麼用龍蝦處理需求,知道那些坑踩過、怎麼繞過去,知道在什麼場景下該用什麼工具組合效率最高,知道什麼任務丟給AI,什麼任務必須人來做。現在突然換工具,團隊進入“新手模式”。每個人都要重新學,效率打七折甚至五折。每一個工具,不只是一個執行層,它還是一個認知層。你用OpenClaw(龍蝦)積累的,不只是“怎麼用這個工具”,還有一整套思維方式:如何拆解問題、如何設計Agent工作流、如何判斷AI輸出質量、如何設計Prompt(提示詞)策略、如何建立團隊協作規範。換工具,思維框架要跟著重建。團隊從“能用一款新工具”到“真正用好一款新工具”,平均需要三到六個月。而從“用好”到“積累出獨特優勢”,則需要更長的時間。而在這三到六個月裡,你的競爭對手可能早就在原來的工具上跑得更遠了。四、AI時代,真正的護城河不是工具說到這兒,我想把視角拉遠一點,聊一個更根本的問題。AI時代,企業真正的護城河,到底是什麼?很多人以為,護城河是“我有某套別人不會的工具”,或者“我們用了某款最新的AI模型”,或者“我們團隊掌握了一套獨門工作流”。但我想說:AI的出現,正在系統性地消除這種工具型護城河。原因很簡單:你今天花三個月研究出來的OpenClaw(龍蝦)獨門用法,可能很快被一篇技術部落格完整公開,然後成為Skills(技能)市場裡的一個標準化範本。任何有學習能力的人,兩周內就能複製你的工作流。真正被AI弱化的,不是你的技術,而是你靠資訊差和工具差建立的競爭壁壘。這是正在發生的結構性變化。與其追工具,不如追“用工具的能力”。前者是流沙,後者是磐石。企業架構更高效、用的工具更順手,這才是AI時代的競爭優勢所在。讓我們做一個思想實驗:兩個企業擺在面前。A企業和B企業。同樣的啟動時間,同樣的資源投入。A企業:技術團隊嗅覺敏銳,永遠在追最新工具。ChatGPT出來了,第一時間研究;Claude發佈新版本,第一時間接入;OpenClaw(龍蝦)火的時候,第一批部署;Hermes(愛馬仕智能體)出來後,核心團隊立刻開干“遷移方案”。永遠在追,永遠在折騰,永遠在新手期。具體來看,A企業團隊每年花在“學新工具”上的時間不少:換一次工具,就要重新寫指令碼、調Prompt(提示詞)、建規範。最終每一套的積累,都只停留在了“能用”的層面。B企業:同樣面對工具爆炸的現實,但做了一個不同的選擇,不追熱點,但把自己手裡的工具用到極致。團隊積累數百個高品質Skills(技能),形成了多套完整Agent工作流,覆蓋從需求分析到文件輸出的全鏈路。每個成員對工具的理解,已從“會用”升級到“用得好”,他們知道什麼任務適合那種工具組合,知道什麼場景AI輸出質量會下降,知道怎麼設計Prompt(提示詞)讓AI的輸出穩定可控。半年、一年、兩年後,那個企業的AI應用能力更強?答案是明擺著的。工具本身沒有壁壘,你和團隊在工具上積累的深度理解和使用習慣,才是真正的壁壘。五、接下來3個月,我給你的建議面對Hermes(愛馬仕智能體)的崛起,先說結論:關注它,學習它,思考它,但目前階段,不必急於遷移。1.給OpenClaw三到六個月OpenClaw(龍蝦)的團隊已經被競爭倒逼,迭代在加速。記憶系統的問題已經進入修復快車道,這是可以預見的。等它系統性修復到位,等Skills(技能)生態進一步成熟,屆時再做評估,不遲。更重要的是:OpenClaw(龍蝦)的Skills生態,已經積累了相當數量的垂直領域工具。每一次大版本更新,Skills數量都在穩定增長,這是社區共同投入的結果,而非一人之力。這個生態優勢,不是Hermes(愛馬仕智能體)三個月能追上的。2.給Hermes三到六個月它的方向是對的,但企業級穩定性需要時間驗證。等社區把Bug排得差不多,等配置遷移真正做到“無感”,再上車也不遲。更值得關注的是它的設計哲學,Hermes在思考一個核心問題:當Agent越來越複雜,如何讓它不依賴越來越大的上下文窗口,而是通過“學會反思”來提升能力?“追工具派”最隱蔽的陷阱是:永遠在學習,永遠在遷移,永遠在付出切換成本,永遠沒有積累。更可怕的是,當團隊習慣了“遇到新工具就換”,他們就不再有耐心把任何一個系統打磨到極致。好的執行,需要深度。而深度,需要時間。結語關於工具,更關於你自己AI時代,工具會變,真正有掌控力的人,是那些想清楚“什麼東西不變”,然後把時間花在那上面的人。你判斷問題的眼光,不會變。你面對不確定性時的決策質量,不會變。這些東西,Hermes替代不了。OpenClaw替代不了。任何工具都替代不了。這種決策能力,不是天生的,是可以訓練的。 (筆記俠)
阿里首提智能體經濟,在全球AI競爭顯鋒芒!
行家一出手,便知有沒有!自AI問世以來,已成中美科技必爭之地,誰能笑到最後,關鍵還是要看應用!在這方面,矽谷那邊的公司一直想打通AI+消費這條路,但缺乏穩固的生態和龐大的應用場景,一直流於形式,還未實踐。而阿里在春節期間取得了千問辦事的成功之後,在新財年的首次集團戰略會上,阿里正式提出,要全力推進以千問為代表的智能體經濟。1. 什麼是“智能體經濟”?對普通人有什麼意義?“智能體經濟”簡單來說,就是通過AI這個技術載體來推動更好的消費,也就是很多官媒說的“AI+消費”!這玩意對普通人來說,有三好!一好為:方便。比如以前點外賣,得自己去外賣軟體上一個個找,現在一句話就能搞定;以前買電影票,選座位得研究一下,現在交給千問按需訂票。可以這麼說,過去很複雜的消費流程,現在一句話就能辦完,給誰誰能不喜歡?二好為:創造新的機會。往前翻個20年,就能發現每一次技術革新,除了會為行業帶來新變化以外,也會創造新的機會。比如當年的電商,讓很多人從個體戶變成了小老闆;10年前左右的自媒體,催生了現在的網紅經濟;那麼如今阿里的智能體經濟要發展,必然也會衍生出一系列的工作崗位,現在能想到的就是營運、設計、AI訓練師之類的工作,往後發展這方面人才缺口勢必會放大,普通人只要抓住機會,很有可能直接改變命運。三好為:技術普惠這個怎麼理解呢?以老年人為例。很多上了年紀的老人。對於智慧型手機用的並不熟練。一個人在家想點個外賣,都搞不明白。但在千問智能體經濟的技術普惠下,老年人也能一句話搞定外賣,體驗到年輕人的生活方式。網際網路的浪潮奔湧向前,阿里通過技術普惠,讓銀髮一族也能緊跟時代的步伐,這既是社會責任的體現,也是技術便利每一個日的最好寫照!2. 為什麼阿里是第一個提出此概念的公司?因為只有阿里具備這些條件!這個智能體經濟兩大要素,過人的技術,優秀的生態。而這兩方面,不管是那個條件,阿里都是王中王、頂中頂!論技術,阿里從模型到GPU晶片都是行業頂尖。最新模型Qwen 3.6 Plus一經發佈,單日呼叫量突破1兆Token的模型,問鼎全球大模型周呼叫量冠軍,究其原因,是因為它是國產程式設計模型技術能力的天花板。上周的時候,在AI視訊生成領域,由阿里巴巴內部孵化的模型HappyHorse-1.0,登頂Artificial Analysis排行榜。這個大模型有多牛?它在文字生成視訊、圖片生成視訊等四大核心賽道中全面領先。這也能證明,阿里在AI領域持續投入是有結果,同時,阿里在多模態大模型領域技術積累也非常的雄厚。平頭哥自研GPU也已實現規模化量產,截至26年2月已累計交付47萬片。AI技術,大模型是基礎,GPU是運轉的關鍵,兩大技術阿里全都有,並且全都硬,為智能體經濟提供了堅實的保障。論生態,阿里積累了20多年的網際網路商業、消費經驗,旗下擁有淘寶、閃購、高德、飛豬等覆蓋人們吃喝住行娛一體的生態產品,並且還這些產品還和千問全部打通,這也就將阿里的生態優勢賦能到了AI應用端。為了集中力量辦大事,4月8日的時候,阿里還進行了組織架構調整,新設立了阿里巴巴集團技術委員會,吳泳銘任組長,周靖人擔任首席AI架構師,整合優勢資源,投入到智能體經濟戰略當中來。3. 總結阿里今天提出智能體經濟,是其科技實力的體現,也是生態經營多年的結果。這大概也就是此前美國知名科技商業媒體The Information發報導稱:“阿里巴巴在AI辦事領域的進展快於亞馬遜和 OpenAI。”的原因所在! (梁穩健)
OpenAI前高管預判AI模型大戰:中國正在全力贏下能源這場比賽
今年以來,OpenClaw“龍蝦熱”席捲全球,AI Agent (智能體)對token算力的消耗量之大,讓各界重新認識了中國模型的性價比。然而,AI對就業甚至對人類的衝擊也不斷引發焦慮,矽谷知名企業Meta、Block、甲骨文等的裁員浪潮滾滾來襲。究竟未來人類如何面對AI浪潮?AI Agent的趨勢將如何變化?中國模型在未來的世界模型競爭格局下有何優勢?Token出海的浪潮將如何演化?對此,我們獨家對話了OpenAI前高管、OpenAI原應用負責人(Head of Go-to-market)扎克(Zack Kass),目前他也是矽谷知名AI諮詢企業ZKAI的創始人。他早在2019年就預言了如今的Agent時代,並在去年正式發行《下一次文藝復興:AI和人類潛能的拓展》(The Next Renaissance: AI and the Expansion of Human Potential"?)。01 “龍蝦熱”凸顯中國模型優勢OpenRouter資料顯示,春節期間中國模型Token使用量全球第一,主要是因為開源部署熱潮,大家都在接入Kimi、MiniMax這些更便宜的模型,直接推高了中國模型的Token用量。也有觀點認為,中國擁有全球最大、最穩定的電網,AI產業可以依託更低的電力成本。對此,Zack持積極看法。原因在於,未來單位Token價格將會持續下降,但需求爆發式增長,導致晶片和電力嚴重不足。“我認為中國做得非常聰明,中國正在全力贏下能源這場比賽。”他表示,“如果你認同我的模型收益遞減理論——即模型質量提升到一定程度後,對大多數企業而言不再是關鍵差異點,這個時刻離我們並不遠。如果你相信這個理論,那就要問:真正的競爭格局是什麼?我認為在核聚變普及之前,核心是能源,其次是晶片,肯定是基礎設施。”在此背景下,他稱,中國正在走開源路線,試圖用優質、低價的AI產品去佔領全球市場,並且在基礎設施上全力衝刺。儘管國際先進模型的優勢毋庸置疑,尤其是在專業領域,但Zack重申了他始終相信“模型收益遞減理論”——對於絕大多數企業而言,模型質量到一定程度後,就不再是實質性的差異點,事實也確實如此。因此他並不認為未來只有最好的模型才能賺錢,相反,他稱:“模型本身就很難賺到大錢了,但應用層會更容易盈利。”不過,業內人士也對騰訊新聞《潛望》表示,還是希望國產模型少一些價格戰,否則在貶低國內勞動價值的同時,可能會換來跟商品類似的貿易壁壘。比較好的嘗試是,希望以後能搞延遲開源,比如在每一代模型訓練完成後,先設立為期 3-6 個月的預覽期,僅授權給選定的海外合作夥伴(如特定的雲服務商) 使用,並按使用量或牌照計費,只有當下代模型發佈時,才將上一代模型開源。02 AI Agent發展大超預期也正是因為這股“龍蝦熱”,AI Agent在今年徹底家喻戶曉。多年前,Zack就預言了智能體的爆發,但如今他也非常驚訝AI Agent進化得這麼快、質量這麼高。“坦白說,我給自己的預判打高分:我在2019年就預測2026年是Agent之年,現在的發展基本符合我的時間線。”但他稱,真正讓他意外的是,至今還沒有出現AI界的“車諾比”或“三里島事件”——比如一次匿名自主攻擊,讓大家分不清是惡意Agent所為,還是人類攻擊者造成的。現在公眾對AI的不信任,大多來自對潛在風險的想像,而不是已經發生的真實危害。他也提醒很多人:在變好之前,情況會變得更奇怪。關鍵問題在於,我們還不清楚多智能體行為的整合風險,我們需要多智能體環境,但還沒找到保護機制與實現路徑。Zack認為,未來會發生的是,大多數智能體工作流會先被個人使用,能對接這些智能體協議的企業會最具優勢,但也會出現一種巨大的不對稱:用Agent的人和不用Agent的人,差距會比當年用網際網路和不用網際網路的人更大。還需要一提的是,現在的網際網路是為人類視覺設計的(HTML),是一個線上大型商場,只適配人的眼睛,不適配機器。未來會出現第二層網際網路:面向機器的、基於TXT/XML的網際網路。能適配機器瀏覽的企業,無論B2B還是B2C,都會大幅跑贏同行。也正因如此,Zack也警告,企業會被去中介化—— 使用者不再需要訪問官網,智能體會直接完成決策與交易。我們會發現使用者真實的偏好到底是什麼。“因此我給所有消費品牌的警告是:確保你的客戶真的喜歡你,否則很快智能體會直接幫使用者 ‘最優下單’:又好又便宜,使用者甚至不用過問。這對零售行業會是巨大衝擊。”03 AI繁榮派vs末日派事實上,在AI開發過程中,一直有兩大陣營:繁榮派(AI boomers)和末日派(AI doomers),爭論不斷。前者認為,通用人工智慧(AGI)會帶來烏托邦,末日派則認為AGI會“殺”死所有人。當年,OpenAI內部正是因為這兩大意識形態的分歧,導致部分人員出走。Zack表示自己是“科技樂觀主義者”(techno-optimistic)。“無論好壞,我更傾向於往好的方向看。我對這個問題的核心框架是:人類提升普通人生活水平唯一穩定的路徑,就是技術。除此之外,沒有其他可持續的方式能為所有人創造更多價值。”隨著技術進步,政府更容易做到公平向善,更難走向極端。更何況,人類整體上是向善的,技術讓人類能做更多好事,當然也會讓少數人做更多壞事——高資源的作惡者會擁有更強控制力,低資源的作惡者破壞力也會變大。“但整體上,我們治癒疾病、發明新技術,讓一切變得更好、更快、更便宜。也正因如此,沒有充分的理由說明,全球經濟不會持續向好,人類生活的底線不會持續抬升。比如中國經濟奇蹟,90年代崛起的中產階級讓數億人擺脫貧困;印度2000年代的經濟奇蹟,也讓近十億人脫離貧困。這些都源於技術進步。”他稱。如果我們非要質疑這種趨勢,那麼就需要問——這個趨勢為什麼會停止?Zack認為,只有兩種邏輯能支撐“世界會變糟”的論調:我們不再發明新技術,陷入技術停滯;我們用發明的技術去做更壞的事。然而,就第一種論調而言,我們顯然不會減少技術創新,現在的技術是未來最“笨”的階段,只會持續變得更智能。就第二個論調來看,這也是末日派的主要論點,技術會催生很多有趣的可能,但也會伴隨可怕的下行風險,大致包括:財富與權力集中、高資源、低資源作惡者被賦能,以及AI出現價值對齊失敗的超級智能。但Zack認為最符合自然走向的情況是,短期中期會有下行壓力,但世界整體會變得更好,而當下感受到的危害,很大程度來自社會動盪,這不再是經濟問題,而是情感問題、精神問題。04 關注自動化帶來的情感代價Zack在去年發佈的新書中也提及了“身份錯位”(identity displacement)這個概念,即未來的核心問題不是經濟問題,而是精神問題。當前無法逃避的一個問題就是——AI造成的大規模失業怎麼辦?事實上,矽谷每天都在見證大量裁員,早年被稱為“養老院”的大廠也再難躺平。“我到現在還沒有明確答案,這次自動化浪潮太猛,完全出乎很多人意料。”Zack表示,他的新書開頭引用了宏觀經濟學之父,1930年凱恩斯寫過一篇論文叫《我們後代的經濟可能性》,裡面有一句話令人印象極深:“我必須放手暢想一個我註定無法親歷的未來:在那個未來,人類或許已經解決經濟問題,轉而面對更深刻的命題。”在他看來,大家總糾結“人類還會不會有工作”,答案大機率是“會”;但就算沒有工作,也意味著我們已經高度自動化,解決了大量生存問題。真正的問題是:在未來,人類必須把自我價值、身份認同和工作剝離開,人們還會幸福嗎?“我沒有完美答案,但我認為短期內,答案很明顯是‘不會’。所以我真正想聚焦的,是明確且現實的威脅——其中最大的,就是自動化帶來的情感代價。”之所以Zack強調“精神問題”,是因為自動化讓絕大多數人已經脫離絕對貧困,有飯吃、有衣穿、有房住。在前工業時代,人類活不過40歲;現在大多數人能活到70歲以上。我們開始思考全新的人生問題,這些問題同樣複雜。未來回頭看,我們這個時代依然充滿糟糕的處境:糟糕的飲食、車禍、暴力等,這些都不是經濟問題,而是精神與文化問題,這是我們下一步必須解決的。 (騰訊財經)
Token成為“吞金獸”,大廠算力漲瘋了
有沒有發現,這半年AI圈的畫風變得有點快?去年這個時候,大家還在為算力降價狂歡。阿里雲帶頭喊出“最高降幅60%”,騰訊雲、華為雲、百度雲齊刷刷跟上,那陣仗,簡直像雙十一大促。創業群裡天天有人曬帳單:“看,我這一百萬Token才花了幾毛錢!”那會兒人人都覺得,AI創業的春天來了,算力跟白菜一樣便宜,誰還做不起大模型應用啊?結果呢?打臉來得太快。就上個月,風向一百八十度大轉彎。Google、亞馬遜、騰訊、阿里、百度,10天之內全發了漲價公告。漲多少?普遍30%到50%。最狠的是騰訊雲,有個核心產品直接漲了400%。從“跳樓大甩賣”到“坐火箭式漲價”,前後不到一年。到底發生了什麼?誰在背後推著價格往上走?更重要的是,這波漲價潮裡,誰最慘,誰在偷笑?去年還在“打骨折”,今年為什麼集體漲價?先簡單回顧一下這出“反轉大戲”。2025年4月,阿里雲率先扔出一顆重磅炸彈:核心產品最高降價60%。這可不是小打小鬧,是實打實的“腰斬再打折”。緊接著,京東雲說“隨便降,我跟”,騰訊雲、華為雲、百度雲全部跟進。一時間,算力市場硝煙瀰漫,價格戰打得那叫一個熱鬧。那會兒的口號是什麼?“讓AI用得起”“算力普惠”。很多創業公司真的信了,開始大張旗鼓地燒Token、跑模型。然而,免費的午餐從來吃不長久。2026年1月,亞馬遜AWS悄悄幹了件事——沒有任何發佈會,沒有任何預告,直接把EC2伺服器價格上調了15%左右。別看幅度不大,意義可大了:這是雲服務行業近二十年來第一次漲價。要知道,過去二十年,AWS降價的次數超過一百次,從來只有往下走,沒有往上調的道理。這一下,像是推倒了多米諾骨牌。3月11日,騰訊雲跟進,旗下Tencent HY2.0 Instruct模型輸入價格從0.0008元/千tokens漲到0.004505元/千tokens——漲幅463%,四倍多。3月18日,阿里雲宣佈算力卡產品上漲5%到34%,百度智能雲也跟著漲了5%到30%。那些之前免費公測的大模型,比如GLM 5、MiniMax 2.5、Kimi 2.5,全部結束“白嫖期”,轉入正式計費。從“搶著降價”到“搶著漲價”,為什麼變化這麼快?表面看是雲廠商扛不住了。GPU晶片越買越貴,資料中心的電費佔營運成本的40%到60%,再加上2025年下半年儲存晶片也開始漲價,成本端的壓力實實在在地壓過來了。但真正讓漲價變成“不得不做”的,是另一個更根本的原因——算力,真的不夠用了。誰在瘋狂“吃”Token?140兆的真相之前不是說算力過剩嗎?怎麼突然就不夠用了?答案是:Token被“吃”得太快了。根據國家資料局局長劉烈宏在今年3月披露的資料:到2026年3月,中國每天的Token呼叫量已經突破了140兆。這個數字有多誇張?給你兩個參照:· 2024年初,這個數字只有1000億。兩年時間,漲了一千多倍。· 2025年底,這個數字是100兆。也就是說,僅僅過去三個月,又漲了40%——光這三個月新增的量(40兆),就是2024年初全天的400倍。這不是線性增長,這是海嘯。那麼問題來了:誰在瘋狂消耗Token?答案就一個詞:智能體(Agent)。去年開始,以開源智能體OpenClaw(江湖人稱“龍蝦”)為代表的產品火得一塌糊塗。AI從一個只會“聊天”的機器人,變成了一個能“幹活”的助手——幫你訂機票、寫程式碼、做PPT、分析資料……聽起來很酷對吧?但代價是,智能體幹一件簡單的事,消耗的Token量是普通對話的10倍到100倍。舉個例子:讓AI幫你寫一個爬蟲指令碼。如果是普通對話,它給你一段程式碼,你複製走人,消耗幾百個Token。但如果是智能體,它要自己跑程式碼、報錯、偵錯、再跑、再調……來來回回十幾輪,Token消耗直接奔著幾萬去了。更別提視訊生成這種“吞金獸”。有分析指出,生成1分鐘的視訊大約要消耗10兆Token。而現在的視訊模型,生成5秒的視訊才收你幾毛錢到幾塊錢——這那是賺錢,這分明是賠本賺吆喝。但架不住用的人多啊,視訊、音樂、程式碼、資料分析……每個方向都在瘋狂“吃”Token。供給跟不上需求,算力自然就漲價了。這不是陰謀,是赤裸裸的供需失衡。算力排位賽:大廠吃肉,小玩家連湯都喝不上漲價這件事,對不同的人,意味完全不同。對雲廠商來說,漲價其實是好事。有券商算過一筆帳:阿里雲每提價1%,它的利潤率就能提升1個百分點。所以你看到的資料是,阿里雲的份額不降反升,已經佔到了中國AI雲市場的36%。而在AI呼叫量這個更細的賽道里,火山引擎(字節旗下)更是佔了將近50%——也就是說,全中國一半的Token呼叫,走的是火山引擎的管道。與此同時,華為雲、騰訊雲的份額在微幅下滑。頭部效應越來越明顯:大廠越做越強,資源越聚越集中。那誰最慘?中小AI創業公司,以及那些剛入局的小玩家。原因很簡單:漲價直接推高了他們的營運成本。以前Token便宜的時候,你可以隨便跑實驗、隨便調模型,反正花不了幾個錢。現在價格翻了幾倍甚至十幾倍,每一輪訓練、每一次推理都要掂量掂量。更麻煩的是,小玩家沒有議價能力。大客戶可以跟雲廠商簽長期協議,鎖定一個相對優惠的價格。你一個初創公司,一年才花幾萬塊錢的算力費,誰跟你談折扣?只能老老實實按漲價後的價格付錢。很多原本打算做AI應用的項目,算了一筆帳之後,默默擱置了。還有一些已經在做的,要麼縮減規模,要麼自己扛著虧損硬撐。偏偏終端市場競爭又激烈,你不敢輕易給使用者漲價——隔壁家還免費呢,你一收費使用者全跑了。最後所有的成本壓力,只能自己嚥下去。一位從業者跟我吐槽:“以前覺得算力便宜,創業門檻低了。現在才發現,門檻不是低了,是先讓你進來,再把門關上。”這其實是一場殘酷的排位賽。過去二十年,雲廠商靠“低價走量、先圈地再盈利”的打法活得很滋潤。但那個時代結束了。算力正式告別補貼期,進入商業化定價階段。未來比拚的不再是誰更便宜,而是誰的服務更穩定、誰的生態更完善、誰能幫企業真正用好每一分算力。而在這場排位賽裡,小玩家大機率要被甩下車。回頭看看這一年多的過山車,你會發現一個挺扎心的真相:算力從“白菜價”到“火箭價”,本質上是AI行業從野蠻生長走向成熟的一個縮影。免費時代結束了,價值競爭開始了。那些靠補貼活著的商業模式會死掉,而那些真正有技術、有場景、有使用者的產品,會在算力成本上升的環境中活下來,甚至活得更好。AI創業的核心競爭力,從來不是算力有多便宜,而是你拿算力來幹什麼。算力時代,Token確實貴。但比Token更貴的,是一個知道怎麼用好Token的腦子。 (鋅財經)
現在,人工智慧已經發展到什麼地步了
截至2026年3月,人工智慧已從生成式AI全面進入智能體(Agent)+ 具身智能(Embodied AI)的落地爆發期,核心是從“會說會寫”走向“會規劃、會行動、會幹活”,並深度融入物理世界與產業全流程。以下為補充大量實際案例與權威資料後的完整版本。一、核心技術:四大前沿突破(含案例+資料)1. AI智能體(Agent):從“被動應答”到“主動執行”AI已成為能自主完成複雜任務的數字員工,直接控制電腦/手機、跑完整工作流。- 系統級操作:Anthropic Claude Mytos、OpenAI GPT-5.2已實現直接控制電腦/手機,無需API,可自動點選、填寫、跨軟體操作、跑完整工作流。- 自主規劃協作:具備目標拆解、多步驟規劃、記憶、迭代最佳化能力,可自動寫報告、做報表、做PPT、處理客服、跑供應鏈。- 企業滲透:Gartner預測2026年40%企業應用嵌入任務型AI智能體(2025年僅5%)。-實際案例- 百度“伐謀”智能體(汽車設計):阿爾特汽車用其將風阻測試從10小時縮至分鐘級,設計師2天完成原3個月工作量,效率提升45倍。- 上汽通用五菱“智能島”:AI調度動態最佳化,車型切換效率提升40%,白車身一次合格率達99.97%。- 美團AI調度:訂單暴漲300%、騎手少40%時,55毫秒規劃最優路線,外賣平均30分鐘送到。2. 多模態大一統:AI“看懂、聽懂、感知整個世界”新一代模型實現文字、圖像、音訊、視訊、3D、感測器資料的統一理解與生成,接近人類多感官協同。- 文生視訊/3D:一鍵生成高畫質長視訊、3D模型,用於影視、工業設計、數字孿生。- 即時多模態互動:看一眼場景、聽一段語音,即可還原邏輯、生成方案,支援AR/VR沉浸式互動。- 性能與普惠:輕量化模型(50億參數內)推理速度提升40%、成本降50%,移動端/中小企業可低成本部署。-實際案例- 萬興科技AIGC工具:使用者破2000萬,文生視訊付費轉化率18%;自動剪輯將1小時工作縮至5分鐘,自媒體周更從3條→7條,粉絲增速+45%。- 零售3D建模:Lowe’s用AI將2D圖轉3D模型,成本**<1美元/個**,電商轉化率提升。- 醫療多模態:罕見病診斷精準率從38%→72%。3. 具身智能(Embodied AI):AI走出螢幕,進入物理世界AI從“思考者”變成“行動者”,機器人懂物理、會操作、能適應真實環境。- 物理認知:GoogleDeepMind PhysBrain 1.0讓機器人理解物體運動、碰撞、力學規則,實現精準物理互動。- 人形機器人落地:特斯拉Optimus、Unitree等已從Demo走向工業/服務場景,可搬運、裝配、巡檢、做家務。- 群體智能:無人車、無人機、工業機器人實現自主協作,完成複雜叢集任務。-實際案例- 電力巡檢“天工”機器人:在西南變電站自主巡檢、操作裝置,故障識別精準率99.9%,替代人工翻山越嶺。- 優必選Walker S2:在比亞迪、極氪等20家車廠實訓,自主換電、連續工作72小時。- 星動紀元物流機器人:京東亞洲一號倉分揀精準率99.7%,拿下5000萬元訂單。- 資料:2026年人形機器人出貨量預計破6萬台,市場規模超千億元;單台替代3名工人,投資回報周期18個月。4. AI for Science(科學AI):成為“AI科學家”,加速科研突破AI從輔助工具升級為自主科研主體,大幅縮短研發周期。- 藥物/材料研發:自動化實驗室+科學大模型,將數年研發壓縮至數月,加速新藥、新材料、催化劑發現。- 前沿科學:輔助核聚變模擬、氣候預測、蛋白質/基因解析、量子計算最佳化。- 實際案例- 儲能材料研發:“分子—電網工業智能體”將傳統以年計的研發周期縮至數月,工業級電站綜合性能提升超100%,已應用於張家口懷來資料中心。- 藥物研發:AI將藥物研發周期縮短60%,成本降低40%。- NASA火星車:Anthropic Claude全權規劃路線,將路程拆解為10米路段,規劃時間縮短50%。二、產業與應用:價值兌現,全面滲透(資料+案例)1. 規模與格局(2026最新)- 全球AI市場突破9000億美元,同比增長18%+。- 中國AI核心產業規模超12兆元,周呼叫量(4.69兆Token)首次超越美國,全球前五模型中四款來自中國。- 產業鏈:硬體(35%)、軟體(40%,智能體增長超80%)、應用(25%)。- 融資:2026年Q1中國AI融資88起、200億元,同比近乎翻倍;3月單月融資85億元,創歷史新高。2. 重點落地場景(資料+案例)- 智能製造- 中國智能工廠超3萬家,生產效率提升22.3%。- 某汽車零部件廠商:AI預測性維護,裝置故障率-28%,維護成本-32%。- 西門子+百事:數字孿生,生產吞吐量+20%,資本支出-10–15%。- 醫療健康- AI輔助診斷滲透率超60%,基層醫院達60%+。- 某社區醫院:AI處方稽核,效率+60%,處方合格率+15%;累計稽核**100萬+處方,識別8000+**不合理處方。- 重症監護:AI助手使檔案錯誤減少68%。- 金融風控- 信用卡欺詐檢測:響應時間從3秒→80毫秒(-97%),誤報率-42%。- 跨境合規審查:效率+80%。- 某國際投行:AI ESG系統,綠色金融規模2000億美元+,合規成本-55%。- 交通與物流- 城市交通:AI調度,擁堵率-25%,出行時間-30%。- 菜鳥網路:AI倉儲,效率+50%,物流成本-30%。- 內容創作- 行銷內容:AI生成效率+8–10倍,成本-90%,轉化率+30%。三、代表產品與模型(2026最新)- OpenAI GPT-5.2:44項專業任務勝率70.9%,醫療/法律/金融精準率超80%,多模態與長文字能力全面升級。- Google Gemini 3.1:推理能力翻倍,整合Lyria 3音樂生成,支援一鍵生成視訊配樂。- Anthropic Claude Mytos:新一代旗艦,性能大幅領先,支援Computer Use(系統級操作)。- 國產第一梯隊:字節、阿里、百度、騰訊等模型在推理、程式設計、多模態上與全球頂尖正面競爭,多項指標領先。四、關鍵趨勢與挑戰1. 核心趨勢- 範式躍遷:從生成式AI → 智能體AI → 具身智能(物理AI),AI從虛擬走向現實。- 普惠化:推理成本較2023年降70%,中小企業部署門檻大幅降低。- 安全與合規:AI安全、可解釋、倫理監管成為標配,人類主導權強化。2. 核心挑戰- 智能體協作標準化:多智能體通訊協議(MCP/A2A)尚在完善,跨平台協作待統一。- 具身智能可靠性:真實環境魯棒性、安全性、成本仍需突破。- 資料與隱私:高品質資料稀缺,資料安全與合規壓力增大。一句話總結:2026年是AI“動手幹活”的元年,智能體與具身智能讓AI真正成為能自主執行、能融入物理世界、能深度改造產業的核心生產力。 (追逐時代浪潮的人)
搜尋量飆漲1850%!算力漲價潮來了
這幾天,“Token”,也就是“詞元”火了。資料顯示,從今年2月下旬開始,“Token”這個詞的搜尋量明顯攀升,最高一天達到7.7萬次,比去年日均搜尋量高出1850%。詞元呼叫量爆發,加大了對背後算力支撐的需求,也直接拉動了算力相關服務的價格。3月,國內三大雲廠商接連提高AI算力產品價格,十天之內漲價30%左右。全民熱議“Token”專業技術名詞走進大眾視野從全民熱議,到官方定名,Token為何在短時間內被廣泛關注?詞典應用後台資料顯示,從今年2月下旬開始,“Token”這個詞的搜尋量明顯攀升,最高一天達到7.7萬次,比去年日均搜尋量高出1850%。社交平台上,3月1日至3月20日,有將近60萬人參與了關於Token的討論。這個原本更多在技術圈流通的詞,為什麼突然闖進了大眾視野?有的人把它看成一種貨幣。也有人覺得,它更像一種會被消耗掉的“燃料”或者“食物”,還有人更注重它的功能性。大家對它的理解五花八門。那從專業角度看,Token又該怎麼解釋?騰訊研究院教授級工程師 王鵬:未來Token會成為某種意義上的基本計量單位,尤其是衡量智力、衡量工作量的單位。我今年這一個月消耗的(Token)可能比我去年一年消耗的還要多很多。在業內,大家知道這個是我們的日常,已經成為像水電一樣正常的事了。網易有道詞典市場負責人 郭靚:看到後台這麼大使用者量對於“Token”這個詞的查詢,其實意味著大家真正開始去瞭解AI到底是什麼,以及AI真正的能力。人們討論Token的中文名字,其實都在做同一件事:試著用生活的語言,去理解一個新技術詞。而官方定義“詞元”,也像征著這個過程走到了一個新階段:一個技術名詞,從專業圈層走向大眾理解,最終進入正式表達。也許有一天,聊起AI時,你會自然地脫口而出“詞元”——就像今天我們說“流量”“掃碼”一樣。智能體催熱詞元經濟引發算力漲價潮當下,圍繞詞元的呼叫、分發與結算,一套新的價值體系正在加速演進形成,並成為人工智慧產業商業化的重要路徑。詞元經濟為何突然“出圈”?又釋放了那些訊號?國家資料局發佈的資料顯示:2024年初,中國日均詞元Token呼叫量為1000億;至2025年底,躍升至100兆;今年3月,已突破140兆,兩年增長超千倍。詞元呼叫量爆發,加大了對背後算力支撐的需求,也直接拉動了算力相關服務的價格。3月,騰訊雲、阿里雲和百度智能雲,國內三大雲廠商接連提高AI算力產品價格,十天之內漲價30%左右。同濟大學經濟與管理學院教授 阮青松:從產業鏈來看,漲價最先受益的是上游的晶片、伺服器這些硬體廠商,而下游使用AI的應用和終端成本壓力加大,價格也會傳導到使用者,這也倒逼企業要麼最佳化效率,要麼用國產算力替代、減少成本,所以這輪漲價可能會加速國產算力的替代處理程序,推動整個行業在技術創新上更進一步。需求一下子爆發了,但供給卻沒能跟上,這是本輪算力漲價最直接的原因。專家認為,算力正從企業的“成本項”變成決定競爭力的“戰略資源”。漲價只是表象,真正的變化在於行業開始重新定義算力的價值。同濟大學經濟與管理學院教授 阮青松:要緩解這種供需失衡,短期內價格漲了,自然會吸引更多企業加入供給;長期還是要讓國產算力卡多起來,同時把模型效率提上去,用更少的Token(詞元)干最多的活。只有當供給跑得比需求快,算力才能真正從“緊俏貨”變成像水電一樣隨取隨用的基礎設施。 (澎湃新聞)
Meta華人實習生搞出超級智能體!自己寫程式碼實現自我進化
能無限進步的「超級智能體」來了!最近,Meta研究團隊的一篇題為HYPERAGENTS(超級智能體)的論文迅速刷屏。這篇論文將LSTM之父Jürgen Schmidhuber二十年前提出的哥德爾機(Gödel Machine)思想,與達爾文開放演算法相結合,提出了能持續自我迭代的達爾文哥德爾機。基於此這一思想,Agent不僅能更好地完成具體任務、持續提高自身表現。更關鍵的是,它可以不斷最佳化“改進自身”的底層邏輯,實現“元學習(Meta-learning)”這,便是論文定義的新一代超級智能體——Hyperagents。論文更進一步提出:未來AI有望通過持續自我迭代,最終突破人類預設的初始演算法邊界,也正因如此,AI安全必須被擺在核心位置。不少網友也感慨道:元學習真正讓人既害怕又興奮的,是元層面的改進能夠跨領域遷移。這不是在某一件事上變得更厲害,而是學會了在一切事情上變得更厲害。目前,這篇論文已被ICLR 2026接收。從哥德爾機到達爾文哥德爾機要理解超級智能體Hyperagents,必須先瞭解它的基石——哥德爾機(Gödel Machine)。哥德爾機是一種假設性的自我完善型AI。它在數學上尋求證明:如果存在某種更好的策略,它會通過遞迴重寫自身程式碼來解決問題。而這一假設,最早由尤爾根·施密德胡伯(Jürgen Schmidhuber)在二十多年前提出。在傳統機器學習中,AI的“學習方法”是人類預設的硬編碼,它只能通過調整內部參數來逼近目標;而哥德爾機則打破了這一限制,它能夠將演算法框架本身視為可編輯的程式碼,通過自主重寫程序來實現學習能力的自我演進。但問題也隨之而來:哥德爾機往往要求AI在自我演進之前,證明該改動具備淨收益。也就是說,改程式碼花掉的算力成本,未來能不能通過更強的性能賺回來?不幸的是,這種計算在現實中的複雜任務中幾乎是無法實現的。針對這一問題,Meta團隊提出達爾文哥德爾機(DGM),它利用開放式演算法(Open-ended algorithms),通過在大模型提議的程式碼改進方案中進行搜尋,獲取能從經驗上提升性能的方案。換句話說,DGM利用基礎模型來提議程式碼改進方案,並利用開放式演算法的最新創新成果,來搜尋並建構一個不斷增長的、多樣化且高品質的AI智能體庫。基於此,DGM能創造出各種自我改進方案,例如:增加補丁驗證(Patch Validation)步驟、最佳化檔案查看功能、增強編輯工具、生成並篩選多個解決方案以選出最優解,以及在進行新更改時,會自動加入歷史嘗試記錄(並分析失敗原因)以供參考。論文的實驗還表明,DGM獲得的算力越多,自我提升效果越好。超級智能體雖然DGM很強,但它存在一個致命限制:它主要在程式設計任務中有效。這是因為DGM依賴一個關鍵假設——評估任務與自我修改任務必須“對齊”。在程式設計領域,這種對齊是天然的:提升了程式設計能力,自然也就提升了修改自身程式碼的能力。也就是說,解決外部程式設計問題的邏輯工具,可以直接轉化為修改其自身底層程式碼的能力。相反,如果是在非程式設計領域(如寫詩),即便提升了寫詩能力,也無法直接轉化為修改程式碼的邏輯水平。在這種缺乏“自指性(Self-referentiality)”的任務中,DGM的遞迴進化鏈條就會斷裂,陷入停滯。基於此,文章提出超級智能體——它們既能修改自己的任務執行行為,也能修改生成未來改進建議的過程。這實現了所謂的元認知自我修改(metacognitive self-modification):不僅學習如何做得更好,還學習如何更有效地進行改進。進一步,論文將超級智能體實例化為DGM-Hyperagents (DGM-H)。DGM-H是對DGM的擴展,其中任務解決行為和自我改處理程序序都是可編輯且可進化的,其框架如下:自指性架構:它將“任務智能體(Task Agent)”與“元智能體(Meta Agent)”整合為一個單一的、可編輯的程序。元級進化:在Hyperagents中,“改進的方法”本身也是可以被改進的。這使得系統不再要求任務與修改必須對齊,從而實現了跨領域的“元認知自我修改”。打個比方,在Hyperagents中,運動員不僅在訓練,教練也在學習如何更好地執教。由此,運動員的表現和教練的執教水平不斷螺旋上升。此外,DGM-H還改進了生成新智能體的過程(例如引入持久化記憶、性能追蹤等),且這些元級改進具有跨領域遷移和跨運行累積的特性。實驗驗證:從20%到50%的跨越實驗證明,達爾文哥德爾機(Darwin Gödel Machine)能夠通過修改自身程式碼庫實現持續的自我提升。在SWE-bench上,DGM自動將其性能從20.0%提升至50.0%。在Polyglot上,DGM的性能從初始的14.2%躍升至30.7%,遠超由Aider開發的具有代表性的人工設計智能體。這些結果證明了DGM能發現並實施有效的自我改進。而實現這一點的關鍵在於其開放式進化搜尋策略:通過從現有智能體庫中採樣生成新智能體,DGM能夠平行探索多條進化路徑。性能稍遜的“祖先”智能體在發現新方法和功能方面起關鍵作用,避免了早熟收斂。此外,DGM的改進具有廣泛的遷移性:針對Claude 3.5 Sonnet最佳化的智能體,在切換到o3-mini或Claude 3.7 Sonnet時仍能提升性能。在Polyglot基準中,Python任務上的自我改進同樣提升了Rust、C++、Go等不同語言任務的表現。 (量子位)
這些都假設智能體有無限的擴充能力,但現實生活中都受限,無限分裂的子智能體或許還比較可行?
未來時代,Token就是印鈔機
【原始碼智能前瞻】:Open Claw爆火之後,混元宣佈漲價460%,智譜宣佈漲價100%,阿里雲宣佈漲價34%。漲價的理由都是同一個——“Token呼叫量暴漲”。究其原因,Open Claw發佈後,AI第一次能真正“幹活”,接管電腦、寫程式碼、訂機票、發郵件。隨之,Token消耗邏輯發生了本質變化:以前是問答消耗(幾十Token),現在是任務消耗(幾萬Token),再往後是智能體自主執行消耗(百萬級Token)。中國日均Token消耗半年漲5倍,輝達預測未來幾年年複合增長3000%。中國廠商已經跟上。雲廠商推出一鍵部署,大模型廠商繫結自家模型,硬體廠商做端側Claw,紛紛爭奪Token的入口和定價權。黃仁勳在GTC會議上把資料中心叫作“Token工廠”,提出“每瓦Token數”作為新KPI。意思是:算力不再是賣卡,是賣Token。Token正在從技術概念,變成經濟概念。本文回答四個問題:Token為什麼是計價單位?怎麼消耗?誰在定價?定價和什麼有關?一、Token為什麼是計價單位?(一)什麼是Token?Token是AI處理資訊的最小單元。你問AI一句話,AI回你一段話,這些話在AI模型中都會被拆解成Token。Token數量要看分詞規則,舉個例子,“人工智慧”如果是常見詞,可能直接是1個Token;如果被拆開,可能是“人工”和“智能”2個Token。類比理解,Token就是AI世界的“字節(Byte)”,是模型理解語言的基本單位。(二)為什麼用Token計價?為什麼大模型用Token來計價,而不是按次或按時長計價?如果按次計算,一次簡單的問答和一次複雜的程式碼生成,消耗的算力差幾百倍。如果按時長計價,算力消耗不是勻速的,高峰時段和空閒時段差距太大。用Token計價則解決了以上問題。它是目前能找到的最精確的計量單位,主要原因如下:第一,消耗量與算力直接相關,每生成一個Token,背後都是一次完整的推理計算。第二,消耗量與任務價值正相關。金融業務的token比日常對話的token更具價值。第三,Token可分層定價。廠商可以根據Token的質量定價。Token已經從技術概念,轉變成為反映算力消耗和商業收入的計量單位。以前Token是大模型訓練過程中的副產品。現在成本重心從供給端(訓練)轉移到需求端(推理)。推理是持續的消耗,Token消耗量開始和費用直接掛鉤。二、Token是怎麼消耗的?根據IDC測算,全球Token消耗年複合增長率可達3000%。中國得日均Token消耗已經從2025年中的30兆飆升至2026年2月的180兆,半年增長了5倍之多。Token消耗與任務複雜度直接相關,呈現出明顯的層級特徵:為什麼層級間消耗差異如此懸殊?核心在於AI的“思考”方式發生了根本變化。以o1為代表的推理模型,不再採用傳統的“預測下一個詞”模式,而是在內部生成思維鏈,模型會在回答前進行多步推理、試錯、反思,這些內部過程都以Token形式消耗。Claude Code、Open Claw等智能體框架更進一步。它們將推理能力與工具呼叫結合,實現“思考-執行-驗證”的閉環迭代。一次完整的智能體任務,可能包含數十輪內部推理和外部工具呼叫,單次任務消耗從幾十萬到幾百萬Token不等。以下是不同使用者消耗量級的直觀對比:三、誰在給Token定價?Token從生產到消費,經過四個環節,每個環節的定價權不同。生產層:輝達定義成本基準。它不直接賣Token,但掌握最底層的定價權。黃仁勳提出“每瓦Token數”——在固定電力下,誰能產出更多Token,誰就能賺更多錢。新一代AI計算平台Vera Rubin平台將生成Token成本降低90%,每瓦性能提升10倍。據財報,輝達60%收入來自前五雲廠商。煉化層:模型廠商直接面對供需。國聯民生證券研報指出,當推理消耗變成生產資料,模型廠商有機會把“算力稀缺”通過分層定價轉化為毛利。輝達的分層定價印證了這一點,Token的價值由它能幹什麼決定。分銷層:雲廠商賺管道溢價。3月以來,中國雲端運算產業鏈逐級漲價。優刻得全線漲價,騰訊雲混元漲價超460%,智譜漲20%。但云廠商不只是“二道販子”,它們封裝服務(一鍵部署OpenClaw)、整合生態(阿里串起千問、釘釘、淘寶),賺取溢價和粘性。消費層:使用者用錢包投票。黃仁勳算過一筆帳:“一個研究員每天用5000萬Token,一天7500美元,但對研究團隊來說根本不是問題——因為Token帶來的價值遠超成本。”也就是說,Token的價格由它能創造的價值決定,而非生產成本。這正是Token從技術參數演變為經濟單位的底層邏輯。可以看出,輝達掌握底層成本基準,模型廠商掌握直接定價權,雲廠商掌握管道溢價,使用者用錢包進行價值投票。四、Token定價和什麼有關係?為什麼有的Token貴,有的便宜?成本、能力、供需、場景共同決定Token定價。過去主要由成本決定,現在正向供需和場景傾斜。未來,場景價值會成為主導因素。第一,成本驅動。一個1GW的資料中心,電力是物理上限。誰產出更多Token,誰就能把成本攤薄。中國廠商能打價格戰,靠的就是成本優勢:一度電0.2-0.5元(歐美0.8-1.2元),對應單張B200晶片每年能省900美元。第二,能力分層。同樣是Token,能幫企業做業務的就比閒聊的貴,因為前者價值更大。輝達分層定價正是按能力分層。第三,供需關係。這是最直接的驅動因素。2026年2月,全球前十AI模型Token總消耗量突破27兆,中國貢獻14兆,佔比超50%,一年半漲了1800倍。但是供給端產能緊張,HBM視訊記憶體、先進製程GPU受限,伺服器成本上升。阿里雲、混元、騰訊、智譜漲價,直接原因就是“全球AI需求爆發”和“供應鏈漲價”。第四,場景價值。這是未來定價的主導因素。一個Token用在個人寫周報,價值幾毛錢;但用在金融交易、自動駕駛,價值幾百倍。國信證券指出,推理更看重使用者生態和調度效率,定價權正在從“算力供給方”向“場景需求方”轉移。誰的場景價值高,誰就願意付更高價格。在PC時代,有一個經典的安迪-比爾定律,即硬體提升的性能,很快被軟體消耗掉了,使用者永遠覺得不夠快。智能時代的“安迪-比爾”正在應驗,輝達每18-24個月性能翻倍,但AI智能體瘋狂消耗Token,算力永遠不夠用。Token不再是技術參數,而是經濟概念。印鈔機已經啟動,誰能掌握定價權,誰就能分到最大一塊蛋糕。 (原始碼悟真投研筆記)