#智譜
阿里、字節、智譜,躋身全球AI十強!
中國AI越來越強了!近日,《時代》雜誌公佈了2026全球十大最具影響力AI公司榜單,阿里巴巴、字節跳動、智譜AI三家中國企業成功上榜,和亞馬遜、OpenAI、GoogleAlphabet、Meta、Anthropic、Mistral、Hugging Face一起,站在了全球AI行業的第一梯隊。這也是這份榜單推出以來,中國企業第一次一次性拿下三個席位,足以說明中國AI早已不再是單純的追趕者,已經成長為能影響全球技術路線、搭建產業生態的關鍵力量。咱們一個個來介紹這三家上榜的公司,先說阿里。阿里能入選,靠的是從晶片、雲端、大模型到落地應用的完整全端AI實力,也是國內AI產業生態化發展的典型代表。在底層算力上,平頭哥自研的AI晶片已經規模化交付超47萬片,牢牢守住算力自主可控的根基;在模型層面上,千問大模型累計下載量突破10億次,衍生出的各類模型超20萬個,打造出全球規模頂尖的開源AI生態,就連Airbnb、Pinterest這樣的國外公司,都在把千問當作核心技術支撐;應用端更是深度融入淘寶、支付寶、高德等自家生態,企業級智能平台悟空也在加速落地,同時覆蓋普通消費者和各行各業的產業需求。這份實力也直接體現在資本與權威榜單上,目前阿里港股總市值約2.51兆港元,美股市值近2931億美元,是國內為數不多的兆級科技巨頭。在2025年《財富》世界500強中,阿里位列全球第63位,在全球網際網路科技企業中穩居第一梯隊,綜合實力和行業影響力毋庸置疑。接著說宇宙廠——按照《時代》的評價,字節早就不只是TikTok的母公司,已經徹底轉型成一家以AI為核心的科技巨頭。底氣首先來自硬實力與資本的認可度,據多家機構評估,字節跳動最新估值已突破6000億美元,穩居全球第二大獨角獸、中國第一獨角獸,僅次於 OpenAI,超過SpaceX,甚至高出阿里一大截、直逼騰訊,屬於是全球未上市企業裡的絕對頂流。而AI業務正是支撐這一估值的核心引擎,旗下AI助手豆包周活已經衝到1.55億,春節期間日活都輕鬆破億,也讓中國早早邁入AI助手大規模普及的行列。背靠抖音7.7億月活的龐大生態,字節把AI能力融入了內容創作、雲服務、智能互動等各個環節,打通了應用、大模型到底層基建的完整閉環,靠著億級使用者跑通AI商業化,這一點是很多海外同行根本比不上的。再來看智譜AI,今年1月在港股成功上市,也是國內第一家登陸港股的大語言模型企業,IPO一共募資5.58億美元,這次入選榜單,實打實撐起了中國AI 的硬核技術門面。智譜自研的GLM-5大模型足足有7440億參數,開源之後,多項專業測評裡直接超越Google Gemini 3 Pro,在程式設計和智能體任務上,性能已經逼近GPT-5.2 和Claude Opus 4.5。《時代》還特意提到,智譜不用依賴西方高端晶片,也能做出頂尖大模型,給全球AI發展走出了一條不屬於西方的全新路子。智譜港股總市值約3640億港元,上市僅三個多月股價較發行價暴漲超7倍,穩居全球上市純AI大模型公司第一、港股科技股第一梯隊,市值超越京東、百度等老牌網際網路巨頭,成為全球AI領域最受資本追捧的硬核技術標竿之一。《時代》選這份榜單,不只是看模型參數和技術硬指標,更看重產業影響力、技術路線影響力和實際社會價值。三家中國企業剛好形成完美互補:阿里專注全端佈局和產業賦能,字節主打消費端AI的大規模落地普及,智譜深耕基礎大模型的技術攻堅,一起勾勒出中國 AI“應用帶頭拉動、技術做硬核支撐、生態形成完整閉環”的特色發展模式。回想過去兩年前,全球頂級AI榜單裡,中國企業還只是零星出現,現在一次性拿下三席,背後是中國AI在技術、產業、資本、人才各方面都走向成熟的體現。 (BAT)
港股AI企業受青睞!智譜、MiniMax獲多隻QDII重倉,產品業績亮眼
根據公募基金2026年一季報,兩家在今年1月IPO的AI技術公司,即智譜、MiniMax,已進入頭部公募重倉股名單,吸引了易方達、廣發基金、中歐基金等抱團買入。(圖/東方IC)進一步來看,智譜和MiniMax於2026年1月先後登陸港股。截至4月24日收盤,智譜報935港元/股,較116.20港元/股發行價,上漲704.65%;MiniMax報777.5港元/股,較165港元/股發行價,上漲371.21%。舉例來看,截至2026年一季度末,MiniMax成為了易方達全球配置混合(QDII)第一大重倉股,該QDII產品的基金經理為張清華。截至4月23日,易方達全球配置混合(QDII)A(人民幣)年內收益率接近37%。再者,一季度報顯示,易方達旗下另一隻QDII產品——易方達全球優質企業混合期末持有Minimax29.47萬股,持倉佔比6.85%,為第一大重倉股。同期末,易方達全球優質企業混合(QDII)A(人民幣)年內收益率達29.35%。對於中歐港股數字經濟混合發起(QDII),截至一季度末,長飛光纖光纜為其第一大重倉股,持倉佔比達9.37%。此外,智譜為其第四大重倉股,持倉佔比5.54%;Minimax為其第八大重倉股,持倉佔比3.8%。截至4月24日,中歐港股數字經濟混合發起(QDII)A今年以來收益率18.58%。不僅如此,截至4月23日,廣發全球精選股票(QDII)人民幣A年內收益率23.55%,其披露的一季報顯示,基金經理李耀柱重點買入智譜,而這家AI企業晉陞為該QDII第二大重倉股。在一季度報中,李耀柱表示,海外頭部模型廠商仍處於高頻迭代窗口,競爭重心正由單一模型能力提升轉向系統級能力與生態建構,Agent成為關鍵突破口。 (總財)
Token大躍進
詞元(Token)呼叫量的指數級增長,正在帶來一批公司估值的飆升。被稱為“Token第一股”的迅策科技,上市僅108天,股價較發行價上漲近6倍,最新總市值已經達到1050億港元。今年1月8日登陸港股的智譜,上市首日市值約580億港元,交出首份年度成績單後股價迅速,突破1000港元大關,市值也衝破4000億港元。智譜CEO張鵬將2026年的關鍵詞定義為“Token量”,認為智能上界突破與Token消耗的指數級增長一起,共同構成了AGI時代的商業價值。尚未上市的公司之中,月之暗面上個月剛完成新一輪超10億美金融資,估值達到180億美元,而在去年底的一輪5億美元融資中,其估值僅為43億美元。這種估值的短時間躍遷,與今年2月OpenClaw宣佈將Kimi K2.5設為其官方主力模型有著直接聯絡。K2.5發佈僅一個月,月之暗面ARR(年度經常性收入)即突破1億美元,業績增速不僅支撐了估值提升,也打開了公司IPO的可能性。無論國內國外,資本市場都在以驚人的熱情為Token經濟的騰飛定價,未來幾個月裡,我們將有機會聽到各種各樣的財富神話。這場轟轟烈烈的Token經濟大繁榮,正在以“大躍進”的方式完成對所有人的認知普及,以及對風險的累積。增長聊天Bot剛問世的時候,很少有人能想到2年之後,僅僅豆包這一款大模型的日均Token使用量就可以突破120兆。即便按照每百萬Token兩塊錢這個有點便宜的價格來計算,這也意味著每天有3億元的真實經費在豆包上空燃燒。事實上,國內外各家大模型公司都在上演著類似的劇本,全球範圍內的Token日均消耗量都在以指數級規模增長。工信部旗下中國資訊通訊研究院發佈的資料顯示,截至2026年3月,中國日均Token呼叫量已突破140兆,較2024年初暴漲超過1000倍。全球最大的AI模型API聚合平台OpenRouter則統計到,其平台每周處理的Token數量從2025年3月的1.62兆飆升至2026年3月的16.90兆,一年之內增長超過10倍。OpenRouter連接著Anthropic、OpenAI、Google、Meta等幾乎所有主流模型廠商的API介面,它的周度Token消耗曲線,本質上就是全球AI應用活躍度的即時監測圖。這條Token消耗曲線幾乎是垂直向上的,既不像GDP的線性增長,也不像網際網路使用者滲透率的S型曲線,完全走出了人工智慧經濟自己的發展趨勢。是什麼在驅動Token需求的大爆發?答案是人工智慧的技術演進。早期AI應用以聊天機器人(Bot)為主,使用者輸入一句話,模型返回一段回答,一個來回消耗幾百到幾千Token,完事即止。但從去年下半年開始,以Agent和Claw為代表的新型應用範式以更快的速度、更廣的範圍流行開來。它們的共同特徵是讓AI不再只是“一問一答”的對話工具,而是一個能夠自主規劃、呼叫工具、長周期執行任務的數字員工。這種技術架構底層的變化,讓Token消耗量以很多使用者意想不到的方式大幅增長。行業內部測算表明,完成同一個業務目標的情況下,Agent模式消耗的Token大約是Bot模式的50到200倍。這是因為,Agent在執行任務時需要將整個歷史對話上下文全量攜帶,一個複雜任務動輒累積數十萬Token的上下文窗口。而且Agent每次思考都需要經過多輪推理,都會觸發API請求,還需要持續載入系統配置檔案和記憶庫,以維持任務的一致性和個性化體驗。這導致Agent模式下的Token消耗,更像是個不受使用者主觀控制的黑箱操作。更值得警惕的是,這個階段Token表面的消耗量,並不等同於真實的需求量。當AI轉型成為企業的政治正確,當Token消耗量被越來越多的公司納入員工的考核指標,一種“Token偽需求”的情況就誕生了。Meta內部已經有團隊將Token消耗量作為AI滲透率的衡量標尺,部分員工為了“顯得自己很懂AI”,會故意運行大量冗餘的模型呼叫任務;國內騰訊等大廠也被爆料存在類似現象,一些業務線甚至發明了“Token刷量”的灰色操作。這種為了不被時代拋棄而製造多餘的消耗、誇大不存在的業績的行為,充滿了大躍進式的荒誕。核心當Token消耗量以指數級增長,一個嚴肅的產業問題也浮出水面——誰來買單,誰會受益?4月15日,國家資料局就《關於推進行業高品質資料集建設行動的實施方案(徵求意見稿)》公開徵求意見,首次在官方政策檔案中提出“探索詞元交易等新型交易模式,建構以詞元為基礎,可量化、可定價的資料集價值體系”。從“詞元交易”被寫入國家頂層設計的那一刻起,Token就不再僅僅是一個技術概念,而是會逐漸成為人工智慧經濟的法定計價單位。某種意義上來說,Token化收費是人工智慧經濟的核心。迅策科技被稱為“Token第一股”,就是因為其率先在商業模式上做出了調整,全面轉向了按Token消耗付費與分成的新模式,建構了“收入=Token價格×呼叫次數×模組應用數”的增長模型。目前,Token付費收入佔迅策科技總營收的5%左右,公司預計到年底這一比例將快速提升至20%至30%。市場對迅策的估值邏輯也因此發生了重大變化,脫離了傳統市銷率的限制,有了更大的想像空間。迅策科技的模式也說明,在人工智慧經濟中,大模型廠商大機率會扮演“精煉廠”的角色,即將底層的算力與資料,加工成可以被直接消費、以Token計價的“成品”、“結果”,並掌握著價值分配體系中的關鍵生態位。而云服務廠商大概會扮演著“發電廠”和“電網”的角色,它們不直接定價Token,卻決定了Token的底層成本。以阿里雲為例,截至2026年2月底,阿里雲2026財年累計外部商業化收入突破1000億元,AI相關產品收入延續高增長態勢,實現連續第十個季度三位數同比增長。緊隨需求而來的就是漲價,上周阿里雲四天連發三條產品漲價公告,調整百煉部分模型單元服務價格及DataWorks部分API免費額度——雲服務廠商對Token成本的影響力,可見一斑。雲服務廠商在傳統架構中主要收入來自虛擬機器、儲存與網路等基礎設施計費,進入Agent時代後,它們完全可以推動按資源(Token)使用量計費,並通過Agent平台訂閱、開發者生態套件、行業級解決方案等獲得長期合同收入。算力廠商則像是更上游的原材料、燃料供應方,輝達的高端GPU至今仍然處於產業鏈中最核心位置,高頻寬記憶體(HBM)如今更是供應緊張,三星、SK海力士及美光三大儲存原廠一邊產能受限,一邊毛利率抬高。也許有人會擔心算力實際已經過剩,輝達和儲存廠商的股價已經過高,但是這都不影響Token化收費的歷史處理程序。Token收費,讓整條產業鏈的價值分配有了清晰的計算依據。就像千瓦時的確立讓電力市場得以形成,流量/曝光量成為抖音和視訊號的收費標準單位一樣,Token正在讓人工智慧經濟從“感覺有用”走向“可以算帳、可以收稅”,成為一種真實存在的經濟構成。狂歡Token化收費,讓人工智慧經濟運轉的邏輯變得清晰起來,但是人工智慧作為一種劃時代的技術革命,其經濟運轉的邏輯,是否與傳統的經濟學規律一致呢?至少傳統經濟學的供需平衡理論,在人工智慧經濟中並不完全適用。傳統模型中,供給和需求是兩條獨立的曲線相交,而在人工智慧經濟中,供給本身會通過資料飛輪改進供給質量。需求曲線向右移動不是因為外部收入變化,而是因為供給曲線本身向下、向右移動了。目前這個階段,我們更可能看到蒸汽時代的“傑文斯悖論”在人工智慧時代重演。所謂的傑文斯悖論是指,當蒸汽機效率提升、單位馬力耗煤量下降時,煤炭的總消耗量反而暴增,因為更便宜的蒸汽動力催生了更多工廠、火車和輪船。現在Token的單位生產成本越低,願意消耗Token的群體就越多,捨得使用Token而非人力的場景就越多,最後Token的總成本就越高,或者說人工智慧經濟的總價值就越大。根據國內媒體的資料統計,過去兩年多,Token生產成本下降了超過99%,GPT-4每百萬Token的成本已經從37.5美元下降到了2025年的0.14美元。但根據矽谷知名風投Menlo Ventures,全球企業2025年在AI上的支出反而比2024年增長了3.2倍。如果這種趨勢延續下去,那麼那怕單位 Token的價格趨近於零,全人類消耗的 Token 總價值(總量 × 單價)以及它撬動的 GDP 比重,也可以成百上千倍的增長。這正是智譜、MiniMax等公司在巨額虧損的情況下,仍然被資本市場賦予超過許多傳統網際網路企業估值的深層原因——市場定價的不是今天的利潤,而是未來Token經濟總價值。更何況,用Token生產出來的東西,本身也會越來越有價值。同一百萬個Token,在不同場景下創造的價值差距可達十萬倍,其價值完全因執行的任務而異——用於閒聊的Token只值幾分錢,用於寫程式碼的Token值幾百幾千元,用於量化投資、企業併購的Token完全可以價值幾萬元。史丹佛大學2026年AI指數報告估算,僅2024年生成式AI就為美國消費者創造了約1720億美元的消費者剩餘,而使用者獲得的價值遠超實際支付的費用。值得警惕的是,在AI代替了大量人類的腦力勞動後,傳統的勞動力供給理論也會面臨挑戰。傳統的需求曲線會因為購買力萎縮而整體坍塌,而供給端因為自動化依然強勁,這就是凱恩斯所說的“技術性失業導致的有效需求不足”。只不過在這個階段,圍繞著Token消耗量指數級增長的一切都還披著繁榮的外衣,引領著產業鏈上下游和資本市場的狂歡。但是歷史已經反覆證明了,每當一種新技術被資本市場賦予無限想像空間,泡沫總是比價值更先抵達終點。 (巨潮WAVE)
中國AI四小龍,全部去見了總理
不是百度,不是阿里,不是騰訊。總理的座談會上,中國AI創業江湖的"四小龍"終於湊齊了一桌。從2024年3月到2026年4月,智譜AI、DeepSeek梁文鋒、MiniMax閆俊傑、月之暗面楊植麟,先後坐到了總理對面。四個男人,覆蓋了80後、85後、90後三個世代;廣東潮汕與湛江,河南商丘縣城,浙江杭州錢塘江畔,串聯起中國AI最生猛的草根逆襲史。他們帶著各自的"技術圖騰":一個逆勢漲價,一個開源封神,一個不信天才,一個搖滾反叛。這是中國AI獨有的故事。智譜AI 清華土著第一家受邀的是智譜AI。2024年3月,調研新質生產力座談會,第一個出場的AI公司就是它。張鵬,標準的清華"土著",清華電腦系本碩博連讀,在清華園待了近十年,連創業都是清華老師唐傑帶的隊。圈內人都說,他身上那股"技術原教旨主義"的勁兒,很清華。2026年1月,智譜AI在香港上市,成為"大模型第一股"。張鵬有一句很狠的話:"智能上界決定了定價權。"當所有人在價格戰裡殺紅了眼,比誰更便宜時,他逆勢漲價。邏輯很簡單:只有把模型能力做到極致,才有資格定價格,而不是靠燒錢補貼換市場。這種底氣來自智譜的"技術護城河",自研的GLM架構,不走尋常路,而是用"自回歸填空"的原創設計。2026年發佈的GLM-5採用超大規模MoE架構,在國產晶片上跑出了比雙卡叢集還強的性能。智譜的CodeGeeX程式碼大模型,在程式設計圈程式設計師裡的口碑,被稱為"國產Copilot最強平替"。張鵬相信,AGI不是炒概念,而是一行程式碼一行程式碼摳出來的工程問題。梁文鋒 全球AI都意外第二家,DeepSeek。2025年1月20日,政府工作報告座談會,梁文鋒第四個發言。鏡頭裡的他,眼神平靜得像一潭深水。1985年,梁文鋒出生在廣東湛江吳川,一個連五線城市都算不上的地方,父親是當地小學老師。2002年,17歲的他以吳川一中"高考狀元"的成績考入浙江大學電子資訊工程專業。2008年全球金融危機,在浙大讀研的梁文鋒嗅到了機會。他拉著同學,用機器學習探索全自動量化交易。2015年,30歲的梁文鋒創立幻方量化。6年後,管理規模突破千億,躋身中國"量化四大天王"。但外界不知道的是,2019年,他豪擲2億元搭建“螢火一號”,搭載1100塊消費級顯示卡;2021年,又砸10億元建“螢火二號”,搭載萬張輝達A100"。別人炒股賺錢買房,他炒股賺錢買顯示卡。2023年,梁文鋒帶著這些"計算軍火"殺入大模型戰場。2025年,DeepSeek-R1橫空出世,用557萬美元的訓練成本(僅為GPT-4的零頭),干翻了矽谷的一眾巨頭。Meta、微軟連夜研究他的技術路線。他最著名的一句話是:"中國AI和美國真實的gap,是原創和模仿的差距。"這句話,成了中國AI行業反攻的起點。梁文鋒極其低調,卻在2022年以"一隻平凡的小豬"名義,向慈善機構捐款1.38億元。閆俊傑 不相信天才第三家,MiniMax。2026年1月,討論"十五五"規劃的座談會上,閆俊傑坐在對面。1989年,閆俊傑出生在河南商丘的一個縣城,高中在縣城中學度過。。2006年考入東南大學數學學院,隨後進入中科院自動化所碩博連讀(2015年博士畢業於中國科學院自動化所模式識別國家重點實驗室),並在清華大學電腦系從事博士後研究。2014年,25歲的閆俊傑在百度深度學習研究院實習。那是中國AI的"黃埔軍校",他在這裡第一次直觀感受到大規模算力的顛覆性價值。據說,他一個人就用掉了百度當時三分之一的GPU算力做實驗,還拿下了百度獎學金。轉折發生在2021年春節。閆俊傑回河南老家,外公說想寫一本回憶錄,但不會打字,也沒辦法組織語言。這個做了十年AI的博士突然意識到:他做的技術,對一個想寫回憶錄的老人來說,一點用都沒有。那一刻,他決定要做"普通人能用上的AI"。2021年底,離職創立MiniMax。閆俊傑有一句座右銘:"AI不是神秘黑盒,而是可用第一性原理解析的工程問題。AGI是科學,不是魔法。"他旗幟鮮明地反對"天才論",認為大模型領域貢獻前50的人,可能沒一個在中國公司工作,中國公司要做的就是"聚攏一批素質優秀的人,做一個成長型組織"。四小龍裡,MiniMax是唯一放棄盲目追求"超級模型"的,專攻Agent和程式設計。他們的M2系列,被稱為"國產Claude平替",最新M2.7實現了"模型自己訓練自己"的AI進化。更驚人的是成本,MiniMax用OpenAI約1%的研發投入(累計4.5億美元),實現了全模態技術全球領先,團隊385人,平均年齡29歲,70%收入來自海外。2026年3月,MiniMax市值突破3800億港元,超越了曾經的"導師"百度。在MiniMax內部,閆俊傑有一個花名叫“IO”,既是電腦語言的輸入輸出,也是DOTA裡那個專職輔助隊友的英雄。這很符合他的自我定位:“成功是體系和組織的勝利,不是個人的勝利。”他曾評價自己“可能只是二流研究者”,但堅信二流研究者加上一流組織,能打敗一流研究者的單打獨鬥。楊植麟 "Token經濟學"第四家,月之暗面。2026年4月10日,經濟形勢座談會,楊植麟作為科技企業家出席。1993年,楊植麟出生在廣東汕頭。這是四小龍裡唯一的90後,潮汕人。他的成長史像一部青春電影:高中時零程式設計基礎,被選拔進資訊學奧賽培訓班,拿下廣東一等獎,保送清華。但他放棄保送,以667分的高考成績成為汕頭市理科狀元,考入清華熱能工程系。大二轉專業進入電腦系,師從唐傑教授。在清華,他還是搖滾樂隊Splay的鼓手和詞曲作者,曾晉級清華校園歌手大賽原創決賽。他坦言,選擇電腦專業,是因為村上春樹的一篇小說,讓他對"深夜寫程式碼讓科技落地"的角色印象深刻。2015年,他進入卡內基梅隆大學(CMU),師從蘋果AI負責人Ruslan Salakhutdinov和Google首席科學家William Cohen。4年時間,他完成了通常需要6年的博士課程,提出的Transformer-XL與XLNet模型,成為自然語言處理領域的里程碑,至今被引用上萬次。他參與過Google Gemini、Google Bard、盤古NLP、悟道等大模型的研發。2023年創業,公司名"月之暗面"(Moonshot AI)來自他崇拜的搖滾樂隊Pink Floyd的專輯《The Dark Side of the Moon》。楊植麟最廣為人知的觀點是:"Token消耗在未來可能將直接意味著GDP產出。"誰消耗的Token越多,誰的經濟就越活躍。在AI Agent時代,這就是新的GDP演算法。技術路線上,楊植麟是"長文字"和"原生多模態"的堅定信徒。2026年發佈的Kimi K2.5,上下文窗口擴展到200K,並引入了Linear注意力架構和Attention Residuals(注意力殘差),讓馬斯克都直呼"令人印象深刻"。他提出了"智能體叢集"(Agent Swarms)的概念,認為未來的智能將從單智能體向動態生成的叢集進化。2026年3月,月之暗面完成新一輪融資,投前估值180億美元(約1300億人民幣),帳上現金儲備超過100億元。但楊植麟說,"短期內不著急上市"。小結一個時代的註腳。你看這四個人:一個清華土著,一個浙大天才,一個縣城做題家,一個潮汕搖滾青年。46歲,40歲,36歲,33歲。當有的AI公司還在套殼做大模型、卷流量、應付AI考試時,這四個人,正在卷"智能上界"、卷"原創架構"、卷"國產算力"、卷"全球化"。張鵬說:"智能上界決定定價權。" 梁文鋒說:"中國AI不能永遠跟隨。" 閆俊傑說:"AGI是科學,不是魔法。" 楊植麟說:"Token消耗就是GDP。"四句話,四個技術哲學,四種商業路徑。為什麼選擇見他們,而不是見網際網路巨頭?中國AI,正在從"應用創新"轉向"硬核創新",從"跟隨者"轉向"規則制定者"。四小龍全部到位,中國AI的牌桌,重新發牌了。 (奇偶工作室)
開源模型首超Opus4.6!智譜GLM-5.1登場,14小時後CUDA專家被沖了
最佳化CUDA Kernel這件事,剛剛被AI狠狠地衝擊了一波。因為現在,給AI十四個小時,它就能幫你把CUDA Kernel最佳化,加速比從2.6×推至35.7×!什麼概念?以前人類資深CUDA工程師要完成這個任務,需要數月反覆測試、調優、推翻重來才行;但現在,AI在你睡覺的時候就能解決掉。而且AI在這個過程中還展現出了專家級的直覺。例如在最佳化初期,它嘗試在現有高層框架內尋找解法,但很快通過自主跑測試發現性能觸及了天花板,然後它便做出了人類專家才有的決策——自主判斷放棄高層框架,直接轉向底層C++進行硬核重寫。整整14個小時裡,這個AI主打一個全自動:AI自己發現瓶頸,自己改變技術堆疊,自己重新編譯,自己測試。那這到底是何許AI是也?不賣關子,正是大家熟悉的,來自智譜的開源模型——GLM-5.1。隨著這次長程任務(Long Horizon Task)能力的提升,智譜官方也宣佈了一個重要的突破:首次解鎖了開源模型與當前全球最頂尖閉源模型Claude Opus 4.6的全面對齊!嗯,是妥妥穩坐全球最強開源模型寶座的感覺了。而且,從更多的權威評測榜單中來看,也是印證了這一點。在被稱為“軟體工程能力試金石”的SWE-bench Pro基準測試中,GLM-5.1刷新了全球最佳成績,直接超越Claude Opus 4.6、GPT-5.4等一眾頭部模型,拿下全球第一:甚至在海外網友們的圈子中,已經吹起了棄用Claude Max的風了:它的手感和Opus一模一樣,使用額度是Claude Code的3倍,成本卻只有1/3。HuggingFace CEO也出面站台,稱SWE-Bench Pro中性能最強的模型開源了:而這一切成績的背後,正是智譜面向小時級的長程任務能力。給AI幾個小時,一切都不一樣了當前主流的大模型,可以說大多數還是處於“分鐘級互動”的階段。但到了GLM-5.1這邊,它的交付單位就不同了——一個完整的項目。接下來,我們就通過實測的方式,來看下GLM-5.1的實力到底幾何。呼叫工具1000輪,最佳化真實機器學習模型負載第一個實測,我們順著前面的CUDA的例子,繼續讓GLM-5.1進行一場考驗:KernelBench Level 3最佳化基準,這一基準涵蓋50個真實機器學習計算負載,主打一個還原真實工業場景,考驗的是端到端的完整最佳化能力而非單一算子偵錯。在超過24小時的不間斷迭代中,GLM-5.1全程自主發力,無需人類專家干預,一遍遍完成“編譯—測試—分析—重寫”的閉環循環,最終交出了這樣的結果——3.6倍幾何平均加速比,而作為對比,torch.compile max-autotune模式僅能達到1.49倍,差距直接翻倍不止!從這個過程中可以看到,GLM-5.1能夠自主編寫定製Triton Kernel和CUDA Kernel,運用cuBLASLt epilogue融合併實施shared memory tiling與CUDA Graph最佳化。這些最佳化策略覆蓋了從高層算子融合到微架構級調優的完整技術堆疊,每一步都是模型的自主決策。結果再次表明,在GPU核心最佳化這一傳統上高度依賴專家經驗的領域,AI模型已經展現出從問題分析、方案設計到迭代調優的端到端自主工作能力。1小時從零建構MacOS桌面環境在這個實測中,我們給GLM-5.1扔了一份3000字的PRD,核心要求只有一個:從0開始復刻MacOS核心UI與互動,不僅要前端殼子,還必須包含窗口管理器、Dock欄調度、以及模擬的底層檔案系統。這是一個標準的前端工程團隊至少需要數天才能打磨出原型的任務,但在GLM-5.1這裡,時間被壓縮到了小時等級。瞧,待它分析完任務之後,自己就開始唰唰地程式設計了:1個小時之後,在沒有任何人工參與的情況下,一個MacOS的桌面環境,就這麼水靈靈地誕生了!可以看到,更改桌面背景、放大縮小Docker、終端命令執行、系統自帶的截圖功能等,統統都能實現。而在智譜官方的demo中,展示了GLM-5.1耗時8小時實現的更加複雜的Linux系統:執行了1200多步,完整的桌面、窗口管理器、狀態列、應用程式、VPN管理器、中文字型支援、遊戲庫等……相當於一個4人團隊一周的開發工作量。不得不說,現在GLM-5.1的每一次提交,都是具有實質意義的系統級演進。全自動重寫屎山程式碼寫程式碼的人都知道,比從零寫一個新項目更痛苦的,是重構別人留下的屎山程式碼。但現在有了GLM-5.1,我們可以把這個任務交給它來處理了。例如這段程式碼就堪稱是屎山中的經典:變數名完全無意義、五層巢狀if、重複計算總和三遍、全域變數到處亂改、函數幾百行不拆分……能運行嗎?能運行;噁心嗎?也是真噁心。而在GLM-5.1隻需半小時的自動重寫之後,一份註釋清晰、符合標準的程式碼就誕生了:655次迭代,打破向量資料庫性能瓶頸如果說重構程式碼還只是把已有的東西做好,那向量資料庫最佳化,考驗的就是AI自主迭代、持續突破的能力。這也或許正是人類資深工程師最核心的價值。在這項測試中,GLM-5.1的需求是最佳化現有向量資料庫的查詢性能,儘可能提升QPS。隨後,它開啟了完全自主的“測試-分析-最佳化-再測試”閉環。每一輪最佳化後,它都會主動跑完整的Benchmark,獲取QPS、延遲、記憶體佔用等核心資料,自主分析性能瓶頸。最終,在655輪迭代之後,GLM-5.1把向量資料庫的查詢吞吐從初次交付的3108 QPS一路推到21472 QPS,提升到初始正式版本的6.9倍。AI能獨立工作多久,成了新標準之所以GLM-5.1這次能夠炸場,本質上是它踩中了AI行業的下一個核心賽點:長程任務(Long Horizon Task)能力。2025年3月,全球頂尖的AI安全研究機構METR(Model Evaluation and Threat Research)便提出了一個徹底改變行業認知的新指標,叫做Task-Completion Time Horizon(任務完成時間線)。這個指標的核心思想是,不再用做題的精準率來衡量模型有多聰明,而是用時間來衡量它能獨立完成多長時間的人類專家任務。研究顯示,前沿模型的時間線每7個月就會翻一倍,這條指數曲線,被MIT Technology Review稱為“AI領域最重要的一張圖”。紅杉資本更是在2026年初直接宣告:“這就是AGI的核心方向”,並直言:2023-2024年的AI,是只會對話的“talker”,而2026-2027年的AI,將成為能真正落地做事的“doer”。而GLM-5.1,是全球第一個在真實工程任務中,驗證了8小時持續工作能力的開源模型。它能在單次任務中,持續、自主地工作長達8小時,過程中自主規劃、自主執行、自主測試,碰壁時主動切換策略,出錯後自行修復,最終交付完整的工程級成果。GLM-5.1之所以能做到這一點,核心源於三個維度的系統性技術突破:第一,更強的長程規劃與目標保持能力。它能把一個複雜的大目標,拆解為可執行的多階段計畫,並且在長達十幾小時、上千步的執行鏈路中,始終圍繞最終交付目標推進。簡單來說,就是幹到第十步,還記得第二步定的規矩。第二,更穩的自適應糾錯與持續執行能力。它實現了程式碼編寫、工具呼叫、環境偵錯、API對接等多個環節的穩定銜接,中途出錯時,不會停下來等人工介入,而是會自主查看錯誤日誌、定位問題根源、修復bug,甚至自己寫回歸測試用例驗證修復效果。第三,更好的狀態延續與上下文整合能力。面對長時間跨度、多輪反饋和百萬級token的上下文資訊,它能穩定追蹤已完成的工作、當前所處的階段和下一步的核心動作,持續整合新的資訊,保持整個執行鏈路的一致性。開源模型看中國,更得看智譜GLM-5.1的出現,不僅是模型能力的升級,更改寫了全球大模型行業的敘事邏輯。長久以來,中國開源模型始終帶著追趕者的標籤,與美國頂尖閉源模型存在差距,而GLM-5.1徹底打破這一局面:它在權威榜單上對齊Claude Opus 4.6,在SWE-bench Pro等核心工程指標上實現反超,讓中國開源AI在核心工程能力上與全球前沿並駕齊驅。更重要的是,它的變革遠超模型本身,正重構兆級IT服務市場的底層邏輯。AI Coding的進化有清晰路徑:從程式設計師提效工具,到降低程式碼門檻,再到能自主做事的初級工程師,而GLM-5.1的Long Horizon能力,直接將AI推向能持續工作數小時、交付完整項目的新階段。當AI的交付單位從一行程式碼變為一個完整項目,便衝擊了整個軟體工程的生產關係——4人團隊一周的工作量、資深工程師數月的最佳化任務,它數小時就能完成,這將重構多個行業的定價與人力配置邏輯。當然,我們不必陷入AI會替代程式設計師的無謂焦慮。就像當年電腦的普及,沒有淘汰會計這個職業,只是淘汰了不會用電腦的會計;AI的到來,也不會淘汰開發者,只會淘汰不會駕馭AI的開發者。GLM-5.1的出現,真正給整個行業拋出的核心問題是:當AI已經能自主完成長達數小時的複雜長程任務,實現從規劃、執行、糾錯到完整項目交付的全閉環時,人類的不可替代性到底在那裡?答案或許就是定義問題、創造價值、做出核心決策的能力,畢竟這是AI暫時無法替代的核心護城河。而對中國AI行業而言,GLM-5.1隻是開始,當開源模型達到全球頂尖工程能力、AI從對話者變為執行者,行業必將迎來更徹底、更深刻的變革。 (量子位)
Day-0支援|摩爾線程完成智譜GLM-5.1極速適配
高效支撐長程任務與程式碼生成今日,摩爾線程在其旗艦級AI訓推一體全功能GPU MTT S5000上,成功實現了對智譜新一代旗艦模型GLM-5.1的Day-0極速適配,提供推理部署和訓練復現全流程支援。依託MUSA軟體棧強大的生態相容性,摩爾線程技術團隊基於高性能 SGLang-MUSA推理引擎及TileLang-MUSA算子程式語言,採用PD分離架構完成深度調優,在 MTT S5000 上實現 GLM-5.1 的高效、高精度推理。這一成果彰顯了國產算力基礎設施對前沿 SOTA 模型的快速響應能力,也為行業樹立了軟硬協同應對複雜 AI 推理場景的新標竿。GLM-5.1是智譜迄今最智能的旗艦模型,也是目前全球最強的開源模型。GLM-5.1大大提高了程式碼能力,在最接近真實軟體開發的SWE-bench Pro基準測試中超過GPT-5.4、Claude Opus 4.6,刷新全球最佳成績。值得一提的是,在模型整體性能大幅提升外,GLM-5.1還在長程任務(Long Horizon Task)處理能力上實現了顯著突破。和當前分鐘級互動的模型不同,GLM-5.1能夠在一次任務中獨立、持續工作超過8小時,期間自主規劃、執行、自我進化,最終交付完整的工程級成果。針對GLM-5.1的長程任務與程式碼生成特性,摩爾線程基於自研MUSA架構與SGLang-MUSA、TileLang-MUSA等關鍵技術,完成了系統性的算子適配與推理性能調優。MTT S5000單卡AI算力(稠密)可達1000 TFLOPS,支援FP8到FP64全精度計算,其原生FP8加速顯著提升推理效率;結合高效KV Cache管理,有效支撐極長上下文的視訊記憶體需求;同時,PD分離架構進一步解耦Prefill與Decode階段,降低長序列生成中的干擾,保障持續任務的高吞吐與低延遲。此外,MTT S5000提供784GB/s的卡間互聯頻寬,為大規模部署帶來彈性擴展能力。通過軟硬協同最佳化,MTT S5000能夠穩定承接GLM-5.1的長程任務吞吐與工程級程式碼推理表現。從GLM-4.7到GLM-5.1,摩爾線程已連續實現發佈當日極速適配。這既體現了MUSA架構對主流AI生態的深度相容,更標誌著國產全功能GPU已具備大模型“從適配到部署”的全鏈路支撐能力。摩爾線程將持續夯實算力底座,助力開發者快速應用前沿模型,共建更成熟的國產AI生態。來源:摩爾線程 (芯榜+)
智譜和MiniMax,誰是中國的Anthropic?
“智譜和MiniMax,誰才是中國的Anthropic?”今年1月8日,智譜在港交所成功上市。緊接著的1月9日,MiniMax也完成了掛牌。兩家公司目前都還處於虧損狀態,在研發上的投入遠超營收規模。但上市後的資本市場表現極好,目前合計市值達到千億美元等級。這個定價遠高於海外行業標竿公司。今年初,Anthropic在完成G輪融資後估值達3800億美元,年化營收140億美元,對應P/S約為27倍。相比之下,智譜2025年營收為7.24億元人民幣,市值峰值約510億美元,P/S超過500倍;MiniMax 2025年營收7900萬美元,市值峰值約490億美元,P/S超過600倍。這種極高溢價有多方面原因,比如直接受益於OpenClaw和龍蝦浪潮;流通盤稀缺,60%戰略配售鎖定,極少籌碼在二級市場流通;以及市場在為“中國版Anthropic”的故事買單。MiniMax和智譜都已經公佈了上市後的首次年報,我們從當前的財務結構、商業模式和增長質量分析,誰在商業路徑上更接近Anthropic?To B交付 vs To C訂閱智譜和MiniMax都在發力大模型,但營收結構幾乎是鏡像。智譜深耕國內政企市場,主要收入依賴於中國本土的政企客戶。2025年,73.7%的營收(約5.34億元人民幣)來自私有化部署,這些部署往往是基於行業和企業需求高度定製化的。在市場滲透率方面,國內排名前十的網際網路公司中有9家深度整合了GLM系列模型。全年總營收達7.24億元人民幣,同比增長131.9%。MiniMax聚焦海外C端與創作者生態,核心收入則來源於海外使用者。2025年,總營收達7900萬美元,同比增長158.9%。這其中,73.0%的收入(約5766萬美元)來自中國大陸以外的國際市場。產品端高度依賴AI原生應用,佔比67.2%,主要由AI角色扮演應用Talkie、視訊生成工具Hailuo AI等產品驅動。兩家公司體量相近,但結構完全不同:一家在國內做ToB私有化交付,另一家在海外做ToC及平台訂閱。這種差異直接決定了兩者不同的財務表現。判斷大模型公司商業健康度,毛利率的走向比單純的營收增速更有意義。智譜的毛利率正面臨下行壓力。2024年其整體毛利率為56.3%,到了2025年降至41.0%。核心的私有化部署業務毛利率更是從66.0%跌至48.8%,主要原因是投入了更多交付資源以滿足客戶需求。這種重交付的模式意味著極高的人力成本。2025年,智譜的銷售及行銷費用高達3.91億元人民幣,幾乎是其雲端部署業務全年收入的兩倍。需要強調的是,在國內企業級AI市場,有算力定價權的是阿里雲、百度雲、火山引擎等擁有龐大雲端運算生態的大廠,因為大廠既有自研晶片、雲平台和模型,又搭建起了更龐大的客戶企業和開發者生態。即便獨立大模型公司在某款模型上最佳化了推理成本,也很快會被大廠跟進和模仿。長遠來看,獨立大模型公司的Token成本大機率無法與大廠抗衡。MiniMax的毛利率走向則截然相反。其整體毛利率從2024年的12.2%提升至2025年的25.4%。更關鍵的是,在營收大漲的同時,其銷售及分銷費用同比下降了40.3%,降至5190萬美元,主要得益於AI原生產品靠口碑和自然增長驅動,減少了推廣開支。年化經常性收入ARR僅用兩個月便從1億美元飆升至1.5億美元。毛利率的趨勢比絕對值更重要。智譜41.0%的毛利率目前雖高於MiniMax的25.4%,但前者因規模不經濟而承壓,後者則展現出了軟體訂閱模式特有的網路效應。國內市場 vs 出海避卷智譜選擇的中國政企AI採購市場。截至2025年末,智譜的應收款項總額約3.39億元人民幣,佔其全年7.24億元營收的近47%。此外,2024年智譜存在單一客戶貢獻近5947萬元營收的情況,佔當年總營收約19%,大客戶集中度及帳期問題顯著。私有部署業務需要大量定製化和本地交付,收入與人力成本同步線性增長,難以享受AI技術的邊際成本遞減紅利。智譜管理層顯然意識到了這一點。2025年,公司主動最佳化業務結構,開放平台和API業務收入激增292.6%,雲端部署的收入佔比從15.5%提升至26.3%。然而,雲端業務目前的毛利率僅為18.9%。向雲端轉型意味著短期內必須承受整體毛利率的陣痛,同時還要抵禦字節、阿里等巨頭帶來的價格戰挑戰。MiniMax將主戰場設在海外,避開了國內ToB市場的內卷。73.0%的海外營收比例不僅規避了價格戰,更讓其接觸到了付費意願更強的使用者群體。Talkie和Hailuo AI驗證了AI伴侶和視訊生成場景的變現邏輯。銷售費用的絕對值下降與營收的成倍增長,是典型的產品驅動型SaaS早期特徵,與Anthropic的C端/開發者雙輪驅動模型更接近。但出海也面臨風險。在面對好萊塢等傳統內容巨頭時,版權問題是懸在頭上的達摩克利斯之劍。迪士尼、環球、華納等起訴MiniMax的Hailuo AI侵權,核心是指控其缺乏基礎的護欄,例如用戶輸入“達斯·維達”,系統會直接生成侵權視訊。原告主張按500件作品、每件最高15萬美元索賠,總計索賠額可能高達7500萬美元。MiniMax在財報中披露,其部分子公司正面臨智慧財產權侵權索賠的法律糾紛,目前案件尚處早期,結果無法精準預估。這構成了一個重大的外部風險變數。月之暗面也在策劃上市,據媒體報導,其今年第一季度來自海外的收入增長十分強勁,這意味著,月之暗面整體營收構成或許與MiniMax更類似。MiniMax比智譜更像Anthropic智譜和MiniMax兩家公司都在用極高的研發投入換取技術代差。智譜2025年研發費用高達31.8億元人民幣,同比增長44.9%,錄得經調整淨虧損31.82億元。每創收1元,僅研發就要投入約4.4元。智譜在1月份的IPO中募資約50億港元,補充了彈藥,但以當前的消耗速度,資金鏈壓力依然存在。智譜現金約22. 59億,若按2025年調整後淨虧損31.8億/年推算,不考慮收入增長,現金流不足12個月,短期內大機率需要再融資。從人效來看,智譜目前擁有1094名全職員工。MiniMax的財務安全邊際相對較寬。2025年研發費用為2.53億美元,經調整淨虧損為2.51億美元。其帳上包括現金、定期存款及金融資產等在內的資金儲備達10.5億美元,現金流足以支撐超4年。人員結構也更為精簡,全職員工僅428名,在創造與智譜同等規模營收的情況下,展現出了更高的人效。Anthropic的核心商業模式是基於頂尖的Claude系列模型,建構的“API+訂閱”多元收入結構,並保持極高的企業和開發者粘性。在模型能力上,智譜和MiniMax都展現了極強的競爭力。智譜敢於在2026年初將API呼叫價格上調83%且需求不減,證明已開始掌握一定的定價權。但從商業模式的演進來看,MiniMax比智譜更符合Anthropic的雛形。MiniMax毛利率穩步上行、海外C端訂閱收入佔主導、銷售體系向產品驅動過渡、更精簡的人員結構以及更厚的現金儲備,都指向了一個具備規模效應的健康商業體。智譜的護城河在於國內政企市場的深度繫結以及強大的產學研背景,但這門私有化部署驅動的生意更像傳統的IT整合商,而非純粹的SaaS或MaaS企業。無論是智譜、MiniMax還是月之暗面,要在巨頭環伺的AGI競賽中存活下來,仍需要在這場沒有終點的研發軍備賽中繼續奔跑。 (劃重點)