Kimi、智譜背後的“隱形冠軍”藏不住了!AI Infra搶跑者開始重寫資本坐標

隨著大模型進入工程化與規模化階段,越來越多資本開始關注底層基礎設施能力。

硅星人獲悉,5月7日,人工智慧基礎設施企業無問芯穹宣佈此前已再獲超7億元融資。本輪融資中,聯合領投方為杭州高新金投集團和惠遠資本,跟投方包括國興資本、秦淮資料、廣發乾和、力合清瞳、中保投資、AEF NextGen、騰瑞資本、卡萊特、中信建投資本和寬德智能學習實驗室 (Will),老股東君聯資本、上海國投孚騰和元智未來追加投資。

無問芯穹於2023年5月由清華大學電子工程系推動成立,創始成員來自清華大學、上海交通大學、阿里雲與曠視科技等頂尖高校與AI企業。

在無問芯穹成立的三年中,全球 AI 行業經歷了“百模大戰”、推理模型爆發、智能體興起等多個階段,而隨著模型快速迭代,如何更高效地生產和利用token,逐漸成為行業關注的核心問題之一。

01. 模型運行效率與系統能力成為新焦點

當外界討論“中國大模型性能”時,注意力往往集中在模型本身,比如Kimi K2.6 的 Agent Swarm 智能體叢集協作與超長程工程能力,智譜 GLM-5.1 在 AutoGLM 端到端自主操作以及 8 小時長程任務執行上的突破。

但在這些頭部模型背後,支撐其高效運轉的基礎設施層,其實都有無問芯穹的身影。

2026年3月,在中關村論壇上,無問芯穹聯合創始人兼 CEO 夏立雪與月之暗面創始人楊植麟、智譜 CEO 張鵬同台對話時,首次公開提到:無問芯穹已經成為 Kimi、智譜等眾多頭部大模型企業的核心基礎設施與 Token 服務商。

大模型競爭演進至今,已不再侷限於模型能力強弱的比拚,模型運行效率與系統承載能力的較量同樣重要。

對於 Kimi、智譜這類頭部模型公司來說,真正昂貴的並不只是訓練,而是持續不斷的推理成本。使用者每一次提問、生成回答或呼叫 Agent,本質上都在消耗 GPU 算力和 Token 資源。隨著呼叫量暴漲,推理系統會迅速變成一個極其複雜的工程問題。

理論上,這些公司當然可以全部自建。但現實是,自建意味著巨額 GPU 投入、資料中心建設、算力調度、系統最佳化,以及長期維運成本。相比之下,如果有一家能夠提供更低成本、更高效率的基礎設施平台,很多模型公司更願意把這部分能力外包。

這也是無問芯穹切入的位置。它並不直接參與最強模型的競爭,而是成為這些模型背後的基礎設施支撐者。

02. 大模型時代的“Token 工廠”

在某種程度上,AI Infra像大模型時代的“Token工廠”。使用者在使用AI產品寫程式碼、做分析、呼叫 Agent 完成任務時,背後會涉及到大量 Token 的生產、推理資源的調度,以及不同晶片之間的適配,這些都是無問芯穹在做的工作。

而這類基礎設施的價值,會隨著 AI 使用量增長被不斷放大。

夏立雪曾提到,當 Kimi、智譜等頭部模型呼叫量出現幾十倍增長時,無問芯穹作為其 Token 服務商,也同步實現了幾十倍增長。在當下這個階段,AI Infra企業已經深度嵌入中國頭部 AI 公司的生產鏈路之中。

在中國 AI 行業中,算力環境本身就極其複雜。不同公司使用不同 GPU,不同晶片之間的軟體棧、編譯框架、通訊協議並不統一。很多模型雖然訓練出來了,卻未必能在不同硬體環境中高效穩定運行。

比如在輝達 GPU 上完成訓練與最佳化的大模型,在遷移到國產推理晶片時,常常會遇到算子不相容、視訊記憶體調度方式不同等問題,需要重新做算子適配與推理圖最佳化,否則在實際部署中可能出現吞吐下降、延遲上升,甚至無法穩定服務請求的情況。

無問芯穹的核心價值之一,就是在不同晶片與算力環境之間建立統一的“運行層”,通過底層調度與最佳化能力,讓大模型能夠在異構算力上以接近一致的方式穩定運行與高效推理。

目前,無問芯穹的 Agentic MaaS 大模型服務平台已經對GLM、Kimi、DeepSeek、通義千問、MiniMax 等國產主流模型進行了高性能服務最佳化,精度對齊率超過99.9%,吞吐量提升2-3倍,時延縮減50%,首字延遲低於500ms,企業級高可用性達到99.95%。

這些技術層面的參數,會體現在非常具體的系統體驗與業務能力上——響應速度是否足夠及時,系統在高並行情況下是否穩定,峰值流量下是否仍可持續服務,以及企業級場景中能否可靠完成模型的規模化部署與落地應用。

03. AI 基礎設施進入“跨圈層共識”階段

本輪融資中,無問芯穹再獲超 7 億元融資,累計融資規模超過 22 億元,持續位居中國 AI 原生基礎設施賽道前列。但相比數字本身,更具訊號意義的是本輪投資方結構的顯著外擴。

從資方構成來看,對 AGI 基礎設施核心價值的認同,正在從科技投資圈,擴展至更廣泛的產業與戰略資本體系之中。

從資方構成來看,這一輪融資呈現出三個層面的結構性變化。

第一類是政策與產業導向資本的進入。以杭州高新金投集團、惠遠資本為代表的政府產業資本參與,使這一輪融資帶有明顯的區域產業戰略屬性。其關注重點不只是企業成長性,而是將 AGI 基礎設施視為數字經濟底座能力的一部分,從“支援科技企業”轉向“配置基礎設施能力”。

第二類是國家級資本的參與。中保投資等國家隊資金的進入,讓這一輪融資具備更強的長期屬性,其核心邏輯更接近基礎設施等級的配置判斷,即圍繞技術自主可控與長期系統能力進行佈局,而非短期商業回報。

第三類是產業側與應用側資本的跨界進入。秦淮資料等資料中心營運商的參與,反映出上游算力基礎設施正在從“資源供給方”向“AI系統協同方”演進,其投資邏輯不再只是機櫃、電力與頻寬,而是希望通過與 AI Infra 層協同提升整體算力利用效率。

與此同時,卡萊特、量化基金等製造業與金融資本的進入,則意味著實體產業與金融體系開始以更直接方式參與 Token 經濟,一方面作為投資者,另一方面也可能成為實際使用者。

04. Token經濟時代,無問芯穹想做什麼

截至 2026 年 4 月底,無問芯穹 Agentic MaaS 平台的日均 Token 呼叫量,相較 2025 年底增長超過 20 倍。這一增長並不是線性擴張,而是一種基礎設施級應用的指數級放大。

夏立雪在中關村論壇上提到,“上一次看到這樣的增速,還是 3G 時代移動網際網路流量爆發的時候。”Token 正在成為類似“流量”的基礎資源單位,其增長曲線本身就代表著 AI 使用方式的結構性變化。

從行業整體來看,這一趨勢並非孤立現象。根據國家統計局相關資料,截至 2026 年 3 月,全國日均 Token 呼叫量已突破 140 兆,較上年末增長超過 40%。在這一背景下,無問芯穹平台 20 倍的增長幅度,意味著其並非簡單跟隨行業擴張,而是在頭部模型呼叫與企業級場景中形成了更高密度的承載與聚集效應。

而支撐這一增長的,並不只是流量本身的擴張,也是底層技術體系的同步演進。本輪融資所指向的三大技術方向,實際上構成了其增長背後的基礎支撐結構。

首先,是多元異構算力體系的持續強化,通過技術極致最佳化的可用算力規模,在 Token 經濟時代實現更高利用率的資源供給;

其次,是軟硬體協同能力的進一步深化,通過最佳化推理鏈路與系統調度機制,加快從“電能到 Token”的轉化效率,即在相同物理資源下生成更多有效 Token 輸出;

再次,是面嚮應用層的基礎設施升級,通過企業級智能體服務平台,將模型能力嵌入不同行業場景,使 Token 不再只是計算結果,而是進入業務流程本身,完成從“Token 到生產力”的轉化。

這三條路徑分別對應算力供給、運行效率與應用轉化三個層面,共同指向同一個目標:在更大規模 Token 呼叫增長的背景下,持續提升 AI 基礎設施的整體運行效率。

可以看到,Token 正在從“模型輸出單位”逐步演化為支撐產業系統運行的基礎資源,而基礎設施能力則成為影響其規模化效率的關鍵變數。

當 Token 進一步成為基礎資源單元,資源調配與系統運行效率開始直接決定 AI 能力的實際邊界。融資、增長與技術路線在此交匯,所指向的並不是單一公司的階段性擴張,而是一個更清晰的行業趨勢——AI 基礎設施正從支撐性角色,轉向決定 AI 規模化能力的核心底座。

在這一意義上,無問芯穹的角色也不再僅是基礎設施公司,而是在持續擴張的 Token 經濟體系中,成為一個被不斷放大的運行樞紐。 (硅星人Pro)