中國首款：GPU 新王誕生！10倍性價比！

2026/01/28

•

性價比之王！
國內首款LPDDR6：推理GPU啟望S3發佈！
曦望GPU路線圖公佈：“百萬 token 一分錢”！

1月27日，杭州GPU創企曦望舉辦發佈會，披露三年產品路線圖，發佈啟望S3推理GPU晶片、寰望SC3超節點方案及推理雲計畫。

S3晶片作為國內首款LPDDR6視訊記憶體GPGPU，推理性價比提升10倍以上，單位token成本降90%。發佈會同步啟動“百萬Token一分錢”合作，聯動多傢伙伴佈局生態，彰顯其深耕推理賽道、重構AI算力成本的決心。

一、啟望S3晶片，以極致設計重塑推理性價比

2026年1月27日，曦望在杭州披露三年產品路線圖，發佈專為大模型推理定製的啟望S3晶片。徐冰指出，為追求極致性價比，曦望“拋棄了傳統訓推一體GPU為訓練準備的冗餘設計，不追求峰值TFLOPS這種紙面資料，把真實業務場景中每個token的成本、能耗以及SLA穩定性作為所有設計決策的根本出發點”，並強調這三大指標“直接決定了最終的業務毛利率，直接影響了終端客戶群體的使用者體驗”。

啟望S3有三大核心亮點：一是極致PPA，摒棄訓練冗餘元件，採用推理最佳化架構及先進第三方高速介面IP；二是採用合規先進國際工藝節點；三是作為國內首款LPDDR6視訊記憶體GPGPU晶片，頻寬較LPDDR5提升1倍以上，視訊記憶體容量較上一代提升4倍，經論證為當前推理最優解。

曦望精準把控大模型黃金算力訪存比，避免資源浪費，晶片支援FP16至FP4多精度切換，適配MoE及長上下文模型需求。據王勇分享，啟望S3“取得了10倍以上的推理性價比提升”，單晶片性能較前代提升5倍，單位token成本下降約90%，力爭生命周期內實現百億級收入，將於今年上市。

二、系統方案：寰望SC3超節點，建構高效推理基礎設施

同步發佈的寰望SC3超節點方案，聚焦千億級以上參數多模態MoE推理需求，支援單域256卡一級互聯，適配PD分離、大EP部署，提升系統利用率與穩定性，可應對長上下文、多並行等複雜場景。

該方案採用全液冷設計，PUE表現優異，支援模組化快速交付。王勇介紹，大EP部署下吞吐率提升20~25倍，“在同等推理能力量級下，該方案可將整體系統交付成本從行業常見的億元級降低至千萬元級，實現1個數量級的下降”。通過RDMA連接，可擴展為千卡級叢集，滿足大規模部署需求。

軟體層面，其自研體系覆蓋驅動、算子庫等全鏈路，95%相容CUDA，降低遷移門檻，已適配DeepSeek、通義千問等百余種大模型，相容ModelScope平台90%以上主流模型形態。

三、生態佈局：推理雲計畫，邁向“百萬token一分錢”目標

曦望以“晶片+系統+生態”佈局，啟動推理雲計畫，與商湯、範式共建“百萬Token一分錢”合作，聯動杭鋼數字等平台落地浙江、輻射全國，同時與三一、協鑫等十余傢伙伴簽約，將推理能力嵌入製造、能源等多場景。

聯席CEO王湛表示，新一代AI原生智算平台為核心支撐，具備四大優勢：軟硬體深度協同，自研核心與通訊庫，量化壓縮技術實現250%+性能提升且精度損失極小；資源彈性調度，通過GPU池化等技術按需供給；開箱即用，整合模型市場與工具；穩定可靠，具備高可用及智能維運能力。

基於該平台，曦望以“推理即服務”升級商業模式，建構“晶片+雲基建”雙輪驅動，通過GPU池化整合算力，以MaaS為入口，為客戶提供零門檻一體化服務，成為“百萬Token一分錢”合作的技術核心。

王勇補充，“百萬token一分錢”目標將在S3至S5迭代中逐步達成。據煒燁智算測算，目前曦望每百萬token價格約0.57元，遠低於行業7~14元水平。未來將以“token as a service”為核心，提供多元服務，輸出高性價比綠色算力。

四、產品路線圖：三代迭代規劃，完善全鏈路產品矩陣

曦望遵循“量產一代、發佈一代、預研一代”節奏，明確三年路線：2026年推啟望S3，2027年發佈S4高性能晶片，2028年推出S5安全可控晶片，以每年一迭代鞏固賽道優勢，邁向極致推理成本目標。

圍繞啟望S3，曦望建構了覆蓋計算卡、伺服器、AI叢集、終端裝置的全鏈路產品矩陣，形成完整生態，為各行業提供一體化推理方案，強化“更懂AI的推理GPU廠商”定位，助力降低國內AI推理成本。

五、企業根基：脫胎商湯，匯聚頂尖力量深耕推理賽道

曦望成立於2020年5月，前身為商湯科技大晶片部門，是國內首家All in推理的GPU晶片公司。董事長徐冰明確表示：“我們是一家更懂AI的GPU晶片公司，而且是國內第一家All in推理的GPU晶片公司。” 其使命是“把大模型推理做到極致，要讓AI推理真正變得便宜穩定，而且隨處可用”。

公司核心團隊超300人，多來自輝達、AMD、崑崙芯等頭部企業，核心骨幹平均擁有15年行業經驗，採用“雙引擎”架構：研發端聯席CEO王勇，曾任AMD、崑崙芯核心架構師，擁有20年晶片研發經驗，2020年加入商湯後帶領團隊實現兩代晶片一次性研發量產成功；商業化端聯席CEO王湛，為百度創始團隊成員、前集團副總裁，曾執掌百度搜尋8000人團隊，2025年初加入，負責產品化、商業化及組織文化建設。

過去8年，曦望累計研發投入20億元，堅持GPU每年一迭代，成功量產啟望S1、S2。2025年，其推理GPU交付量突破1萬片，斬獲多個頭部訂單，收入大增；同年完成約30億元戰略融資，股東涵蓋商湯、三一、杭州資料集團等龍頭及多家國資、頂尖風投。王勇強調：“我們拒絕做跑分黨，不希望用benchmark來定義晶片，而是希望能夠做到幫客戶賺錢的算力。”

曦望擁有全端GPGPU架構，率先提出用大容量DDR替代HBM、以高性價比推理晶片替代訓推一體晶片的理念。啟望S1於2018年研發、2020年量產，IP已授權索尼、小米，應用於AI攝影機及手機；啟望S2對標國際旗艦，2021年流片、2023年產品化，在DeepSeek滿血版適配中達國際巨頭80%推理性能，穩居國內第一梯隊。軟體棧實現95%CUDA相容，已適配商湯全系列小浣熊模型，與長城集團打造國產信創一體機，拓展多元垂直應用。 (深科技)