中國首款:GPU 新王誕生!10倍性價比!

性價比之王!
國內首款LPDDR6:推理GPU啟望S3發佈!

曦望GPU路線圖公佈:“百萬 token 一分錢”!

1月27日,杭州GPU創企曦望舉辦發佈會,披露三年產品路線圖,發佈啟望S3推理GPU晶片、寰望SC3超節點方案及推理雲計畫。

S3晶片作為國內首款LPDDR6視訊記憶體GPGPU,推理性價比提升10倍以上,單位token成本降90%。發佈會同步啟動“百萬Token一分錢”合作,聯動多傢伙伴佈局生態,彰顯其深耕推理賽道、重構AI算力成本的決心。


一、啟望S3晶片,以極致設計重塑推理性價比

2026年1月27日,曦望在杭州披露三年產品路線圖,發佈專為大模型推理定製的啟望S3晶片。徐冰指出,為追求極致性價比,曦望“拋棄了傳統訓推一體GPU為訓練準備的冗餘設計,不追求峰值TFLOPS這種紙面資料,把真實業務場景中每個token的成本、能耗以及SLA穩定性作為所有設計決策的根本出發點”,並強調這三大指標“直接決定了最終的業務毛利率,直接影響了終端客戶群體的使用者體驗”。

啟望S3有三大核心亮點:一是極致PPA,摒棄訓練冗餘元件,採用推理最佳化架構及先進第三方高速介面IP;二是採用合規先進國際工藝節點;三是作為國內首款LPDDR6視訊記憶體GPGPU晶片,頻寬較LPDDR5提升1倍以上,視訊記憶體容量較上一代提升4倍,經論證為當前推理最優解。

曦望精準把控大模型黃金算力訪存比,避免資源浪費,晶片支援FP16至FP4多精度切換,適配MoE及長上下文模型需求。據王勇分享,啟望S3“取得了10倍以上的推理性價比提升”,單晶片性能較前代提升5倍,單位token成本下降約90%,力爭生命周期內實現百億級收入,將於今年上市。

二、系統方案:寰望SC3超節點,建構高效推理基礎設施

同步發佈的寰望SC3超節點方案,聚焦千億級以上參數多模態MoE推理需求,支援單域256卡一級互聯,適配PD分離、大EP部署,提升系統利用率與穩定性,可應對長上下文、多並行等複雜場景。

該方案採用全液冷設計,PUE表現優異,支援模組化快速交付。王勇介紹,大EP部署下吞吐率提升20~25倍,“在同等推理能力量級下,該方案可將整體系統交付成本從行業常見的億元級降低至千萬元級,實現1個數量級的下降”。通過RDMA連接,可擴展為千卡級叢集,滿足大規模部署需求。

軟體層面,其自研體系覆蓋驅動、算子庫等全鏈路,95%相容CUDA,降低遷移門檻,已適配DeepSeek、通義千問等百余種大模型,相容ModelScope平台90%以上主流模型形態。

三、生態佈局:推理雲計畫,邁向“百萬token一分錢”目標

曦望以“晶片+系統+生態”佈局,啟動推理雲計畫,與商湯、範式共建“百萬Token一分錢”合作,聯動杭鋼數字等平台落地浙江、輻射全國,同時與三一、協鑫等十余傢伙伴簽約,將推理能力嵌入製造、能源等多場景。

聯席CEO王湛表示,新一代AI原生智算平台為核心支撐,具備四大優勢:軟硬體深度協同,自研核心與通訊庫,量化壓縮技術實現250%+性能提升且精度損失極小;資源彈性調度,通過GPU池化等技術按需供給;開箱即用,整合模型市場與工具;穩定可靠,具備高可用及智能維運能力。

基於該平台,曦望以“推理即服務”升級商業模式,建構“晶片+雲基建”雙輪驅動,通過GPU池化整合算力,以MaaS為入口,為客戶提供零門檻一體化服務,成為“百萬Token一分錢”合作的技術核心

王勇補充,“百萬token一分錢”目標將在S3至S5迭代中逐步達成。據煒燁智算測算,目前曦望每百萬token價格約0.57元,遠低於行業7~14元水平。未來將以“token as a service”為核心,提供多元服務,輸出高性價比綠色算力。

四、產品路線圖:三代迭代規劃,完善全鏈路產品矩陣

曦望遵循“量產一代、發佈一代、預研一代”節奏,明確三年路線:2026年推啟望S3,2027年發佈S4高性能晶片,2028年推出S5安全可控晶片,以每年一迭代鞏固賽道優勢,邁向極致推理成本目標。

圍繞啟望S3,曦望建構了覆蓋計算卡、伺服器、AI叢集、終端裝置的全鏈路產品矩陣,形成完整生態,為各行業提供一體化推理方案,強化“更懂AI的推理GPU廠商”定位,助力降低國內AI推理成本。

五、企業根基:脫胎商湯,匯聚頂尖力量深耕推理賽道

曦望成立於2020年5月,前身為商湯科技大晶片部門,是國內首家All in推理的GPU晶片公司。董事長徐冰明確表示:“我們是一家更懂AI的GPU晶片公司,而且是國內第一家All in推理的GPU晶片公司。” 其使命是“把大模型推理做到極致,要讓AI推理真正變得便宜穩定,而且隨處可用”。

公司核心團隊超300人,多來自輝達、AMD、崑崙芯等頭部企業,核心骨幹平均擁有15年行業經驗,採用“雙引擎”架構:研發端聯席CEO王勇,曾任AMD、崑崙芯核心架構師,擁有20年晶片研發經驗,2020年加入商湯後帶領團隊實現兩代晶片一次性研發量產成功;商業化端聯席CEO王湛,為百度創始團隊成員、前集團副總裁,曾執掌百度搜尋8000人團隊,2025年初加入,負責產品化、商業化及組織文化建設。

過去8年,曦望累計研發投入20億元,堅持GPU每年一迭代,成功量產啟望S1、S2。2025年,其推理GPU交付量突破1萬片,斬獲多個頭部訂單,收入大增;同年完成約30億元戰略融資,股東涵蓋商湯、三一、杭州資料集團等龍頭及多家國資、頂尖風投。王勇強調:“我們拒絕做跑分黨,不希望用benchmark來定義晶片,而是希望能夠做到幫客戶賺錢的算力。”

曦望擁有全端GPGPU架構,率先提出用大容量DDR替代HBM、以高性價比推理晶片替代訓推一體晶片的理念。啟望S1於2018年研發、2020年量產,IP已授權索尼、小米,應用於AI攝影機及手機;啟望S2對標國際旗艦,2021年流片、2023年產品化,在DeepSeek滿血版適配中達國際巨頭80%推理性能,穩居國內第一梯隊。軟體棧實現95%CUDA相容,已適配商湯全系列小浣熊模型,與長城集團打造國產信創一體機,拓展多元垂直應用。 (深科技)