#曦望
杭州簽約重磅GPU項目
2月28日,杭州市“爭創全國人工智慧創新發展第一城暨建設一流創新生態推進大會”在杭州市民中心舉行,在本次大會的重大項目簽約環節,12 個投資額超10億元的人工智慧(AI)領域重大項目簽約落地,總投資額達255億元。其中,中國國產全端自研人工智慧算力晶片企業——浙江曦望智能科技股份有限公司的曦望(Sunrise)“高性能 GPU 及推理晶片研發項目”作為本次簽約中唯一的 AI 推理 GPU 晶片項目、杭州“算力築基”工程的核心落地載體正式落戶。△曦望Sunrise 聯席CEO王湛(左二)參與簽約儀式曦望聯席CEO 王湛在簽約現場表示:“決定未來產業發展的,不僅是模型能力本身,更在於能否讓算力成為支撐千行百業智能化升級的真正底座。杭州爭創全國人工智慧創新發展第一城的核心戰略,為我們提供了最好的發展土壤。此次投資簽約,是曦望與杭州共同邁向‘第一城’目標的堅定承諾。”曦望也通過官方微信公眾號發文稱,此次簽約標誌著曦望在杭州的佈局進入全新階段,該項目將以重大投資助力杭州夯實人工智慧算力底座,深度融入城市人工智慧創新體系建設,為杭州核心戰略貢獻關鍵產業力量。資料顯示,曦望前身是商湯大晶片部門,2024年底分拆獨立營運,專注於高性能GPU及多模態場景推理晶片的研發與商業化。公司研發團隊憑藉8年技術沉澱、20億研發投入及兩代量產晶片的工程化驗證,已成為中國國產GPU替代的核心力量。公司致力於為千行百業提供成本降低10倍、能效比突破的智能算力基石,通過技術創新和深度產業協同,推動各行業的智能化發展,並助力實現通用人工智慧(AGI)的普惠化目標。據介紹,作為中國領先的 AI 推理 GPU 晶片及全端解決方案提供商,曦望 Sunrise 是浙江省首家,也是中國首家“All-in 推理”並實現萬卡級規模化交付的全端自研 GPU 晶片公司。 (芯智訊)
中國首款:GPU 新王誕生!10倍性價比!
性價比之王!國內首款LPDDR6:推理GPU啟望S3發佈!曦望GPU路線圖公佈:“百萬 token 一分錢”!1月27日,杭州GPU創企曦望舉辦發佈會,披露三年產品路線圖,發佈啟望S3推理GPU晶片、寰望SC3超節點方案及推理雲計畫。S3晶片作為國內首款LPDDR6視訊記憶體GPGPU,推理性價比提升10倍以上,單位token成本降90%。發佈會同步啟動“百萬Token一分錢”合作,聯動多傢伙伴佈局生態,彰顯其深耕推理賽道、重構AI算力成本的決心。一、啟望S3晶片,以極致設計重塑推理性價比2026年1月27日,曦望在杭州披露三年產品路線圖,發佈專為大模型推理定製的啟望S3晶片。徐冰指出,為追求極致性價比,曦望“拋棄了傳統訓推一體GPU為訓練準備的冗餘設計,不追求峰值TFLOPS這種紙面資料,把真實業務場景中每個token的成本、能耗以及SLA穩定性作為所有設計決策的根本出發點”,並強調這三大指標“直接決定了最終的業務毛利率,直接影響了終端客戶群體的使用者體驗”。啟望S3有三大核心亮點:一是極致PPA,摒棄訓練冗餘元件,採用推理最佳化架構及先進第三方高速介面IP;二是採用合規先進國際工藝節點;三是作為國內首款LPDDR6視訊記憶體GPGPU晶片,頻寬較LPDDR5提升1倍以上,視訊記憶體容量較上一代提升4倍,經論證為當前推理最優解。曦望精準把控大模型黃金算力訪存比,避免資源浪費,晶片支援FP16至FP4多精度切換,適配MoE及長上下文模型需求。據王勇分享,啟望S3“取得了10倍以上的推理性價比提升”,單晶片性能較前代提升5倍,單位token成本下降約90%,力爭生命周期內實現百億級收入,將於今年上市。二、系統方案:寰望SC3超節點,建構高效推理基礎設施同步發佈的寰望SC3超節點方案,聚焦千億級以上參數多模態MoE推理需求,支援單域256卡一級互聯,適配PD分離、大EP部署,提升系統利用率與穩定性,可應對長上下文、多並行等複雜場景。該方案採用全液冷設計,PUE表現優異,支援模組化快速交付。王勇介紹,大EP部署下吞吐率提升20~25倍,“在同等推理能力量級下,該方案可將整體系統交付成本從行業常見的億元級降低至千萬元級,實現1個數量級的下降”。通過RDMA連接,可擴展為千卡級叢集,滿足大規模部署需求。軟體層面,其自研體系覆蓋驅動、算子庫等全鏈路,95%相容CUDA,降低遷移門檻,已適配DeepSeek、通義千問等百余種大模型,相容ModelScope平台90%以上主流模型形態。三、生態佈局:推理雲計畫,邁向“百萬token一分錢”目標曦望以“晶片+系統+生態”佈局,啟動推理雲計畫,與商湯、範式共建“百萬Token一分錢”合作,聯動杭鋼數字等平台落地浙江、輻射全國,同時與三一、協鑫等十余傢伙伴簽約,將推理能力嵌入製造、能源等多場景。聯席CEO王湛表示,新一代AI原生智算平台為核心支撐,具備四大優勢:軟硬體深度協同,自研核心與通訊庫,量化壓縮技術實現250%+性能提升且精度損失極小;資源彈性調度,通過GPU池化等技術按需供給;開箱即用,整合模型市場與工具;穩定可靠,具備高可用及智能維運能力。基於該平台,曦望以“推理即服務”升級商業模式,建構“晶片+雲基建”雙輪驅動,通過GPU池化整合算力,以MaaS為入口,為客戶提供零門檻一體化服務,成為“百萬Token一分錢”合作的技術核心。王勇補充,“百萬token一分錢”目標將在S3至S5迭代中逐步達成。據煒燁智算測算,目前曦望每百萬token價格約0.57元,遠低於行業7~14元水平。未來將以“token as a service”為核心,提供多元服務,輸出高性價比綠色算力。四、產品路線圖:三代迭代規劃,完善全鏈路產品矩陣曦望遵循“量產一代、發佈一代、預研一代”節奏,明確三年路線:2026年推啟望S3,2027年發佈S4高性能晶片,2028年推出S5安全可控晶片,以每年一迭代鞏固賽道優勢,邁向極致推理成本目標。圍繞啟望S3,曦望建構了覆蓋計算卡、伺服器、AI叢集、終端裝置的全鏈路產品矩陣,形成完整生態,為各行業提供一體化推理方案,強化“更懂AI的推理GPU廠商”定位,助力降低國內AI推理成本。五、企業根基:脫胎商湯,匯聚頂尖力量深耕推理賽道曦望成立於2020年5月,前身為商湯科技大晶片部門,是國內首家All in推理的GPU晶片公司。董事長徐冰明確表示:“我們是一家更懂AI的GPU晶片公司,而且是國內第一家All in推理的GPU晶片公司。” 其使命是“把大模型推理做到極致,要讓AI推理真正變得便宜穩定,而且隨處可用”。公司核心團隊超300人,多來自輝達、AMD、崑崙芯等頭部企業,核心骨幹平均擁有15年行業經驗,採用“雙引擎”架構:研發端聯席CEO王勇,曾任AMD、崑崙芯核心架構師,擁有20年晶片研發經驗,2020年加入商湯後帶領團隊實現兩代晶片一次性研發量產成功;商業化端聯席CEO王湛,為百度創始團隊成員、前集團副總裁,曾執掌百度搜尋8000人團隊,2025年初加入,負責產品化、商業化及組織文化建設。過去8年,曦望累計研發投入20億元,堅持GPU每年一迭代,成功量產啟望S1、S2。2025年,其推理GPU交付量突破1萬片,斬獲多個頭部訂單,收入大增;同年完成約30億元戰略融資,股東涵蓋商湯、三一、杭州資料集團等龍頭及多家國資、頂尖風投。王勇強調:“我們拒絕做跑分黨,不希望用benchmark來定義晶片,而是希望能夠做到幫客戶賺錢的算力。”曦望擁有全端GPGPU架構,率先提出用大容量DDR替代HBM、以高性價比推理晶片替代訓推一體晶片的理念。啟望S1於2018年研發、2020年量產,IP已授權索尼、小米,應用於AI攝影機及手機;啟望S2對標國際旗艦,2021年流片、2023年產品化,在DeepSeek滿血版適配中達國際巨頭80%推理性能,穩居國內第一梯隊。軟體棧實現95%CUDA相容,已適配商湯全系列小浣熊模型,與長城集團打造國產信創一體機,拓展多元垂直應用。 (深科技)