三位前AMD同事,做出中國國產高性能GPU獨角獸



11月29日,沐曦與加佳科技共同啟動曦源一號SADA萬卡叢集算力項目,其第一期千卡叢集在上海正式落地。同時,加佳科技SADA 1+2智算產業應用生態發展項目也正式啟動。



曦源一號SADA萬卡叢集以國產自主可控的沐曦GPU晶片技術產品為核心,著力建構集算力、演算法、資料、產業應用為一體的人工智慧產業新生態。


曦源一號SADA萬卡叢集-上海智算中心現場


針對當前國產算力生態支援不足與相容性不高兩大挑戰,沐曦與加佳科技共同牽手建構了基於「全通用、全自研、全相容」的軟硬體技術架構。

在全面相容CUDA生態的同時,支援各類應用的輕鬆適配和無縫融合。基於此,曦源一號SADA萬卡叢集也將引領國內「國產替代+國際相容」型萬卡叢集的發展。

沐曦也繼華為昇騰、摩爾執行緒之後開始建構自研GPU晶片萬卡叢集。


1、發展歷程

1995年,沐曦創始人陳維良進入電子科技大學攻讀微電子專業,本科畢業後進入清華大學,2002年研究生畢業,拿到清華大學微電子學研究所工學碩士學位後回到上海進入積體電路行業,長期就職於國際旗艦晶片廠商,負責GPU設計及產品研發,主導並完成15款通用GPU產品的流片與量產。



2020年,陳維良洞察到「東數西算」工程為國內晶片產業帶來的巨大機遇,並預見到下游應用行業對資料處理需求的迅猛增長,這將直接推動算力晶片的發展。基於此,他與彭莉和楊建共同在上海自貿區臨港新片區創立了沐曦。

在這個團隊中,陳維良負責整體戰略,彭莉主管硬體,楊建負責軟體。

他們在Trident和AMD時期的合作經驗,以及在大規模晶片和GPU軟硬體設計領域積累的十餘年甚至二十年的專業經驗,為沐曦的成立奠定了堅實的基礎。

沐曦從一開始目標就定在打造完全自主智慧財產權的高性能GPU IP,並基於自主研發的高性能GPU IP打造高性能GPU產品,並建構相容全球主流GPU生態的軟體生態MACAMACA,從而建立起技術護城河。計畫兩年內設計出一款全球領先的旗艦級產品。

傑出的創始團隊使得沐曦得到資本市場的青睞,成立不到1年內,迅速完成從天使輪到A輪四輪融資,融資金額達數十億。

在獲得充沛資金後,沐曦自主完成研發高性能GPU IP,擁有了完全自主智慧財產權的指令集和架構。

沐曦按通用計算、智算推理、圖形渲染推進三條產品主要管線。

2022年1月,沐曦首款採用7nm工藝的異構GPU推理晶片「曦思N100」正式流片,從立項到流片僅用了13個月。



曦思 N100內建 MXN100 異構 GPGPU 處理器以及 HBM2E 視訊記憶體,單卡算力達 160TOPS(INT8)和 80TFLOPS(FP16)。



2022年8月,曦思N100回片並完成測試。並於2023年初實現規模量產。

沐曦的通用GPU也迅速推進,「曦雲C500」於2023年6月完成點亮及回片。

曦雲C500是對標輝達 A100 / A800 的算力晶片,目標 FP32 算力 15 TFLOPS(輝達 A100 的 FP32 性能為 19.5 TFLOPS),採用通用 GPU 架構,相容 CUDA。



曦雲C500在2023世界計算大會上獲評「世界計算大會專題展優秀成果」,預計將於2023年底實現規模量產。

2023年10月,美國升級AI晶片和半導體裝置禁令,美國商務部工業和安全域(BIS)公佈新的先進計算晶片、半導體製造裝置出口管制規則,限制中國購買和製造高端晶片的能力,並將兩家中國GPU企業摩爾執行緒、壁仞科技及其子公司列入了實體清單。

沐曦雖然沒被直接列入清單,但也在代工方面受到一定影響。


2、團隊構成與專業背景

沐曦擁有技術完備、設計和產業化經驗豐富的團隊,核心成員平均擁有近20年高性能GPU產品端到端研發經驗,曾主導過十多款世界主流高性能GPU產品研發及量產,包括GPU架構定義、GPU IP設計、GPU SoC設計及GPU系統解決方案的量產交付全流程。


陳維良——創始人、董事長&CEO


陳維良,沐曦創始人、董事長兼CEO,清華大學微電子學研究所碩士,曾任AMD全球GPGPU設計總負責人,負責全球通用計算GPU產品線的整體設計與管理,主導並完成15款高性能GPU產品的流片與量產,擁有近20年的晶片設計、技術研發和量產管理經驗。


楊建——聯合創始人、CTO兼首席軟體架構師


楊建,沐曦聯合創始人、CTO兼首席軟體架構師,浙江大學博士,具備超過20年大規模晶片及GPU軟硬體架構設計經驗。

楊建曾是AMD大中華區第一位科學家(Fellow),曾參與及主導數十款GPU產品量產及交付全流程,並作為三維圖形與科學計算生態專家,擁有多項發明專利。

此外,他還歷任Trident、S3、ATI/AMD、海思等公司晶片架構師、軟體架構師、首席架構師等職位。


彭莉——聯合創始人、CTO兼首席硬體架構師


彭莉,沐曦聯合創始人、CTO兼首席硬體架構師,上海交通大學電子工程系碩士。

彭莉是AMD全球首位華人女科學家,擁有15年高性能GPU晶片設計經驗,歷任AMD首席SOC架構師、系統架構師、GFXIP架構師等職務,主導過多款GPU產品從架構到量產的全流程。


周昆——圖形計算首席科學家


周昆,沐曦圖形計算首席科學家,現任浙江大學電腦輔助設計與圖形學國家重點實驗室主任,電腦學院副院長,教育部長江學者特聘教授,國家傑出青年科學基金獲得者。

2002年獲浙江大學工學博士學位,2002至2008年就職於微軟亞洲研究院,歷任副研究員、研究員和研究主管,2008年全職回到浙江大學工作。研究領域為電腦圖形學、人機互動和虛擬現實。近年來在圖形學基礎演算法、圖形軟體開發平台和GPU平行計算等方向取得多項創新成果,發表高水平論文70余篇,論文他引3000多次。獲得發明專授權30多項。


3、主要業務

沐曦打造全端GPU晶片產品,推出曦思N系列GPU產品用於智算推理,曦雲C系列GPU產品用於通用計算,以及曦彩G系列GPU產品用於圖形渲染,滿足「高能效」和「高通用性」的算力需求。

沐曦產品均採用完全自主研發的GPU IP,擁有完全自主智慧財產權的指令集和架構,配以相容主流GPU生態的完整軟體棧(MXMACA®),具備高能效和高通用性的天然優勢,能夠為客戶建構軟硬體一體的全面生態解決方案,是「雙碳」背景下推動數字經濟建設和產業數位化、智能化轉型升級的算力基石。

(1)GPU產品


曦雲C系列(通用GPU)


曦雲C系列通用GPU晶片是針對智算及通用計算的完美解決方案,沐曦自主智慧財產權架構提供強大高精度及多精度混合算力,可廣泛應用於智算以及通用計算、教育和科研等場景。

曦雲C系列旗艦產品曦雲C500基於自主研發的高性能GPU IP;基於全自研 GPU 指令集打造的MXMACA軟體棧,全面相容CUDA生態,實現使用者零成本遷移;通過自主智慧財產權的MetaXLink實現單機8卡GPU全互聯,提供建構高密度算力和雲端運算部署的優秀國產GPU解決方案;可廣泛應用於推薦系統、自動語音識別、語音合成、圖像分割檢測、資料庫加速等多種場景。

該產品已於2023年6月13日回片並完成測試。沐曦同時打造曦雲C500液冷工作站,相對於傳統的空冷系統具備高效散熱、低噪音、適應性強等優勢,能夠更好地控制溫度、保持穩定的工作狀態、提供更高性能且易於維護,尤其適用於科研機構、學校等辦公場景。


曦思N系列(AI推理GPU)


曦思N系列是面向雲端應用的智算推理產品,採用高頻寬記憶體,提供強大的算力和領先的視訊編解碼能力,可廣泛應用於智慧城市、公有雲端運算、智能視訊處理、雲遊戲等場景。

核心產品為曦思N100。

曦思N系列首款產品曦思N100(MXN100)是一款面向雲端資料中心應用的人工智慧推理GPU,內建MXN100異構GPGPU處理器以及HBM2E高頻寬視訊記憶體,單卡算力達160TOPS(INT8)和80TFLOPS(FP16),兼備高頻寬和低延時的特性,能夠提供高達128路編碼和96路解碼的高畫質視訊處理能力, 相容HEVC、H.264、AV1、AVS2等多種視訊格式, 最高支援8K解析度。

同時配備自主研發的MXMACA軟體棧,與硬體架構緊密耦合,支援多種主流框架的網路模型,並支援主流電腦視覺處理和多媒體處理框架。通過持續完善的ModelZoo,讓客戶開箱即用,實現了各類應用場景和業務模型的快速遷移。

曦思N100可廣泛應用於智慧城市、智慧安防、智慧交通、雲端運算、智能視訊處理等場景。目前,該產品已實現規模量產。


曦彩G系列(圖形處理GPU)


曦彩G系列GPU是針對圖形渲染加速的解決方案,沐曦自主智慧財產權架構提供卓越的圖形圖像渲染與視訊處理能力, 可廣泛應用於元宇宙、雲桌面、雲遊戲、雲手機、數字孿生、XR等場景。


(2)MXMACA異構計算平台


MXMACA是由沐曦推出的一種採用通用平行計算架構解決複雜計算問題的運算平台。它包含了自研指令集架構(ISA)以及GPU內部的平行計算引擎,整合了通用計算和機器學習框架,為科學家、研究員以及各個應用領域的行業專家們提供了高靈活性和高性能的開放式軟體平台。



該運算平台提供了一種簡單易用的類C程式語言,供使用者為MXMACA架構編寫程序,使其在METAX GPU處理器上以超高效率運行。該程式語言語法簡單靈活,易讀易寫,並且表達能力出眾;同時能夠相容主流的C/C++異構計算語言,使得使用者獲得便捷軟體適配與高效客戶算子開發。

MXMACA異構計算平台支援多種開源技術,包括AI神經網路框架(TensorFlow/PyTorch等)、庫(Blas/DNN等)和Linux Kernel支援等,通過不斷地最佳化來實現更高的性能和可擴展性,幫助使用者更好地用AI賦能社會。同時,MXMACA運算平台提供了豐富的系統和應用管理工具,方便使用者能夠更高效地進行靈活的開發、驗證、環境部署及質量監控等。


4、估值及融資情況

沐曦目前完成8輪融資,最新一輪投後估值130億人民幣(來自IT橘子),融資情況如下:

  • 天使輪融資:2020年11月,沐曦獲得天使輪融資,金額近億元人民幣,由和利資本領投並協助發起設立。
  • Pre-A輪融資:2021年1月,沐曦獲得Pre-A輪融資,金額為數億元人民幣,由紅杉資本領投,真格基金跟投,老股東和利資本及天津泰達繼續加碼。
  • Pre-A+輪融資:2021年3月,沐曦獲得Pre-A+輪融資,金額為數億元人民幣,由經緯中國與光速中國聯合領投,和利資本、紅杉中國、真格基金等老股東持續跟投。
  • A輪融資:2021年8月,沐曦獲得A輪融資,金額為10億元人民幣,由國調基金、中網投聯合領投,老股東經緯中國、和利資本、紅杉中國、光速中國繼續投資,國創中鼎、智慧互聯產業基金、上海科創基金、聯想創投、招商金台、復星銳正、東方富海、創徒投資跟投。
  • Pre-B輪融資:2022年7月,沐曦獲得Pre-B輪融資,金額為10億元人民幣,由上海混沌投資集團、央視融媒體產業投資基金聯合領投,上海國盛資本、中鑫資本、建銀科創、和暄資本、普超資本等機構跟投,老股東中國網際網路投資基金、經緯中國、國創中鼎繼續追加投資。
  • B輪融資:2023年2月,沐曦獲得B輪融資,金額未披露,由中原航港基金、中衛頤和、榮至和、尼盛國際、啟夏資本、科力創投投資。
  • B+輪融資:2023年12月,沐曦獲得B+輪融資,金額未披露,由餘杭金控、國道金服、廣發信德投資。
  • B++輪融資:2024年8月,沐曦獲得B++輪融資,金額未披露,投後估值130億人民幣(來自IT橘子),由浦東資本、上海科創基金、湖南國創產業投資、加佳資訊、啟夏資本投資。


5、小結

沐曦,這家由AMD團隊成員創立的GPU企業,憑藉其三位創始人在技術領域的互補優勢,組建一支具備十餘年高性能GPU設計和量產經驗的完整團隊。

這使得沐曦能夠迅速推進自主研發的GPU IP,並在通用GPU、AI推理GPU和圖形處理GPU三個方向上實現快速發展。

隨著美國開始關注國內領先的GPU企業,沐曦逐漸保持低調,期待沐曦未來的發展。 (奇偶工作室)