#Lepton
我們還是低估了輝達
以退為進,輝達的雲霸主夢未滅。即便市值已經突破 4 兆美元,我們還是低估了輝達,大大的低估了。在不少人的印象中,輝達依然是那個「核彈廠」。其實,在 AI 急需的晶片之外,輝達始終有一個雲平台的野心。2023 年,輝達的 DGX Cloud 高調登場,一台實例配備八塊 H100,月租 36999 美元,定價直達天花板,也被外界視作輝達挑戰 AWS、Azure 這些老牌雲廠商的訊號。然而,2025 年中,這個「親兒子」卻悄然退出 C 位。輝達不再將其數十億美元的雲支出承諾對齊 DGX Cloud,其角色轉向內部基礎設施與研發用途,而非面向企業市場的主打產品。取而代之的,是 2025 年新上線的 Lepton——一個 GPU 租賃與調度的市場型產品。從定義來看,新的 Lepton 是一個算力管理和分發平台,更像是一個算力需求的「入口」。DGX Cloud 為什麼退場?Lepton,能不能接承接住輝達在 AI 時代成為雲端運算霸主的野心?01. 以退為進很多人或許都還記得 2023 年的「GPU 荒」,企業即便有錢,也往往買不到 H100。於是輝達順勢推出了 DGX Cloud,把自有的高端算力叢集「按月出租」,企業開通即用。在推出的第一年,DGX Cloud 的確收穫了熱度。到 2024 年底,輝達的財報顯示其軟體與服務收入(包括 DGX Cloud)達到了 20 億美元的年化水平。然而,轉折點出現在 2024 年下半年後,隨著 GPU 供應逐漸緩解,亞馬遜、微軟、Google等雲廠商紛紛「砍價」,DGX Cloud 的優勢隨之消散。以亞馬遜的 AWS 為例,其對 H100 和 A100 實例降價幅度高達 45%,遠低於 DGX Cloud 的租賃價格。對客戶而言,DGX Cloud 的緊缺溢價很快失去立足點。輝達在 2023 年 3 月推出 DGX Cloud|圖片來源:GTC 2023更現實的問題還在於「管道衝突」。亞馬遜、微軟和Google是輝達最大的晶片買家,對輝達的營收構成了極大支撐。DGX Cloud 的直接客戶模式意味著輝達和這些合作夥伴搶生意。每一份 DGX Cloud 合同,都有可能擠壓 AWS、Azure 或 GCP 的收入。買家的擔心是可預期的,更長遠的後果,是推著這些夥伴加碼自研晶片,如 AWS 的 Trainium、Google的 TPU,以降低對輝達的結構性依賴。而且短時間內,建立起穩定的客戶黏性也是挑戰,有些企業會把 DGX Cloud 當作臨時方案,在產能緊繃、項目啟動急的窗口期租上幾個月,隨後再遷回長期合作的 AWS、Azure 或Google雲。輝達黃仁勳與Google雲高管同台|圖片來源:輝達考慮到這些,到最新的財年,輝達的財務披露中不再將巨額的雲支出承諾歸於 DGX Cloud,這項服務仍然列在收入類別中,但其角色已明顯轉向內22部基礎設施。換句話說,DGX Cloud 仍然存在,但它逐漸退回輝達內部,不再打算與微軟、亞馬遜、Google等公司正面競爭。除了選擇把 DGX Cloud「轉為內用」,輝達還把外部注意力引向一個新的平台化入口:Lepton。輝達在 2025 年 5 月推出這個新平台,也在 DGX Cloud 體系名下,但不同於 DGX Cloud 那種把「輝達自己的 AI 晶片直接租給客戶」的模式,Lepton 完全不碰 GPU 庫存,它只是負責「把需求導向合適的雲服務商」,包括 AWS、Azure,也包括輝達自己一手扶持的雲服務商。「Lepton 會將我們的全球 GPU 雲提供商網路與 AI 開發者連接起來。」輝達創始人兼 CEO 黃仁勳在發佈 Lepton 時稱,目標是:「打造一個全球規模的 AI 工廠」。簡而言之,為了不緩解和管道的競爭,輝達的策略重點已經不再是一個「輝達雲」。02. Nvidia「朋友圈」但 DGX Cloud 角色的淡出並不意味著輝達放棄了雲。在過去兩年裡,輝達一直在扶持自己的雲服務商「小弟」。而且還出現過讓人覺得匪夷所思的一幕——輝達一邊把 GPU 賣給雲夥伴,一邊又從這些夥伴那租回算力。以 CoreWeave 為例,輝達不僅在 2023 年投資了 CoreWeave 1 億美元,還向其優先供貨 H100 GPU。在供需緊張時期,這讓 CoreWeave 成為少數能大規模提供輝達 GPU 的雲服務商。而輝達自己又回過頭來,從 CoreWeave 租用這些 GPU。CoreWeave 承接 AI 東風順利上市|圖片來源:網路Lambda 也類似,這是一家規模小得多的 GPU 雲服務提供商。2025 年 9 月,輝達與 Lambda 簽訂了一份價值 15 億美元的租賃協議,租期為四年,其中包括租回 1 萬台搭載自家頂級 GPU 伺服器,總價值約 13 億美元。這個交易讓輝達成為 Lambda 最大的客戶,而輝達自己的研發團隊將使用這些 GPU 訓練模型。Lambda 也是輝達生態圈的一員|圖片來源:網路具體來說,輝達先通過銷售晶片獲得即時收入,讓財報好看、股東滿意;合作夥伴則依靠出租 GPU 獲得穩定現金流,從而擴大規模;隨後輝達再以租賃的方式把算力鎖定在自己手中,確保關鍵時刻不會斷供。此外,這和普通公司選擇租用雲服務而不是自建機房的邏輯是一樣的,可以更靈活地應對研發波峰和波谷。這個操作的精妙之處在於,晶片賣出的那一刻,收入立刻計入輝達帳面,支出則後置,租金在未來幾年慢慢攤銷,轉化為營運成本。與此同時,輝達無需自建資料中心,資產壓力最小化。對合作夥伴來說,輝達成了最大甲方,算力與現金流被繫結,強化了其生態黏性。更微妙的是,這種操作還能穩定市場心理。當連輝達都願意以這個價格回租,便相當於為AI 算力行情做了一次背書,錨定了價格預期,最終變成一石三鳥。這套玩法複製到了各種輝達系雲端運算初創公司中:賣晶片-投資客戶-租回服務-再次賣晶片,最終變成一個自循環的 AI 晶片生態資金鏈。與此同時,輝達還通過旗下專門的風險投資部門 Nventures,在更廣闊的 AI 生態下注。它投資了很多初創公司,從模型開發,到應用層的初創企業。雖然這些公司並非都做雲服務,但邏輯是一致的:通過投資繫結潛在客戶和未來生態,只要這些初創公司成長壯大,它們的算力需求最終都會轉化為對輝達晶片的採購。可以說,輝達不僅僅是在賣晶片,它就像是在經營一個龐大的 AI 創業孵化器,來打造一套「輝達系」雲生態。03. AI 算力的「App Store」說回 Lepton,它與輝達「賣一手、租一手」的本質有一點相似,就是給算力「做市」。與 DGX Cloud 直接對客戶不同,Lepton 並不親自經營雲服務,而是作為「流量調度者」,把客戶的任務分發給生態合作夥伴的資料中心。它本質上是一個算力市場,使用者只需在 Lepton 平台提交需求,Lepton 會自動匹配到可用的 H100 或 Blackwell GPU,無論這些硬體位於 CoreWeave、Lambda,還是 AWS、Azure 的機房。輝達 Lepton 平台介面|圖片來源:輝達而且,Lepton 將所有 GPU 雲資源整合到輝達的軟體棧之下,比如 NIM 微服務和 NeMo 框架。開發者無需關心背後的提供商,只需通過 Lepton 平台即可獲得一致的開發體驗和環境。更關鍵的是,Lepton 化解了輝達與雲巨頭的衝突。在這種模式下,輝達不再是 AWS、Azure 的直接競爭對手,而是中立的調度平台。AWS 和微軟也加入了 Lepton,原因很簡單,通過這個市場,它們能夠接觸到額外的算力需求。對於輝達來說,與合作夥伴對抗的風險太大,遠不如退到幕後,轉而做算力市場的調度者和掌控者。這是典型的「退一步,海闊天空」,不再冒犯合作夥伴,反而繼續掌控生態入口,不論客戶選擇那家雲,最終都離不開輝達的 GPU 和軟體棧。於是,放棄建構自己的雲服務就不是軟弱的表現,Lepton 對輝達來說是一個魚與熊掌兼得的策略。輝達 Lepton 平台介面|圖片來源:輝達當然,Lepton 的推廣也非一帆風順。一些中小型雲廠商擔心輝達借此插足客戶關係,或影響定價,它並非一夜之間就能改變遊戲規則。但當 AWS 和 Azure 都進入市場後,Lepton 的存在無法忽視。未來 AI 算力的跨雲調度,有可能會通過某個平台來完成。對開發者來說,「在那裡算」變得次要;能不能算、多久能算、成本如何才是核心,而這些正是 Lepton 試圖統一的體驗層。輝達不再需要自建一個「輝達雲」,也不必在 IaaS 層與夥伴正面相撞,它想做的是把所有玩家拉入自己的體系,讓所有雲使用輝達的 GPU、呼叫輝達的框架、通過輝達的入口完成採購與調度。如果順利,它看似只是一個 GPU 聚合市場,實則可以成為算力世界的控製麵板。誰接到單子,誰活得下去,分配權掌握在輝達手中。更長線的收益是資料與感知,Lepton 在跨雲調度過程中天然能觀察到那類任務最活躍、那些地域更緊張、那一代 GPU 使用更頻繁、價格彈性如何,反過來輔助商業決策。就像蘋果通過 App Store 掌控了移動網際網路,輝達想用 Lepton 做到同樣的事,只是對象從 App 換成了算力。輝達 Lepton 平台連接各種雲服務|圖片來源:輝達這也解釋了輝達當下的市場邏輯。簡言之,它並不需要擁有雲,它只需要擁有算力棧和需求入口。只要全球 AI 訓練與推理仍以其 GPU 為核心,無論算力最終落在亞馬遜 AWS、微軟 Azure、Google GCP,還是 CoreWeave、Lambda,無論客戶選擇誰,只要掌控價值鏈,輝達都能獲得價值。從 AI 晶片,到 DGX Cloud,再到現在的 Lepton,輝達的計畫早已經從硬體過渡到「算力」和「平台」的階段——任何一家公司市值突破 4 兆美元、其產品已經成為 AI 時代重要生產資料的公司,都不可能沒有更大的野心,不是嗎? (極客公園)
輝達收購LeptonAI對中國的啟示
3月26日,矽谷知名媒體揭露輝達即將以數億美元收購矽谷新創公司Lepton AI,引發AI產業震動。近年來,輝達主要客戶透過自研晶片和低價租賃策略不斷削弱其GPU市場壟斷地位,由此輝達通過投資佈局,持續補強其在軟件生態和應用落地的短板,實現從“硬體壟斷”向“硬體+軟件+應用全棧服務商”的生態佈局。本次收購Lepton AI正是輝達加碼雲和軟件領域佈局的戰略之舉,對中國AI基礎領域建設有重要啟示。01. 輝達收購Lepton AI事件分析數據中心業務是輝達核心成長引擎,2024財年貢獻78%營收(475億美元)。與此同時,輝達的主要客戶1微軟、亞馬遜和Google等加速自研晶片並提供低價算力租賃服務,對其持續成長構成威脅。為此,輝達正謀求從「賣鏟人」轉型為「全端服務商」。Lepton AI是一家提供GPU雲服務的AI初創公司,具備三方面優勢吸引輝達對其投資:一是輕量化資源調度。 Lepton AI 2的雲原生工具鏈FastGPU透過多雲整合技術與彈性調度演算法,協助客戶優化算力使用效率,降低算力成本,綜合費用約為亞馬遜等頭部企業的60-70% 3。二是低程式碼開發範式。 Lepton Search僅以500行程式碼實現對話式搜尋引擎,開源後迅速登上GitHub熱榜,其「極簡開發」理念降低開發者使用門檻,吸引更多「長尾客戶」。三是頂尖技術團隊。 Lepton AI創始人賈揚清是深度學習框架領域的標竿人物,曾主導開發PyTorch、Caffe等深度學習框架,團隊還集結了神經網絡交換標準ONNX的聯合創始人等頂尖人才,技術能力覆蓋AI框架、分佈式系統、雲原生工具鍊等關鍵領域。02. 輝達近兩年投資特點近兩年輝達投資活躍,共投資92次,投資密度遠超微軟和亞馬遜4。根據IT橘子和金融時報資料,2024年輝達投資規模突破10億美元,年增15%。同時,輝達加大收購力度,2024年共完成6起收購,超過前四年總和。輝達投資主體呈現「三駕馬車」架構:NVIDIA主導戰略投資與收購,重點補強AI軟件工具鏈;NVentures專注先進製造、生物醫療等垂直領域風險投資;Inception負責對初創企業開展孵化項目,通過硬體折扣、技術賦能構建開發者生態。總體而言,輝達近兩年投資呈現「生態佈局-技術創新-戰略聯盟」的三維特徵。1.生態佈局,建構「硬體+軟體+應用」的全鏈體系。一是AI基礎設施強化。 2024年收購Run:ai(資源調度)、Deci(模型優化)、OctoAI(推理服務)、Brev.dev(開發工具)、Shoreline(故障處理)五家企業,完善數據中心從算力分配到模型部署的全流程工具鏈,形成AI基礎設施生態閉環,本次收購Lepton AIpton AIpton 軟件的持續加碼。二是垂直場景滲透。輝達集中投資智慧製造、生物醫療兩大場景,投資企業數分別佔15%,自動駕駛場景也有涉獵,佔比4%。如投資金屬3D印刷Seurat Technologies,搶佔綠色製造賽道;收購AI醫療公司VinBrain,優化AI影像模型開發;參與自動駕駛Wayve融資,加速建構高精度虛擬測試環境。2.技術創新,佈局前沿領域搶佔下一代AI技術制高點。一是空間智慧領域,佈局圖形計算、虛擬模擬和空間感知技術。 2024年投資World Labs,專注世界模型(LWM)開發,將AI從2D影像處理提升至3D空間智慧領域;投資Figure AI、Bright Machines、Serve Robotics等七家機器人公司,覆蓋通用人形機器人、製造、配送全場景。二是生命科學領域,佈局基因工程、生物製藥等交叉學科。投資ArsenalBio(基因編輯)、Generate Biomedicine(蛋白質生成)等七家公司,致力於AI技術加速基因測序和縮短藥物研發周期。三是量子和光子計算領域,佈局光傳輸和GPU超高速計算。設立加速量子研究中心NVAQC,聯合哈佛、MIT、Quantinuum等合作夥伴研發量子糾錯、演算法模擬與硬控制優化技術,突破傳統算力計算問題;投資Xscape Photonics,利用其ChromX光子解決方案破解超大規模GPU群聚互聯瓶頸。3.戰略聯盟,以資本為紐帶強化產業鏈掌控權。一是產品繫結,建構GPU應用壁壘。透過投資OpenAI、xAI、CoreWeave等企業,在合作協議中嵌入GPU使用條款,既保障產品銷售又透過資本紐帶強化客戶粘性,使輝達產品成為AI研發的「默認選項」。二是追加投資,鎖定產業話語權。如在AI搜尋賽道,一年內對Perplexity AI實施兩輪注資,推動其估值飆升9倍至90億美元,遠超行業平均水平,以較低成本實現對AI搜尋賽道的掌控。03. 本次收購事件的啟示1.建構自主可控的國產技術生態體系。一是加速建構自主開源技術生態,透過政策引導與市場激勵結合,推動昇騰、MindSpore等國產技術標準完善,提升國產技術應用比例,維持與國際主流標準相容互通,實現技術生態的平穩過渡。二是優勢場景突破,如在機器人、自動駕駛領域鼓勵發展國產高速互聯標準,取代輝達NVLink生態,推動晶片、框架、演算法與應用的縱向深度融合,在中國優勢場景中搶佔話語權。第三是持續加強國產高階AI晶片攻關,應對輝達下一代晶片架構Rubin(2026)和Feynman(2028),重點推進量子晶片研發,突破超高速、大規模平行計算瓶頸,提升高階晶片領域核心競爭力。2.推動算力建設從物理基建邁向精準使用。一是提升中國算力智能調度能力,在「東數西算」工程中進一步深化「軟體定義算力」的新範式,針對多叢集廣域網高效互聯、跨硬體異構管理等領域加強研發,提升使用效率。二是加速推動分散式算力網絡建設,探索基於國產晶片的算力聯盟,透過跨區域、跨企業協作建構自主可控的算力池,整合閒置算力資源,試點「算力銀行」模式,提高利用率。第三是加強AI應用工具開發,類似Lepton Search透過極簡程式碼生成AI應用,推動低程式碼工具鏈開發,並加強與國產硬體和軟件框架的協同優化,降低中小企業使用AI的技術門檻,推動算力使用。3.加強關鍵基礎技術攻關與商業轉化。一是鼓勵企業、大學、研究機構加強關鍵基礎技術科研,透過技術競賽、人才激勵等舉措,吸引高技術人才開展深度學習架構、AI編譯器等底層領域研發。二是加速研發成果轉化,完善針對技術型初創企業的扶持政策,如稅收減免、設立「AI框架專項基金」等,通過政策引導資本投向底層技術領域,重點支援關鍵基礎技術攻關項目,激勵底層技術研發。 (天翼智庫)
20人創業神話,老黃數億刀收購!AI大牛賈揚清、白俊傑被曝入職輝達
創立兩年的Lepton AI被輝達收入囊中!聯創AI大牛賈揚清和白俊傑,已經加入收購方輝達。這次收購將完善輝達的AI投資佈局。靴子落地,創立兩年的Lepton AI被輝達收入囊中!據The Information報導,輝達斥資數億美元,完成了對AI大牛賈揚清創企Lepton AI的收購。目前,Lepton AI的聯創賈揚清(下圖左)和白俊傑(下圖右),均已入職輝達。Lepton AI創立2年,團隊規模20人,AI制富神話可見一斑!Lepton AI:黃金級AI雲服務商Lepton AI成立於2023年,專注於人工智慧基礎設施(AI Infra),總部位於加州帕洛阿托,約有20名員工。2023年5月,該公司完成了1100萬美元的天使輪融資。其客戶包括擁有數十萬活躍使用者的AI遊戲公司Latitude.io以及科研平台SciSpace等。Lepton AI通過創新的「雲原生+多雲整合」技術,從雲提供商租用輝達GPU,再轉租給客戶。這一模式能以低成本在全球範圍內靈活調度GPU資源,滿足客戶的AI算力需求。Lepton AI還為客戶提供工具,方便他們訓練和運行AI模型,或者基於Python程式語言建構雲應用程式。旗下的Lepton AI Cloud平台專門針對AI工作負載進行了最佳化,提供多種顯示卡,配備可視化介面,讓使用者能管理每個項目分配到的硬體資源。Lepton AI能以每秒超過600個token的處理速度運算,同時將延遲控制在10毫秒以內。需求增加時,平台會自動為推理環境增加更多硬體資源,還會用vLLM等工具進一步提升推理速度。在SemiAnalysis的GPU雲端運算叢集評級中,LeptonAI獲得黃金級評價LeptonAI Python庫,能夠輕鬆地利用Python程式碼建構AI服務,目前在Github上有2.7K星。其主要功能包括:Python風格的抽象Photon,只需幾行程式碼即可將研究和建模程式碼轉換為服務。簡單的抽象,允許幾行程式碼就能啟動類似HuggingFace上的模型。為常見模型(如Llama、SDXL、Whisper等)提供了預建構的示例。提供專為AI定製的功能,如自動批處理、後台任務等。一個客戶端,能夠像呼叫本地Python函數一樣自動呼叫服務。Python風格的組態規範,便於在雲環境中部署。聯創加入輝達Lepton AI創始人賈揚清畢業於清華大學,之後在加州大學伯克利分校獲得博士學位。2013年,在伯克利讀博時,賈揚清用輝達捐贈的一塊K20 GPU,開發出深度學習框架Caffe。這個起初只是業餘時間做的項目,成了全球第一個通用深度學習框架。在導師鼓勵下,他將Caffe開源,很快就被微軟、雅虎、輝達、Adobe等公司採用。2019年,賈揚清加入阿里巴巴,擔任技術副總裁。他推動建設了巨量資料和AI平台,還主導了開源模型社區「魔搭」,實現了從AI框架專家到雲端運算業務領導者的轉變。2023年,賈揚清從阿里離職,創辦了Lepton AI。和賈揚清一起加入輝達的,還有Lepton AI的另一位聯合創始人白俊傑。白俊傑與賈揚清有著相似的職業經歷,他們都曾在Meta和阿里雲任職。在Meta擔任AI研究員期間,兩人共同參與了PyTorch框架的開發工作。後來,白俊傑在阿里雲擔任AI平台總監,帶領全端AI工程團隊攻克了諸多技術難題。輝達的「AI帝國」輝達,投資了一系列AI相關的公司,建構了龐大的AI帝國。其中包括以色列GPU創企Run:ai、以色列AI創企Deci、西雅圖AI創企 OctoAI,這些企業聚焦於降低開發或運行由輝達支援的AI模型的成本。輝達這次收購Lepton AI,有著很重要的戰略考慮。通過收購Lepton AI,輝達能讓客戶按需租用GPU資源,靈活擴展AI工作負載。Lepton AI在AI演算法、模型最佳化等方面的獨到之處,有望進一步提高計算效率。Lepton AI在一些細分市場裡,積累了一定的客戶基礎和管道資源,通過收購,輝達可以進入這些領域。輝達的雲服務和軟體業務尚處於起步階段,面臨著Google雲、微軟、AWS等科技巨頭的激烈競爭。三個月前,輝達公佈軟體、服務和支援業務的年化收入是15億美元,和之前預計的20億美元有差距。一方面,收購Lepton AI,輝達能進一步拓展自己在雲端運算市場的業務佈局,鞏固領先地位。另一方面,賈揚清和白俊傑等人才的加入,給輝達帶來了強大的技術研發力量。他們的豐富經驗和專業知識,有望助力輝達在AI模型開發工具、雲服務最佳化等方面,取得更多創新成果。據記者Marina Temkin(CFA持證人)統計,核心投資,投資至少1億美元:(資料截至2024年7月)OpenAI:2023年10月參與6.6億美元融資輪(估值1570億美元),出資1億美元xAI:數月後轉身投資馬斯克旗下60億美元融資的競品公司Inflection:2023年6月領投13億美元,後因創始團隊被微軟挖角估值縮水其他億美元俱樂部:Wayve(自動駕駛):2024年5月參與10.5億美元融資Scale AI(資料標註):2024年5月聯合投資10億美元(估值140億)Mistral AI(法國大模型):2024年6月6.4億美元B輪(估值60億)CoreWeave(雲端運算):2023年4月注資後估值從20億飆升至190億(最近成功IPO,估值230億美元)此外,輝達的戰略佈局既包括GPU生態,也包括了全球不同的產業應用。晶片生態:投資GPU雲服務商Lambda(4.8億D輪)、CoreWeave前沿技術:涵蓋光學互聯(Ayar Labs)、醫療AI(Hippocratic AI)、智慧型手機器人(Bright Machines)全球覆蓋:從日本Sakana AI到加拿大Cohere而近期,頻頻傳來AI資料中心過剩的消息。也許,被輝達收購是Lepton AI的最佳選擇。 (新智元)
輝達收購阿里前副總裁創辦的公司Lepton AI
4月8日消息,輝達完成了對GPU租賃商Lepton AI的收購交易。Lepton AI由阿里前副總裁賈揚清創立於2023年,團隊約20人。據悉此次收購耗資數億美元,Lepton AI的創始人賈揚清和白俊傑都已加入輝達。作為全球AI算力市場的"軍火商",輝達顯然不滿足於只做晶片供應商的角色,在雲端運算三巨頭AWS、Azure和GCP的圍堵下,黃仁勳正在下一盤更大的棋。通過收購Lepton AI這類"中間商"企業,輝達不僅能把控從晶片研發到雲服務落地的全產業鏈,更能在生成式AI應用爆發的清晨時分,直接收割那些需要靈活算力卻無力簽訂長期雲合同的中小企業使用者。這場看似低調的收購,背後暗藏著輝達建構AI帝國版圖的野心。當OpenAI等企業還在為高額算力帳單發愁時,輝達已悄然將業務拓展到眾多AI創業公司的伺服器機房。- 01 - Caffe之父創業Lepton AI創始人賈揚清是浙江紹興人,AI架構領域的傳奇人物。他本碩均畢業於清華大學自動化系,在加州大學伯克利分校攻讀電腦科學博士學位期間,開發出深度學習框架Caffe,該框架成為全球最受歡迎的開源深度學習框架之一。畢業後,賈揚清先後在新加坡國立大學、NEC美國實驗室以及Google Brain工作積累經驗。2019年3月,賈揚清加入阿里巴巴,擔任技術副總裁,同年9月還擔任阿里巴巴集團副總裁等重要職務。作別阿里4個月後,也就是2023年7月,這位“Caffe之父”與同樣出身阿里的技術大牛白俊傑(ONNX神經網路交換標準開創者)和李響(Kubernetes核心元件etcd創始人)組成“技術夢之隊”,新公司Letpon AI正式浮出水面。公司名稱源於物理學中的輕子(Lepton),寓意以輕盈之姿改變算力世界的底層邏輯。他們用500行程式碼打造的對話式搜尋引擎Lepton Search,打破了傳統AI開發的壁壘,將Google、Meta等巨頭的雲端經驗普及開來。(科普:Lepton Search是賈揚清團隊開發的開源對話式人工智慧(AI)搜尋引擎。它基於Transformer模型和知識圖譜,旨在通過自然語言互動理解使用者的真實意圖,提供智能化的搜尋體驗。)- 02 - 不生產GPU,但讓GPU更好使Lepton AI致力於為企業提供高效、可擴展的AI應用平台。因其採用的是雲原生的多雲解決方案,所以能賦能任何一家GPU提供商迅速升級。通俗的說,Lepton AI就像AI世界的“算力法師”,雖不直接擁有GPU硬體,卻通過雲端建構起一張覆蓋全球的計算網路。他們從AWS等雲廠商租用輝達晶片,併疊加自研的智能調度系統,成功助力遊戲公司Latitude.io的數十萬玩家流暢體驗AI角色互動,也幫助科研機構SciSpace從海量論文中精準抓取資料。其獨創的“多雲拼圖”模式,用統一API整合不同雲平台資源,使企業能以“每GPU小時多花幾分錢”的代價,獲得高性能專業級算力,直擊開發者等“買不起、管不好”的痛點。僅兩年時間,Lepton AI就被SemiAnalysis評為全球GPU雲服務黃金梯隊中“唯一未燒錢囤貨的玩家”。2023年5月,Lepton AI完成了1100萬美元天使輪融資,投資方包括矽谷知名風投CRV、紅杉中國和Fusion Fund。並且,這三家投資機構在不到兩年時間內就實現投資退出,獲得了可觀的財務回報。- 03 - 輝達為何重金收購Lepton AI其實簡單來說,Lepton AI的主要業務是出租由輝達AI晶片驅動的伺服器。在當前競爭激烈的AI算力市場中,輝達以數億美元收購Lepton AI,是其從“硬體霸主”向“全端服務商”戰略轉型的重要一步。如今,亞馬遜AWS、Google雲等雲服務巨頭紛紛自研AI晶片(如AWS Trainium、GoogleTPU),並推行低價租賃策略,輝達的GPU壟斷地位面臨“去輝達化”的威脅。而Lepton AI的“雲原生+多雲整合”技術,能夠以極低的成本調度全球GPU資源,其輕量化軟體工具鏈(如僅用500行程式碼打造的搜尋引擎)與輝達CUDA生態深度協同,有效彌補了輝達在雲服務與企業軟體市場的短板。通過將Lepton AI的技術團隊納入麾下,輝達得以建構“晶片+雲平台”的端到端解決方案,既抵禦雲巨頭的生態閉環衝擊,又能滲透中小型企業市場,推動其軟體業務收入向1500億美元的長期目標邁進。- 04 - 輝達近年來的併購佈局在戰略併購層面,輝達近年來在AI基礎設施領域頻繁佈局。2024年,輝達以7億美元收購叢集管理平台Run.ai,3億美元收購模型最佳化企業Deci,並先後納入推理加速工具OctoAI和合成資料公司Gretel。這些收購涵蓋AI開發全鏈條,目的是降低AI開發成本、鞏固算力基礎設施主導權。Run.ai最佳化GPU資源調度,Deci提升模型能效比,Gretel解決訓練資料瓶頸,共同形成從晶片到應用的閉環生態。目前,這些企業已深度整合至輝達AI Enterprise套件。例如,Run.ai的技術使GPU利用率提升40%,Deci的自動化壓縮演算法幫助客戶降低30%推理成本。這種“拼圖式併購”策略成效顯著,使得輝達在2024年雲與軟體業務收入突破15億美元,較三年前增長近5倍。- 05 - 全球AI雲服務市場的競爭格局與挑戰全球AI雲服務市場正以38%的年復合增速迅猛發展,預計2025年規模將突破2000億美元。當前,市場競爭呈現“三足鼎立”的格局。輝達憑藉硬體優勢與生態整合佔據主導地位,AWS、Google雲通過自研晶片與低價策略爭奪份額,阿里雲、華為雲則加速國產晶片(如昇騰910B)與開源生態建設。然而,近日一熱點問題是,中美關稅問題的日益激烈。若進一步升級,輝達或也即將面臨“軟硬一體”戰略的雙重打擊。具體來說:晶片出口限制可能削弱其硬體根基,資料主權博弈可能導致區域雲服務割據。例如,美國擬對資料中心裝置加征25%關稅,這將推高伺服器採購成本3%-5%,迫使企業轉向墨西哥或東南亞設廠。同時,地緣政治因素可能加速技術替代。中國推動昇騰晶片與MindSpore框架協同發展,歐盟推進Gaia-X主權雲建設,全球AI基礎設施可能分裂為美、中、歐三大技術陣營。這種碎片化不僅會抬高研發成本,還可能降低全球AI創新效率。對於中國而言,美國對華晶片出口限制若進一步收緊,短期內可能加劇中國企業的算力成本壓力,但長期來看將促使本土技術破天。天數智芯已實現國產GPU對DeepSeek模型的快速適配,DeepSeek等企業也開始探索低算力依賴模型,試圖突破硬體封鎖。加上政策扶持下的產業鏈協同(如《新一代人工智慧發展規劃》),或加速形成“去輝達化”的平行生態。這場全球範圍內的博弈不僅會重塑全球算力供應鏈,還可能導致技術標準分裂,使AI基礎設施市場從“性能競賽”轉向“生態割據”的新競爭階段。 (鉛筆道)
賈揚清創業2年,老黃砸重金收購!AI框架締造者或賣出數億美金
【新智元導讀】巨頭輝達,即將收購阿里前副總裁賈揚清的初創Lepton AI,交易價值或達數億美元!而Lepton AI,僅僅創立兩年。就在剛剛,國內AI圈被這一消息刷屏了。賈揚清成立兩年的AI初創公司Lepton AI,即將被輝達收購。據外媒The Information報導,輝達正在接近達成收購Lepton AI的協議,交易金額為數億美元。而Lepton AI的主要業務,就是專門出租由輝達AI晶片驅動的伺服器。根據賈揚清介紹,在SemiAnalysis評選的neolcould解決方案中,Lepton AI是唯一一個沒有重金採購GPU的公司。因為他們採用的是雲原生的多雲解決方案,能讓任何一家GPU提供商迅速升級。為什麼輝達選擇在此時重金收購Lepton AI?原因是,亞馬遜和Google這些老客戶步步緊逼,輝達被逼得實在沒有辦法了,不得不立刻轉型!老客戶背刺,輝達被迫轉型本來,亞馬遜和Google都是輝達的最大客戶,但現在,它們紛紛通過開發、低價租賃替代晶片,來降低對輝達的依賴。這樣導致的結果,就是輝達的收入大幅減少。而收購Lepton AI,是輝達進軍雲端運算和企業軟體市場戰略佈局的一部分,目的就是為了和亞馬遜、Google開戰。Lepton AI的總部位於加州,在租賃輝達GPU伺服器業務上,它和Together AI之類的初創公司是直接競品。注意,這些公司並不會自行管理資料中心或伺服器,而是先從雲服務提供商租用伺服器,再租給自己的客戶。這個業務,利潤空間就很大了。據悉,Together AI如今已經實現了超過1.5億美元的年化收入,換算一下,就是大概1250萬美元的月收入。這類企業,在業內被稱為「推理服務提供商」或「GPU轉售商」。另外,他們的業務除了硬體租賃,還包括開發自己的軟體平台,幫助其他初創公司或軟體企業這類客戶在雲環境中建構和管理自己的生成式AI應用。不過跟Together相比,Lepton AI的收入規模就沒有那麼大了。他們AI雲服務的主要客戶,有遊戲初創公司Latitude.io和科研初創公司SciSpace。前者使用使用Lepton AI來運行AI模型,支援一項月活使用者已達數十萬的服務。後者使用Lepton AI為學術論文搜尋引擎提供技術支援。總之外媒稱,跟Together、Firewoks這些競爭對手相比,Lepton AI在市場上的形象總體比較低調。被輝達高價收購的Letpon AI,是何背景?2023年7月,賈揚清離職阿里4個月後,新公司Letpon AI正式浮出水面。這是一家專注於人工智慧基礎設施的公司,總部位於美國加利福尼亞州Palo Alto。Lepton AI這個名稱源自物理學中的一種基本粒子——輕子。公司曾於23年5月成立之前,完成了首輪1100萬美元天使融資,由Fusion Fund、CRV領投。當時,賈揚清在回覆Pytorch之父評論中,曾提到還有兩位聯創與其一起創辦了新公司,分別是ONNX創始人以及etcd的創始人。此前,賈揚清最初在Google大腦擔任研究科學家,還參與建構了部分支援Kubernetes的軟體,Kubernetes是一個起源於Google的大規模雲應用程式管理工具。2016年,他加入Meta擔任AI研究員後,又與白俊傑一起參與了PyTorch的開發。Letpon AI的核心定位是,成為「AI時代雲服務提供商」,旨在建立高效的AI應用平台。其主要業務通過提供大模型推理引擎和雲GPU解決方案,幫助企業去快速部署AI應用。而且,他們還建立了多雲平台,整合全球GPU資源,讓使用者獲得極具性價最高計算資源。而且,團隊還開發了一款智能搜尋引擎Lepton Search,僅用500行Python程式碼建構,以輕量級、高效著稱。輝達之困:光靠賣GPU,已經不夠了為什麼輝達要收購Lepton AI?顯然,這是計畫的一部分。輝達,如今顯而易見正在建構全新的業務版圖。雖然它的雲端運算和軟體業務目前尚處於起步階段,但它已經開始向企業出租由自家晶片驅動的伺服器,同時還會提供軟體,幫企業開發AI模型和應用,以及管理用於訓練AI的GPU叢集。根據輝達的估計,這些業務未來有望創造高達1500億美元的收入。GTC大會上,老黃宣佈:輝達正在建構3個AI基礎設施——雲上AI基礎設施,企業AI基礎設施和機器人AI基礎設施不過有些微妙的是,在本月中最近一次季度財報電話會議上,輝達卻完全迴避了這一話題。三個月前,輝達靠軟體、服務和支援業務,已經實現了15億美元的年化收入(每月約1.25億美元),而輝達預計,這一數字將在2024年底前攀升至20億美元。而輝達的晶片業務,在截至1月26日的財季中創造的收入為356億美元。總之,雖然AI晶片仍然是輝達的核心收入來源,但顯然,軟體、服務和支援業務的增長潛力巨大,輝達已經下定決心,瓜分這一塊蛋糕。輝達2025財年第四季度財報顯示,公司發展一片大好,市場對AI晶片的需求依舊強勁輝達,大力發展工業客戶符合這一步調的是,輝達最近幾個月一直在大力宣傳自家的軟體產品。雖然過去幾年中,輝達大概一半的AI伺服器晶片,都是被雲服務提供商買走了,不過老黃表示——長期來看,輝達對其他類型企業的銷售額佔比,將遠遠大於對雲服務提供商的銷售額。他還暗示道,包括汽車製造商在內的工業企業,未來會直接購買AI晶片,而不是從雲服務商那裡租用。此前大家對AI晶片的批評,主要就集中在價格昂貴、需求旺盛,讓企業想擴展AI應用規模時,面臨成本上的巨大壓力。但最近,DeepSeek這種價格親民的強大模型,已經讓局面徹底改變了。而這幾年,輝達也在一刻不停地收購小型生成式AI和雲端運算初創公司,為的就是降低成本,讓開發者能輕鬆使用輝達晶片。過去一年,輝達就斥巨資收購了Run.ai和Deci,代價或許超過10億美元。而最近收購的則是OctoAI和Gretel。輝達一直在收購小型生成式AI和雲端運算初創公司,以降低成本並使開發者更容易使用其晶片運行AI模型GPU雲服務評級,賈揚清初創進第二梯隊SemiAnalysis最新文章中,發佈了世界上首個GPU雲服務評級系統ClusterMAX™。這個系統主要以普通使用者的角度對GPU進行評,共分為5個不同等級:白金、黃金、白銀、青銅和不及格。目前,他們已獨立測試了數十種GPU。白金代表著引領行業標準的GPU雲服務,目前也僅有一家CoreWeave達到這一等級。而在超大規模雲服務提供商中,Oracle的GPU租賃價格是最低的之一。評測結果還顯示,一些青銅提供商,已經在努力趕上如Google雲。Google雲也在快速發展,有望下次衝進黃金/白金。值得一提的是,Lepton AI這家僅成立2年的公司,成功進入第二梯隊(黃金)。Lepton AI,具體是幹什麼的Lepton AI本身不擁有GPU硬體,而是專注於提供一個ML平台軟體層,用於管理和最佳化GPU資源。不論是初創公司,還是個人開發者, Lepton AI宣稱皆能賦予專業級算力支援。他們提供了兩種靈活的使用方式,具體來說:· 租用GPU:Lepton AI會從其他供應商租用GPU,在疊加上自家軟體層,每GPU小時僅需額外之父幾分錢。· 自選GPU:從價格更優的Nebius租用GPU,然後單獨購買Lepton AI軟體和服務,同樣是每GPU小時幾分錢,即可享受完整的平台功能。他們將Google、Meta等科技巨頭在機器學習平台上的經驗「平民化」,讓普通使用者也能輕鬆上手。這種靈活性,能夠讓使用者根據預算和需求自行選擇。Lepton AI工程團隊憑藉著敏銳的產品洞察力,確保了平台高效性。針對訓練,他們提供了一種類似Slurm的作業提交方法。在SemiAnalysis測試中,將現有的sbatch指令碼正常運行在Lepton AI平台上,僅需幾分鐘的時間。而且,轉換到平台進行訓練的過程相當直觀。不過,Lepton AI提供的類似於Slurm sbatch功能,而非完整的 sbatch超集API。此外,Lepton AI的控制台儀表板,是其一大亮點。使用者可以輕鬆查看節點生命周期,即時監控每個節點當前的作業和狀態,可視化功能僅次於CoreWeave的節點生命周期儀表板。並且,Lepton AI推出的開源解決方案gpud,已經為大多數被動健康檢查項目提供了全面的支援。雖然這個被動GPU檢查系統仍在持續最佳化中,但已經算是非常強大的解決方案。此外,Lepton AI也會提供手動主動健康檢查功能,比如DCGM診斷和nccl-tests,但這些檢查需要通過UI儀表板手動運行,不像CoreWeave那樣能夠自動按周進行定期檢查。還不足的是,Lepton AI沒有提供NCCL測試的參考數值,也缺少Megatron Loss收斂主動健康檢查或Nvidia TinyMeg2靜默資料損壞(SDC)檢測器主動健康檢查。另外,Lepton AI還提供了一些測試版功能,比如一鍵式零影響NCCL分析器。只需點選一個複選框,就能充分利用其自主研發的內部NCCL分析器來可視化集體通訊瓶頸,這樣就能幫助客戶最佳化網路性能瓶頸。賈揚清:Caffe之父,AI框架締造者提到賈揚清,可以說是業內耳熟能詳的「框架大神」。作為主流AI框架Caffe創始人、TensorFlow的作者之一,PyTorch 1.0的共同締造者,他的貢獻早已深入AI開發的每個角落。賈揚清,浙江紹興人,本科和研究生階段都就讀於清華大學自動化專業。在研究生學習期間,他曾在新加坡國立大學、微軟亞洲研究院、NEC美國實驗室和Google研究院工作/實習,積累了豐富的實踐經驗。2008年,他赴往加州大學伯克利分校攻讀電腦科學博士,導師是Trevor Darrell教授。在博士期間,他創立並開放原始碼的深度學習框架Caffe。這個框架一經推出,因其高效性、易用性迅速走紅,被微軟、雅虎、輝達、Adobe等公司採用。畢業後,2013年,賈揚清正式加入Google大腦團隊,在Hinton和Jeff Dean等人的帶領下,參與了TensorFlow平台的開發 。此外,他還與同事一起建立了全新深度學習架構GoogLeNet——首個在圖像分類任務中,超越人類精準性的神經網路。3年後,賈揚清轉投Facebook(Meta),在Yann LeCun領導下擔任研究科學家,並在2017年,晉陞為AI架構總監。在此期間,賈揚清在AI架構的大道上一路進擊:· 2016年11月,Facebook推出輕量級模組化的深度學習框架Caffe2Go,讓手機也能運行深度神經網路模型。· 2017年4月,Facebook宣佈開源產品級深度學習框架Caffe2,帶來跨平台機器學習工具。· 2017年,建立了首個開放模型格式ONNX原型,後來被FB、微軟、亞馬遜等公司聯合推廣。2018年5月,Facebook正式公佈的PyTorch 1.0整合了ONNX格式。2019年3月18日,賈揚清加入阿里達摩院,擔任技術副總,負責巨量資料以及AI方向的技術、產品和業務。直到2023年3月,他官宣離職,並在幾個月之後創辦了Lepton AI。根據個人首頁,賈揚清被引數最高的三篇論文,TensorFlow和Caffe赫然在列,他的每一步都推動了深度學習工具普及與進化。曾有網友戲稱,學物理繞不開牛頓,搞深度學習,繞不開賈揚清。 (新智元)