賈揚清創業2年,老黃砸重金收購!AI框架締造者或賣出數億美金

【新智元導讀】巨頭輝達,即將收購阿里前副總裁賈揚清的初創Lepton AI,交易價值或達數億美元!而Lepton AI,僅僅創立兩年。


就在剛剛,國內AI圈被這一消息刷屏了。

賈揚清成立兩年的AI初創公司Lepton AI,即將被輝達收購。

據外媒The Information報導,輝達正在接近達成收購Lepton AI的協議,交易金額為數億美元。

而Lepton AI的主要業務,就是專門出租由輝達AI晶片驅動的伺服器。

根據賈揚清介紹,在SemiAnalysis評選的neolcould解決方案中,Lepton AI是唯一一個沒有重金採購GPU的公司。

因為他們採用的是雲原生的多雲解決方案,能讓任何一家GPU提供商迅速升級。



為什麼輝達選擇在此時重金收購Lepton AI?

原因是,亞馬遜和Google這些老客戶步步緊逼,輝達被逼得實在沒有辦法了,不得不立刻轉型!


老客戶背刺,輝達被迫轉型

本來,亞馬遜和Google都是輝達的最大客戶,但現在,它們紛紛通過開發、低價租賃替代晶片,來降低對輝達的依賴。

這樣導致的結果,就是輝達的收入大幅減少。


而收購Lepton AI,是輝達進軍雲端運算和企業軟體市場戰略佈局的一部分,目的就是為了和亞馬遜、Google開戰。

Lepton AI的總部位於加州,在租賃輝達GPU伺服器業務上,它和Together AI之類的初創公司是直接競品。

注意,這些公司並不會自行管理資料中心或伺服器,而是先從雲服務提供商租用伺服器,再租給自己的客戶。

這個業務,利潤空間就很大了。

據悉,Together AI如今已經實現了超過1.5億美元的年化收入,換算一下,就是大概1250萬美元的月收入。

這類企業,在業內被稱為「推理服務提供商」或「GPU轉售商」。

另外,他們的業務除了硬體租賃,還包括開發自己的軟體平台,幫助其他初創公司或軟體企業這類客戶在雲環境中建構和管理自己的生成式AI應用。

不過跟Together相比,Lepton AI的收入規模就沒有那麼大了。

他們AI雲服務的主要客戶,有遊戲初創公司Latitude.io和科研初創公司SciSpace。前者使用使用Lepton AI來運行AI模型,支援一項月活使用者已達數十萬的服務。後者使用Lepton AI為學術論文搜尋引擎提供技術支援。

總之外媒稱,跟Together、Firewoks這些競爭對手相比,Lepton AI在市場上的形象總體比較低調。


被輝達高價收購的Letpon AI,是何背景?

2023年7月,賈揚清離職阿里4個月後,新公司Letpon AI正式浮出水面。

這是一家專注於人工智慧基礎設施的公司,總部位於美國加利福尼亞州Palo Alto。Lepton AI這個名稱源自物理學中的一種基本粒子——輕子。

公司曾於23年5月成立之前,完成了首輪1100萬美元天使融資,由Fusion Fund、CRV領投。


當時,賈揚清在回覆Pytorch之父評論中,曾提到還有兩位聯創與其一起創辦了新公司,分別是ONNX創始人以及etcd的創始人。

此前,賈揚清最初在Google大腦擔任研究科學家,還參與建構了部分支援Kubernetes的軟體,Kubernetes是一個起源於Google的大規模雲應用程式管理工具。

2016年,他加入Meta擔任AI研究員後,又與白俊傑一起參與了PyTorch的開發。



Letpon AI的核心定位是,成為「AI時代雲服務提供商」,旨在建立高效的AI應用平台。

其主要業務通過提供大模型推理引擎和雲GPU解決方案,幫助企業去快速部署AI應用。而且,他們還建立了多雲平台,整合全球GPU資源,讓使用者獲得極具性價最高計算資源。



而且,團隊還開發了一款智能搜尋引擎Lepton Search,僅用500行Python程式碼建構,以輕量級、高效著稱。



輝達之困:光靠賣GPU,已經不夠了

為什麼輝達要收購Lepton AI?顯然,這是計畫的一部分。

輝達,如今顯而易見正在建構全新的業務版圖。

雖然它的雲端運算和軟體業務目前尚處於起步階段,但它已經開始向企業出租由自家晶片驅動的伺服器,同時還會提供軟體,幫企業開發AI模型和應用,以及管理用於訓練AI的GPU叢集。

根據輝達的估計,這些業務未來有望創造高達1500億美元的收入。


GTC大會上,老黃宣佈:輝達正在建構3個AI基礎設施——雲上AI基礎設施,企業AI基礎設施和機器人AI基礎設施


不過有些微妙的是,在本月中最近一次季度財報電話會議上,輝達卻完全迴避了這一話題。

三個月前,輝達靠軟體、服務和支援業務,已經實現了15億美元的年化收入(每月約1.25億美元),而輝達預計,這一數字將在2024年底前攀升至20億美元。

而輝達的晶片業務,在截至1月26日的財季中創造的收入為356億美元。

總之,雖然AI晶片仍然是輝達的核心收入來源,但顯然,軟體、服務和支援業務的增長潛力巨大,輝達已經下定決心,瓜分這一塊蛋糕。


輝達2025財年第四季度財報顯示,公司發展一片大好,市場對AI晶片的需求依舊強勁


輝達,大力發展工業客戶

符合這一步調的是,輝達最近幾個月一直在大力宣傳自家的軟體產品。

雖然過去幾年中,輝達大概一半的AI伺服器晶片,都是被雲服務提供商買走了,不過老黃表示——

長期來看,輝達對其他類型企業的銷售額佔比,將遠遠大於對雲服務提供商的銷售額。

他還暗示道,包括汽車製造商在內的工業企業,未來會直接購買AI晶片,而不是從雲服務商那裡租用。

此前大家對AI晶片的批評,主要就集中在價格昂貴、需求旺盛,讓企業想擴展AI應用規模時,面臨成本上的巨大壓力。

但最近,DeepSeek這種價格親民的強大模型,已經讓局面徹底改變了。

而這幾年,輝達也在一刻不停地收購小型生成式AI和雲端運算初創公司,為的就是降低成本,讓開發者能輕鬆使用輝達晶片。

過去一年,輝達就斥巨資收購了Run.ai和Deci,代價或許超過10億美元。而最近收購的則是OctoAI和Gretel。


輝達一直在收購小型生成式AI和雲端運算初創公司,以降低成本並使開發者更容易使用其晶片運行AI模型


GPU雲服務評級,賈揚清初創進第二梯隊

SemiAnalysis最新文章中,發佈了世界上首個GPU雲服務評級系統ClusterMAX™。

這個系統主要以普通使用者的角度對GPU進行評,共分為5個不同等級:白金、黃金、白銀、青銅和不及格。

目前,他們已獨立測試了數十種GPU。



白金代表著引領行業標準的GPU雲服務,目前也僅有一家CoreWeave達到這一等級。而在超大規模雲服務提供商中,Oracle的GPU租賃價格是最低的之一。

評測結果還顯示,一些青銅提供商,已經在努力趕上如Google雲。Google雲也在快速發展,有望下次衝進黃金/白金。

值得一提的是,Lepton AI這家僅成立2年的公司,成功進入第二梯隊(黃金)。


Lepton AI,具體是幹什麼的

Lepton AI本身不擁有GPU硬體,而是專注於提供一個ML平台軟體層,用於管理和最佳化GPU資源。

不論是初創公司,還是個人開發者, Lepton AI宣稱皆能賦予專業級算力支援。

他們提供了兩種靈活的使用方式,具體來說:

· 租用GPU:Lepton AI會從其他供應商租用GPU,在疊加上自家軟體層,每GPU小時僅需額外之父幾分錢。

· 自選GPU:從價格更優的Nebius租用GPU,然後單獨購買Lepton AI軟體和服務,同樣是每GPU小時幾分錢,即可享受完整的平台功能。

他們將Google、Meta等科技巨頭在機器學習平台上的經驗「平民化」,讓普通使用者也能輕鬆上手。

這種靈活性,能夠讓使用者根據預算和需求自行選擇。Lepton AI工程團隊憑藉著敏銳的產品洞察力,確保了平台高效性。

針對訓練,他們提供了一種類似Slurm的作業提交方法。

在SemiAnalysis測試中,將現有的sbatch指令碼正常運行在Lepton AI平台上,僅需幾分鐘的時間。而且,轉換到平台進行訓練的過程相當直觀。

不過,Lepton AI提供的類似於Slurm sbatch功能,而非完整的 sbatch超集API。

此外,Lepton AI的控制台儀表板,是其一大亮點。

使用者可以輕鬆查看節點生命周期,即時監控每個節點當前的作業和狀態,可視化功能僅次於CoreWeave的節點生命周期儀表板。



並且,Lepton AI推出的開源解決方案gpud,已經為大多數被動健康檢查項目提供了全面的支援。

雖然這個被動GPU檢查系統仍在持續最佳化中,但已經算是非常強大的解決方案。



此外,Lepton AI也會提供手動主動健康檢查功能,比如DCGM診斷和nccl-tests,但這些檢查需要通過UI儀表板手動運行,不像CoreWeave那樣能夠自動按周進行定期檢查。

還不足的是,Lepton AI沒有提供NCCL測試的參考數值,也缺少Megatron Loss收斂主動健康檢查或Nvidia TinyMeg2靜默資料損壞(SDC)檢測器主動健康檢查。



另外,Lepton AI還提供了一些測試版功能,比如一鍵式零影響NCCL分析器。

只需點選一個複選框,就能充分利用其自主研發的內部NCCL分析器來可視化集體通訊瓶頸,這樣就能幫助客戶最佳化網路性能瓶頸。




賈揚清:Caffe之父,AI框架締造者

提到賈揚清,可以說是業內耳熟能詳的「框架大神」。

作為主流AI框架Caffe創始人、TensorFlow的作者之一,PyTorch 1.0的共同締造者,他的貢獻早已深入AI開發的每個角落。

賈揚清,浙江紹興人,本科和研究生階段都就讀於清華大學自動化專業。



在研究生學習期間,他曾在新加坡國立大學、微軟亞洲研究院、NEC美國實驗室和Google研究院工作/實習,積累了豐富的實踐經驗。

2008年,他赴往加州大學伯克利分校攻讀電腦科學博士,導師是Trevor Darrell教授。

在博士期間,他創立並開放原始碼的深度學習框架Caffe。這個框架一經推出,因其高效性、易用性迅速走紅,被微軟、雅虎、輝達、Adobe等公司採用。


畢業後,2013年,賈揚清正式加入Google大腦團隊,在Hinton和Jeff Dean等人的帶領下,參與了TensorFlow平台的開發 。

此外,他還與同事一起建立了全新深度學習架構GoogLeNet——首個在圖像分類任務中,超越人類精準性的神經網路。

3年後,賈揚清轉投Facebook(Meta),在Yann LeCun領導下擔任研究科學家,並在2017年,晉陞為AI架構總監。



在此期間,賈揚清在AI架構的大道上一路進擊:

· 2016年11月,Facebook推出輕量級模組化的深度學習框架Caffe2Go,讓手機也能運行深度神經網路模型。

· 2017年4月,Facebook宣佈開源產品級深度學習框架Caffe2,帶來跨平台機器學習工具。

· 2017年,建立了首個開放模型格式ONNX原型,後來被FB、微軟、亞馬遜等公司聯合推廣。2018年5月,Facebook正式公佈的PyTorch 1.0整合了ONNX格式。



2019年3月18日,賈揚清加入阿里達摩院,擔任技術副總,負責巨量資料以及AI方向的技術、產品和業務。

直到2023年3月,他官宣離職,並在幾個月之後創辦了Lepton AI。

根據個人首頁,賈揚清被引數最高的三篇論文,TensorFlow和Caffe赫然在列,他的每一步都推動了深度學習工具普及與進化。

曾有網友戲稱,學物理繞不開牛頓,搞深度學習,繞不開賈揚清。 (新智元)