當DeepSeek刷新國產大模型性能天花板時,產業上下游的一次關鍵合閘,正悄然引爆更深的變革——潞晨科技宣佈與華為昇騰聯合推出DeepSeek-R1全端式推理服務,這枚堪稱"最佳化革命"的重磅彈藥,將中國AI算力自主化的想像空間推向新高度。
當全球AI軍備競賽尚未燃起狼煙時,一位中國青年已悄然完成技術儲備。潞晨科技創始人尤洋——這位擁有傳奇學歷背景的90後科技精英,在讀書期間,就意識到到了,“AI是未來,中國人要有自己的技術”。
尤洋在清華就讀時,先後斬獲校、市兩級優秀畢業生桂冠和西貝爾獎學金(該系金額最高學術榮譽)。赴UC Berkeley深造期間,師從電子與電腦學院院長James Demmel院士的尤洋開啟學術巔峰。他創紀錄地在AAAI、ACL、IPDPS、ICPP四大頂會以領導者身份包攬最佳論文獎項。學術影響力更通過2020年全球HPC領域最高引用博士畢業生頭銜印證,而ACM Doctoral Dissertation Award的提名,更是令他在81位伯克利頂尖博士中脫穎而出。
即便手握常春藤盟校教職邀約,尤洋最終選擇在新加坡國立大學開闢新戰場,成為該校電腦系首位華人"校長青年教授"。畢業後不久,AI的發展浪潮讓尤洋看到了其中的創業機遇。在全球關注度最高的OpenAI未大展拳腳的階段,尤洋就已經在大模型的路上走了很多年,並在2021年創立潞晨科技。
都說VC/PE的眼睛比鷹尖,得知尤洋創業,真格基金、創新工場、藍馳創投、紅杉中國、新加坡電信、大灣區基金、石溪資本、領渢資本、順禧基金等知名投資機構紛紛遞來橄欖枝 (根據天眼查資訊)。融到A++輪,潞晨科技的投後估值就翻了超30倍,堪稱“中國創投圈估值增速最快的AI初創公司之一。”
提及為何與昇騰聯手,尤洋表示,要“讓更多人做出和部署自己的模型,讓中國AI走向世界”。
這次Deepseek的爆火,無疑是打開了中國AI的市場空間。而這其中最大的變化,是打破了過去一貫認為的GPU對國產晶片在性能、性價比和利用率方面的碾壓。潞晨與昇騰的這次合作,“更像是一個示範案例”,好的軟體結合硬體,使得國產晶片的價值徹底發揮了出來。
在尤洋的規劃藍圖中,雙方聯合發佈的API、雲鏡像及推理一體機並非簡單的產品矩陣,而是一場破壁實驗:通過儘可能的把硬體最佳化到極致,補全國產晶片生態缺乏的關鍵軟體和高性能演算法,潞晨科技成功將DeepSeek系列模型與昇騰適配性進一步增強。尤洋坦言:“這是一件非常有意義的事,企業可以用更低的成本,做更多想做的模型,提升營運效率。” 以潞晨昇騰Deepseek一體機為例,實測資料顯示,在華為800I A2叢集上,性能最優的滿血671BDeepseek-R1大模型可以達到近200名使用者的並行,大大降低了企業部署的算力成本。
這組資料背後,是尤洋及潞晨團隊多年來在算力最佳化這條道路上的不懈挑戰與突圍。在潞晨科技創立之初,便憑藉Colossal-AI深度學習最佳化以同一舉引發開源社區轟動,其中關鍵的LAMB最佳化技術,是微軟、字節等巨頭爭相使用的大規模最佳化方案,被輝達官方github認證“比業界最佳方案提速17倍”。但是將Colossal-AI運用在國產晶片上,卻沒有這麼簡單。受頻寬和記憶體的限制,許多演算法需要重新設計,來減少多機計算時的資料傳輸與通訊開銷。不過正是一次次克服這些難題與挑戰,才讓這個近4萬人在Github上星標過的開源系統,成長為潞晨科技在算力最佳化路上的生態壁壘,為尤洋"大模型千人千面"的願景築牢地基。
談及Colossal-AI,尤洋把它比喻成一個會不斷吸收、迭代的大腦。儘管在這個細分領域,不論是在創業公司還是高校,都沒有比Colossal-AI更大的生態,尤洋還是謙虛地表示“並不是想表達,我比微軟、輝達的人聰明,只是說我們用時間建構壁壘,得到了越來越多的客戶認可”。
對於席捲行業的模型呼叫服務模式,尤洋展現出技術極客的犀利:“MaaS在中國短時間內可能是最差的商業模式。”
“大廠內卷太嚴重了,各大雲公司,使用滿血版的DeepSeek-R1,每百萬token官方也只能收到16元。如果滿血版的DeepSeek-R1每日輸出1000億token的話,那麼,如果我們選取輝達H800伺服器,按照每台機器每月7.5萬元的費用,每月的機器總成本是4.5億,虧損4億,使用者越多,虧損越多。”在算力軍備競賽白熱化階段,這道算術題戳破了MaaS服務商的商業幻象。北京八友科技創始人兼CEO梁斌也曾在微博上測算如果用最優的AMD機器,每月營收4500萬元的機器成本是3.6億,跟尤洋的估算大致相似。
相比於將MaaS的商業模式,尤洋更看好定製企業或應用專屬模型這一市場。尤洋向我們分享了兩個例子:一個是李飛飛團隊通過不到50美元的算力費用,成功訓練出了與Open-AI O1和Deepseek-R1推理能力類似的頂級模型;另一個是來自UC伯克利的團隊通過4500美元成功訓出DeepScale-1.5B-Preview,能力超越OpenAI的o1-preview。尤洋判斷,未來很多企業都會選擇使用低成本的強化學習、模型蒸餾、快速微調等手段,打造企業的專屬模型。通過將企業寶貴的私有資料和資源融入模型,可以讓專屬模型達到更高的水平。他預計在未來,這個賽道將會越來越重要,而這,恰好是潞晨科技最擅長部分。
在這方面,尤洋和潞晨科技早已做了許多探索。作為AI Infra公司商業化的重要一環,雲算力與最佳化幫助潞晨在國內拿下了上千家付費客戶。尤洋的野心不止如此。在國內潞晨雲的商業模式經過驗證後,團隊迅速將其擴展至全球多個國家,營收幾乎呈線性增長。可能正因如此,在同行謹慎談收入的AI創業早期,這家公司才有底氣以近乎"叛逆"的姿態公佈商業底牌。據潞晨科技2024年財報顯示,公司實現營收(合同)7700萬元,營收(確認)4800萬元。
提到這不同尋常的公開,尤洋高興地表示,把Colossal-AI做成軟體形態後,大量客戶願意採購潞晨的產品,“我們的員工也在提升工作效率,用員工數量1.8倍的增長,換來2.8倍的營收增長。我們的商業模式走通了,就公開了財務資料,客戶信賴我們,大家很喜歡我們創造的AI生態,願意付費。”
在我們以及大眾的印象中,作為AI Infra的明星企業,潞晨科技一直是專注於to B的業務。然而,從去年開始,潞晨卻推出了視訊大模型系列,並從Open-Sora一步步迭代出Video Ocean這一風靡全球的產品。
對於我們的好奇,尤洋拿出了“世界模型”這個概念進行解答。在他的描述中,“世界模型”就是能生成任何想要的影視廣告、教育、科學、娛樂,甚至物理模擬的工具。而在尤洋眼中,“世界模型”的基礎就是視訊。同OpenAI的CEO一樣,尤洋很贊同現在是視訊大模型GPT-1時刻這一觀點。此時此刻,正如彼時彼刻,視訊模型的價值是“無法想像的巨大”,而未來的三至五年,訓出優質的視訊大模型無疑是該領域最重要的事情。
這個觀點有一部分來自於尤洋自身對視訊的喜愛,但是更多的還是他所看重的視訊足夠大的商業想像空間以及潞晨團隊的適配性。用尤洋的原話描述是“我們太適合去做了”。究竟有多適合呢?看看Video Ocean目前取得的成就一切就很清晰了。大洋彼岸,美國的Snapchat在訓練視訊大模型時使用了潞晨團隊的LAMB最佳化技術。“Snapchat的成功,對我們來說是一個很好的背書”,能夠更快更好地訓練視訊模型,使團隊在做Video Ocean時有巨大優勢。
與剪映等工具不同,Video Ocean選擇更底層的突破路徑:借由"一句話生成4K電影級畫面"的能力,尤洋將它定位為“未來的相機”。先用相機去拍原始素材,再用大模型生成這些素材,然後放到剪映等軟體中去加工。通過這一路徑,尤洋為Video Ocean的發展制定了三個階段:第一階段,使用者群體集中於C端個人。第二階段,使用者群體是抖音/YouTube博主和電商博主這類小B。第三階段的使用者則是廣告工作室和製片公司這類大B。
除了巨頭公司對Video Ocean技術的認可外,使用者層面Video Ocean也收穫了很多粉絲。在北美Product Hunt榜單中,Video Ocean一經發佈便取得了前三的好成績。而在V2.0發佈時,熱度甚至比之前更高。採訪時我們瞭解到,Video Ocean馬上要迎來一次小更新,讓我們拭目以待。
縱觀中國創業史,新興行業、A+輪,初創期就商業化並行布擾動全球的產品,多少有些不可思議。在投資家網過往對話的創業者裡,沒人跟尤洋“相似”。科技行業細分領域早期,把技術、產品做到出類拔萃的,不少。但做到擾動全球又賺錢的,幾乎沒有。
現在,尤洋算一個。 (投資家)