當整個自動駕駛行業追逐L4全自動駕駛的資本熱潮時,Helm選擇了一條反共識的路徑:回歸數學底層,投入兩年時間專注無監督學習的基礎研究。這種看似“緩慢”的決策,實則為後續的生成式AI模擬系統埋下關鍵伏筆——當競爭對手依賴昂貴車隊採集資料時,Helm已能用虛擬世界生成200倍效率的訓練場景。我們整整兩年只做了一件事:研發。沒有任何產品發佈,也沒有市場推進,是一次孤注一擲的決策。雖然風險很大,但從創造力的角度看,那是一段極具活力的時期。真實路測的悖論在於:系統越成熟,越難採集到有價值的極端場景資料。而Helm的突破將生成式AI轉化為生產力工具——其WorldGen模型不僅能模擬道路環境,更能預測未來數秒的駕駛決策,形成閉環;VidGen能通過多視角視訊合成,替代90%的實拍資料需求。這種“自給自足”的訓練體系,讓沒有特斯拉級車隊的廠商也能參與高階自動駕駛競爭。圖片來源:EOVlad Voroninski是Helm.ai的創始人兼首席執行官,擁有加州大學伯克利分校數學博士學位,曾在麻省理工學院任教。他領導的Helm.ai是一家專注於自動駕駛AI軟體的公司,已完成超過1億美元融資,並與本田等主流車企達成合作,致力於打造可與特斯拉競爭的下一代自動駕駛系統。公司核心技術基於無監督學習與生成式AI,覆蓋從L2+到L4的自動駕駛解決方案。近期,Helm.ai推出了不依賴雷射雷達和高畫質地圖的路徑預測模型Helm.ai Driver,並行布了新一代生成式模擬工具GenSim-2與VidGen-2,進一步提升系統訓練效率與可擴展性。用數學築基AI:十年蟄伏破解自動駕駛底層瓶頸Vlad Voroninski:我在本科階段就對自動駕駛和電腦視覺產生了濃厚興趣。那時,我加入了UCLA電腦視覺實驗室,團隊正在參與DARPA無人駕駛挑戰賽。測試地點位於一片越野車專用區域,我們剛剛完成了第一次自主路徑跟蹤實驗。那一刻,我深深被這個領域吸引,決定繼續深入研究電腦視覺。不過,我隨後轉向了數學研究,在學術界投入了近十年的時間。這並不是一次轉行,而是一種蓄力。我始終認為,人工智慧真正的技術瓶頸在於數學。閱讀AI或電腦視覺領域的論文時,最難的部分往往不是工程,而是對數學方程的理解。因此,我把數學看作通往AI突破的關鍵工具。我的目標從未改變——始終計畫重返自動駕駛領域。期間,AI逐漸成為大眾討論的焦點。新聞中常常提到人類與人工智慧的“對決”,比如33歲的職業圍棋選手Lisa Doe,與AI系統展開的激戰令人矚目。與此同時,特斯拉創始人埃隆·馬斯克也宣佈,所有新款特斯拉將標配完全自動駕駛所需的硬體系統。自動駕駛,從實驗室走向現實,似乎進入了加速階段。2016年前後,深度學習技術迅猛發展,AI技術迎來了轉折點。我敏銳地察覺到,這正是重返這一領域的最佳時機。彼時,不少公司在技術路徑和戰略方向上的選擇讓我感到疑惑。行業效率低下,資源浪費嚴重。正因如此,我相信只要採用正確的技術策略,就能為行業帶來真正的價值——相比那些曇花一現的公司,我們希望走得更遠、更穩。於是,在結束了我的學術生涯後,我回到加州創辦了Helm AI。疫情逆襲:兩年零產品,All in無監督學習研發Vlad Voroninski:新冠疫情對所有人來說都是一段複雜的時期,尤其對汽車行業打擊尤為嚴重,幾乎導致整個生產鏈的停滯。在那段時間,新聞報導不斷傳來:“新冠疫情導致全球汽車工廠相繼停產。”幾乎所有車廠都不得不把精力從技術開發轉移到應對疫情上,我認為這在一定程度上延緩了自動駕駛技術的推進。但從另一個角度看,對我們而言,那段時間也充滿了興奮與挑戰。創業的過程本身就足夠激動人心,尤其是我們選擇深耕一項真正屬於“硬科技”的方向。我們前10位員工幾乎都是頂級研究人才,他們完全有能力去其他領域發展,卻選擇加入Helm,很多人為了這個願景放棄了學術職業路徑。當我們在2016年第一次介紹Helm的技術理念時,無監督學習(Unsupervised learning,一種不依賴人工標註、讓AI自主從資料中提取規律的訓練方式)在當時還被認為是“天方夜譚”。但我們選擇堅定地投入,真正開展了相關研究,並且取得了實際成果。這段時間,我們整整兩年只做了一件事:研發。沒有任何產品發佈,也沒有市場推進,是一次“孤注一擲”的決策。雖然風險很大,但從創造力的角度看,那是一段極具活力的時期。我對此心懷感激。基礎模型破局:生成式AI+深度教學,模擬系統性能碾壓同類200倍Vlad Voroninski:2018年左右,我們已經開始探索“基礎模型”(Foundation model,在大規模資料上訓練出的通用AI模型,能夠適應不同下游任務,具有強遷移性)的概念,儘管當時這個術語還未被廣泛使用。我們用基礎模型建構了一套自動駕駛系統,並成功驗證其性能遠超當時市面上的現有方案。我們在極端的山路上進行了多輪測試,那些路段陡峭且彎道頻繁,要求系統能夠迅速做出決策。結果表明,我們的系統在脫離接管率(即人類需要接管的頻率)方面的表現比市場同類系統好上200倍。這也讓我們在早期就贏得了多家國際主流車廠的關注。當時,自動駕駛行業正處於輿論焦點,新聞頻繁報導事故事件:“Uber自動駕駛車輛發生翻車事故後,亞利桑那州全面禁止其測試活動。”“特斯拉證實,一輛發生事故的車輛在加州北部處於自動駕駛模式。”這類事件也促使我們更加關注技術的安全性與可靠性,並推動我們持續進行前沿創新。近幾年,我們聚焦於生成式AI的研發,並將其與我們自主開發的“深度教學(Deep Teaching)”技術結合,以縮小AI模擬與現實世界之間的差距。換句話說,我們正在解決一個核心問題:如何在不實際駕駛的情況下,生成逼真的駕駛資料與感應器資訊。圖片來源:EO這是因為雖然車隊可用於採集資料,但隨著系統的改進,真正有價值的“極端場景”越來越難遇到,採集效率也呈指數下降,成本卻不斷上升。相比之下,AI驅動的模擬系統可以生成豐富的關鍵資料,而無需動用真實車隊。例如特斯拉依賴大規模真實車隊收集資料,但大多數其他車廠並不具備這樣的條件。這時,AI模擬就成為唯一可行的替代方案。直到最近,生成高度逼真模擬資料還不現實。但隨著生成式AI的進步,結合我們“深度教學”技術,我們建構了一套高度可擴展的虛擬車隊系統,讓模擬學習變得真正可行。我們的兩大基礎模型——VidGen1與WorldGen1正是這一進展的成果:VidGen可以通過任意相機角度,生成逼真的視訊資料;WorldGen更進一步,它不僅能模擬感知過程,還能預測未來幾秒內的駕駛路徑與行為。WorldGen實際上已具備“開車”的能力,它既可以作為模擬系統使用,也具備現實環境下的運作能力。這正是我們引以為傲的重要轉折點——我們不僅站在AI發展的前沿,更在重新定義自動駕駛的未來路徑。圖片來源:EO信任不能靠講故事:客戶坐上車,才知道你技術行不行Vlad Voroninski:在自動駕駛領域,如何真正贏得客戶信任、建立合作關係,是每一家初創公司必須面對的核心課題。我認為,至少有兩個關鍵因素非常重要:第一是“眼見為實”。僅憑宣傳材料或視訊演示是不夠的。我們更願意讓客戶親自坐上自動駕駛汽車,體驗它如何應對各種不可預見的複雜路況。這種真實場景下的產品演示,比任何宣傳語都更能傳達技術的穩定性和可靠性。第二個方面,則是從試點合作逐步建構信任。大型汽車製造商不太可能一開始就直接給你一個量產合同,合作往往是分階段推進的。因此,能否按時、保質地完成每一階段的交付,決定了你能否贏得更大的項目。這不僅關乎你是否提供了安全關鍵的技術,更關乎你能否按時交付,而汽車產業的量產節奏是非常嚴格的,錯過一年可能意味著數億美元的損失。第三點是:展示技術的進步速度,而不僅僅是當前的成果。比如,今天我們能做到什麼,一個月後我們預期能做到什麼。通過這些對比,客戶不只是看到你的“當前位置”,更能感受到你技術成長的“速度”,這會極大增強他們的信心。市場遲早會轉向,但前提是你能撐過那五年Vlad Voroninski:在自動駕駛這樣的高難度賽道上,強大的信念感幾乎是入場的前提。對我而言,最難的部分不是科研本身,而是作為創業者,必須身兼數職。從研究、工程到商業、溝通,每一環節都要親力親為。很多人說,去MIT上學就像是在“對著消防水管喝水”。雖然我沒有在MIT讀書,但我可以說,創業的感受正是如此密集而激烈。尤其是,我們當初選擇了一條與行業主流完全不同的路線。當時市場上大多數資金都投向了全自動駕駛(Level 4)公司,而我們卻決定從“部分自動化”切入,作為主要市場戰略。剛開始講這個思路時,很多人覺得我們瘋了。但我們堅持了下來。這讓我更加深刻地體會到,“堅持到底的韌性”有多麼重要。你不能指望一開始世界就會認同你的觀點,有時它需要幾年,甚至更久。對我們而言,大約是在公司成立四五年後,才開始看到業界逐步認同我們對未來的判斷。而那之後,每一年我們的處境都在變得更好,不僅是因為技術進步和產品落地,更因為我們堅信的世界觀終於開始成為現實。如今,這一切正在發生,我們等到了這個時刻。 (Z Lives)