#獨角獸
2026 AI年度展望:關於「大公司、獨角獸、創業者」的十條趨勢判斷
舊場景的驗證,新技術的競賽。封面來源|AI生成2026年,中國AI市場註定硝煙瀰漫。最重量級的玩家將在2026年展開殊死搏鬥。阿里對“千問”的戰略級投入將在2026年更加淋漓盡致,撒30億請使用者喝奶茶,就是一個聲勢浩大的開始;同樣的,大撒“元寶紅包”也不會是騰訊唯一的大動作。而字節卻是個很難打敗的對手,它已經佔據AI to C的一線位置,且手握最大的流量,“豆包手機”也不會是它對突破邊界的唯一試探。如果說此前幾年,大廠的AI業務尚在模型層的陽春白雪中,還有遲疑、走神的空間,但大廠如果想在AI時代依然是“大廠”,面對豆包高企的DAU,2026年是AI ToC市場最後一搏的機會窗口。這場戰爭的重要程度,絕不亞於打車大戰、支付大戰、外賣大戰……我們曾經歷的任何一場戰爭。對於“中廠”來說,隨著智譜和MiniMax的港股IPO、月之暗面和階躍星辰的融資落定、新一輪模型的發佈接力,“AI六小虎”的故事告一段落。是否有餘力衝刺AGI成了薛定諤的命題,但自我造血對六小虎來說迫在眉睫。他們需要找到各自差異化的道路,尤其是商業化的道路。正如一名六小虎高管所說:不要貪大盲目IPO,二級市場的嚴苛審視會立刻反映在股價上。不過,“目前沒有商業模式是成熟的,還需要經過幾年的探索。”某一線美元基金合夥人告訴我們。商業模式的分化,一定伴隨著組織特性的分化。一名大模型初創公司融資負責人一口氣舉出了5種主流的商業模式:ToC的訂閱和廣告付費、ToB的API售賣、ToB定製、按效果收費、軟硬體一體——每種商業模式對應著不同的選擇,例如,做ToC的一定要出海,做ToB的一定要會“打單”……不過,最活色生香,最令人期待的,還是在創業公司,在AI應用領域。每個人都想成為Manus,成為ARR過億美金被大廠重金收購的對象,但是最充滿不確定性的也是這個領域。難以琢磨,不可預測,卻充滿魔力。2026年,“智能湧現”將繼續用熱切的心情、開放的心態,關注AI創業領域。關於模型技術的迭代、商業化,不同玩家的處境,“智能湧現”訪談了十幾位身處一線的創業者、投資人、大廠員工,總結了2026年的10大命題。字節:守住優勢,追擊AI世界第一梯隊圖源:AI生成前flow員工:AI入口的最佳形態還沒有確定豆包做得最對的一個決策是,是將AI能力平權了——在很早的階段確認多模態為核心能力。在2025年,還抓住了最好的時機做增長。2025年,字節完成的一個重要里程碑,是通過引進吳永輝為主的世界頂尖人才,現在已經逐漸完成一流模型人才的儲備,在基礎模型層逐漸穩居在國內第一梯隊。但2026年,隨著AI助手和模型層的競爭變得更加激烈,如何留住這些人才,是最核心的命題。某大廠戰略人士:今年最大的挑戰,是讓豆包聯動線下服務2025年,豆包做得最勇敢的一個決策,是推出豆包手機。雖然這件事註定會被其他大廠圍攻,但這個舉動攪動了移動網際網路和手機廠商的現有利益格局,讓所有玩家都不得不加速行動。展望未來豆包面臨的長期挑戰,是如何保持AI模型能力在最前列,同時把AI助手與普通使用者的真實生活連接起來——尤其是電商、外賣這類線下服務,字節雖然都有佈局,在組織上,字節相比其他大廠來說,歷史包袱少、依然是一個年輕有活力的組織,但怎麼內部協作得更好也並不容易。阿里:再造新AI To C入口圖源:AI生成某千問員工:不只是對外AI入口,也會成為阿里的底層AI能力平台千問是阿里內部集全集團之力做的C端AI入口。從產品路線上,主打差異化,也是因為親民、親切的路線就已經有競品佔據了使用者心智,我們先以差異化的辦事、辦公場景切入市場,走專業路線,但長期目標是成為AI入口。未來,千問不只是對外的AI入口,也會為阿里很多業務提供底層的AI能力。2026年,我們的挑戰在於,阿里的業務體系龐雜,行業差距也很大。千問作為相對獨立的技術團隊,理解阿里內部其他業務對AI能力的訴求是困難的,怎麼和各業務單元之間做更好的協同,這是未來的挑戰。某大廠戰略人士:2026年,大廠真正開打ChatGPT之戰的一年阿里今年能從夸克切換到千問,並在千問這個產品上快速發力,背後是阿里強大的組織能力在支撐。今年會是大廠真正開打ChatGPT之戰的一年,這是因為一條主線仍在持續:只要模型能力持續提升,新的功能釋放出來,就會有反哺業務的機會。從競爭格局看,雖然市場已有過億DAU的產品,但市場遠遠沒有飽和,這是千問敢在這個時間段發力的原因。目前,各家大廠的通用AI助手產品其實同質化程度都比較高,真正的差異在於誰能更快地迭代,誰能更好地把握使用者需求,長期地進行營運。AI助手市場還有很大的增量空間。前阿里員工:用組織變革來換取決策速度AI時代給了大廠一個重新定義入口的機會。原來的搜尋、社交、電商入口都已經被佔據,AI助手有可能成為新的流量入口和推薦網路。問題在於,這個機會窗口可能很短。千問C端事業群的推出,某種程度上是阿里在用組織變革來換取決策速度——與其在內部慢慢協調,不如直接推出新產品,用市場來驗證。騰訊:AI應用和模型繼續補課圖源:AI生成前元寶員工:DeepSeek再次刷新“模型即產品”的重要性事實上,在接入DeepSeek之前,元寶就已經明確“模型即產品”的重要性,DeepSeek之後是更加強化了這一共識。這一年裡,元寶比較聚焦模型能力的提升,強化產品與模型的深度整合。另外,元寶早期很早就定下來選擇聚焦高知人群,走差異化路線,一是高知使用者對體驗和效果的要求更高,二是,他們作為AI領域的早期嘗鮮者和意見領袖,他們的使用習慣會影響周圍人群,形成示範效應。元寶成員:元寶要擺脫DeepSeek依賴目前混元在模型市場上還沒有絕對的優勢。元寶提供的搜尋服務,一部分基於混元,一部分基於DeepSeek。但截至2025年底,大多數使用者還是選擇DeepSeek作為默認模型。最近,TEG的搜推部門合併到了元寶的搜推。此前,TEG搜推負責的是元寶中基於混元的搜尋鏈路,元寶搜推負責的是DeepSeek的搜推鏈路。其中的意義,一方面在於提高合作效率。另一方面,我猜測,未來元寶的搜尋會對模型進行整合,以後內部可能就不會存在基於DeepSeek的搜尋、基於混元的搜尋,只存在“元寶搜尋”。某大廠戰略人士:關鍵要理清微信和元寶的戰略定位相比行業內其他玩家的快速迭代,騰訊的節奏相對謹慎。比如,混元策略可能是不在基礎模型層面做正面競爭,而是聚焦Agent模型等差異化方向。接下來,騰訊需要在自研模型能力上拿出更有說服力的成果。微信遲遲沒有將AI能力深度整合到裡面,也是因為國民級入口要面對的隱私和安全問題太多,難以在短時間裡解決。用“元寶派”等新產品的試水方式,本質上是希望加速產品形態的創新嘗試,而不影響原有使用者的體驗。2026年,騰訊更需要解決的關鍵問題,可能是理順元寶和微信的戰略定位,才能更好發揮騰訊在產品層面的優勢。百度:對著釘子造錘子百度集團執行副總裁、百度智能雲事業群總裁沈抖:智能經濟帶來無限機會,企業需要建構AI原生組織AI正開啟“超級周期”,其價值將遠超網際網路時代。與網際網路僅改變資訊互動不同,AI將深度重構“研產銷服”全產業鏈,撬動10兆級市場。大模型智能湧現,而智能體(Agent)是產業落地關鍵形態,已在程式設計最佳化、數字員工、工業SOP(標準化操作流程)等領域展現突破性效能。企業需建構AI原生組織,推動自上而下的變革。未來企業中層很有可能大幅縮減,形成“決策層+智能體”的高效架構。百度集團副總裁,個人超級智能事業群總裁王穎:AI應用必須想得全、想得對、做得好當前使用者在使用AI產品時,仍有三大明顯痛點:一是認知偏差,幻覺問題未解決,也缺少個人知識沉澱;二是落地斷層,AI手腦分離,即便能想但只能局部實現;三是體驗割裂,即便能做也要在不同工具中轉移,AI能力、模態與格式無法一站滿足,使用者完成任務過程磕磕絆絆,時時碰壁。要打造真正的超級個人智能體,賦能使用者成為“超級個體”,就應該充分解決掉上述的所有問題。我們一直希望把百度文庫和百度網盤打造成為超級個人智能體,讓AI應用想得全、想得對、做得好,為使用者提供個性化、自由化、通用化的能力。百度集團副總裁,百度電商、百度數字人業務負責人平曉黎:未來的數字人會持續自主進化隨著視覺、語音、智能體等AI關鍵技術的突破,數字⼈也在加速進化。1.0時代的數字⼈,只是簡單實現了虛擬⼈的表層,具備了基本的外形和聲⾳。2.0時代是超擬真數字⼈,隨著⼤模型的問世⽽得到顯著提升,實現了對⼈物形象的⾼精 度克隆、⽀持⼤動作、擺脫了紙⽚⼈的效果,實現了數字⼈語⾔指令碼和互動問答的⽣成。⽬前,業界主流的數字⼈就處在這個階段。去年,百度率先發佈了⾼說服⼒數字⼈,把AI數字⼈帶⼊了3.0階段,不僅形神⾳容⾼度協調、還會思考決策、能調度多智能體完成指定任務。⽽在不遠的未來,擁有世界知識、不知疲倦的數字⼈,能夠持續⾃主進化,還能夠⽀持千⼈千⾯的個性化情感互動,將在更多的應⽤場景上超越真⼈。模型商業化:賺高品質的錢圖源:AI生成某模型初創公司高管:售賣模型API,只能作為短期商業化的補充手段大模型主流的商業模式有5種:ToC的訂閱付費和廣告收費,ToB的API售賣,ToB和ToG的定製化,按效果付費,以及從資料側走向端側的軟硬一體。選擇ToC訂閱的廠商,基本都選擇了出海,因為國內使用者付費意願還不高;售賣API的模式,本質上是雲服務的延伸,未來雲廠商一定會將API價格打得很低,獨立模型廠商很難實現規模化,因此API只能作為短期商業化的補充手段。至於定製化,市場上一種論調是,大模型的泛化能力可以改變原有重交付的模式。但在國內,不僅需要有能交付的技術能力,人脈也很重要。對初創公司來說,按效果付費和做軟硬一體,兩種模式都有機會。Physical AI的想像空間很大,未來智能終端有望成為新的流量入口和下一代推薦網路。但兩種模式都對初創公司的能力提出了高要求。按效果付費的前提,是模型能力足夠強。做軟硬一體的交付,要求公司有豐富、無短板的多模態模型矩陣,也要求團隊有資深的端雲協同交付經驗。某模型初創公司成員:模型能力迭代,不跟著OpenAI走,跟著客戶需求走2023年以來,我覺得賽道上很多模型公司都有“OpenAI病”,自稱要做“中國的OpenAI”,產品矩陣也強對標OpenAI。但2025年,提要做“中國OpenAI”的公司變少了,反而提做Anthropic的變多了。其中一個很重要的原因是,大家發現,自己手上的錢和卡不夠了,無法支撐OpenAI那樣全面鋪開的產品矩陣。資源有限的情況下,有些東西就不得不放棄。Anthropic已經證明,推理能力、Coding能力有市場、有付費,所以不少廠商2025年以來都將模型的迭代方向轉移到這兩者上。所以,我相信未來不同模型廠商,模型能力也會根據自己的資源、優勢,以及下遊客戶的需求,產生分化。某一線美元基金合夥人:目前模型的商業模式都不夠成熟在產品層面,AI時代的產品形態還沒有完全定型,原因在於模型能力還沒成熟。比如視訊模型的一致性、理解能力,都還在發展。這些能力成熟後,到底能實現什麼功能、落地什麼場景,大家都還在探索。今天,像ChatBot類型的產品,大家都在用訂閱的方式收費。但這只是其中一種形態。OpenAI也在探索,ChatGPT要不要使用更高效的廣告模式,吸引更多使用者,而不是全部採取訂閱模式。所以,目前沒有商業模式是成熟的,還需要經過幾年的探索。找場景 :在垂直、細分領域找錢圖源:AI生成極致上下文CEO廖謙:創業公司要找垂直場景切入,做端到端的服務交付我不認為通用Agent會統一天下。在做使用者理解時,不同問題的互動形態完全不一樣,資訊蒐集方式也不同。通用Agent會讓上下文變得駁雜,而且很難定義任務的好壞,商業模式只能是成本導向。但垂類場景下,任務可以被明確定義,有行業統一標準。創業公司的關鍵是,要切入資訊生產場景,做端到端的服務,而非工具。另外,要做生產場景而非消費場景(娛樂、社交),後者是大廠的必爭之地,創業公司切入比較難。前百川智能合夥人、AI醫療公司緣啟智慧創始人兼CEO鄧江:不是所有的場景,都願意擁抱大廠創業公司相較於大廠有兩個優勢。第一,創業公司在技術上更垂直、更深入。大廠很難做這麼垂直的投入,他們做的都是更普世、更廣泛的技術投入。豆包、螞蟻這些大廠推出健康類產品,我是開心的。大公司每個決策背後一定有龐大的市場和資料支撐。反過來,每一種病症,都意味著巨大的市場空間。比如皮膚病,中國有上億的患者,把皮膚病做好,都足夠立足了。所以未來還是看你能不能把垂直的能力做深做透。第二,創業公司可以保持技術獨立。不是所有的場景,都願意擁抱大廠,因為大廠和客戶在某類場景上有深度競爭。無論資料安全,還是商業競爭,不管在那個行業、那個時代,獨立的技術公司都有自己的生存空間。攀峰智能CEO王銘:2026年是Agent“按效果付費”的元年傳統的SaaS工具模式,其經濟模型是“收取的訂閱費能否覆蓋算力成本”,至於使用者能否跑出結果,工具方並不負責。我們認為,未來的經濟模型應該會變成“獲取的任務分成能否覆蓋算力成本”,2026年會是按效果付費的元年。這從根本上改變了產品的驅動力,迫使我們會花更多精力去打磨那些能直接幫助使用者賺錢,離ROI更近的功能。這對資源有限的創業公司至關重要,因為大廠會逐漸往下尋找並佔據好場景。一旦驗證了Agent能幫使用者低門檻賺錢,傳播速度會非常快,因為使用者的決策成本幾乎為零——幫你賺到錢了,你再付錢。那裡去找錢:IPO是好事,但不要盲目IPO圖源:AI生成某一線美元基金合夥人:港股IPO是改善一級市場環境的契機至少在過去,我覺得中國一級市場沒有辦法顯著支撐長期、巨額,且不是淨利潤導向的研發投入。如果大模型企業不上市,未來在一級市場的融資效率肯定很低,只能在現在30億、40億美金的估值基礎上小幅地融。但港交所舉措越友好、IPO的公司越多,優質科技型企業有更順暢的退出管道,並且在資本市場能得到國際投資者更公允的定價,這些事實都會反哺到一級市場。如果一級市場更活躍,中國的創新環境也會更好。只有這樣的循環被打通,一級市場才有可能真正支撐起千億美元的科技公司,而不是讓公司在早期階段就考慮上市。作為對比,SpaceX等到估值1萬美金,才考慮上市。他們前期發展的資金全來自美國一級市場。綠洲資本創始合夥人張津劍:不要只做區域創新,要做讓全球資本看見的全球創新很多投資者認為,AI最後就是中美的遊戲。但美國有很多標的,比如輝達。但中國的AI標的,在世界上的面貌不那麼清晰。MiniMax 的港股 IPO讓海外投資者有了一個投資中國AI的清晰樣本。接下來每一家AI、具身公司的上市,都是中美之間鑿壁偷光的一扇窗,讓外界看到中國有那麼多企業推動全球創新,從招股書上也能看到,他們的很多收入也來自全球。同時,越來越多的海外投資人也想直接投資中國。2025年夏天,美國很多GP到中國走了一圈。歸根到底,只要中國有創新、有服務全球的能力,錢是會進來的。創業者就應該堅定地去探索全球創新,而不是區域創新。未來中美之間有多少牆,就會有多少洞,比如港股IPO,比如2025年的DeepSeek和宇樹,只要堅持創新,就一定有好的錢主動找過來。某模型初創公司融資負責人:走向二級市場是“雙刃劍”2026年初,月之暗面、階躍星辰接連宣佈了新一輪的大額融資。這件事向行業證明,一級市場還能支撐大模型發展。之前智譜、MiniMax的IPO向創業者釋放的訊號是,在一級市場不一定融得到錢了,所以大家在匆忙地走向二級市場。走向二級市場是一把“雙刃劍”。好處是企業擁有了更順暢的融資管道,更大的市場聲量。但也要意識到,企業很快會面臨商業化的壓力。能看到很多IPO的企業,立刻開始大力佈局ToB業務,因為ToB的優勢在於變現速度很快。二級市場給企業的業績兌現期是一到兩年,如果沒有達到預期,企業的股價會立刻下跌。AI組織:小是趨勢,人效是關鍵圖源:AI生成Honghub鴻鵠匯發起人鄒凌:稱職的極小團隊Founder,要會找機會、有執行力、能自我行銷能把一人公司或者這種極小組織公司良好經營起來的Founder,身上通常具備以下三種核心能力:一,找機會的能力。他們往往在某個行業深耕多年,可以從自身行業經驗中提煉真實痛點、找到可以用AI改進的低效環節。二,快速執行力,能借助AI獨立完成短時間內做出初版甚至多個Demo,然後迅速獲得反饋,聚焦最有潛力的方向迭代。此外,AI時代,很多早期項目並不依賴ToB銷售或獲客團隊,個人創業者還要擅長用社交媒體為自己“代言”。得有找到早期使用者、驗證需求,甚至帶來現金流的能力。清華交叉資訊學院助理教授、AReaL項目負責人吳翼:極小組織形式和全端創新能力是相輔相成的極小的組織形式和全端的創新能力是相輔相成的。不僅是創業公司,大公司中的AI研發團隊也有必要做簡化。因為人的溝通頻寬是有限的,但大的組織架構必然會走向職責劃分和管理,而人類糟糕低效的Context Sharing能力會成為整個團隊的效率瓶頸。傳統的組織中會把演算法和Infra團隊分開。如果做模型時Infra團隊和演算法團隊太過強調分工,容易產生一種情況,即演算法團隊像是個甲方,Infra團隊承擔做“髒活累活”的乙方角色。隨之而來帶來的問題是,做乙方的團隊,容易失去創新的空間;而習慣於做甲方的團隊,就可能不願意做髒活累活,這會很容易失去對於技術最底層的觀察、感知,和創新所需要的自驅力。因此,AI研發組織中,演算法和Infra是不能脫離成兩個團隊的。兩者共同設計、協同演進,才可以形成一支小而有戰鬥力的團隊。DeepWisdom創始人兼CEO吳承霖:不要迷信一人公司,組織的關鍵在“人效”行業認為AI能夠提效,進而替代人力。但當每家公司都有電腦的時候,其實相當於大家都沒電腦。卷度只會上升,不會下降。所以不要迷信一人公司,最終評價組織的維度應該是“人效”。每家公司80%的成本,其實是溝通成本,反而不是寫程式碼、文件的成本。AI可以精確規避溝通的隱形成本。一些頭部AI公司內部已經用AI代替人來分工。Claude能夠識別員工的所有歷史行為,識別技能體系,判定舒適區,然後派稍稍超出舒適區的任務。目前,人還需要作為AI的管理者。我們更需要的是技能全面、具有批判性思維的通才,去減少人之間的溝通問題。我們公司內部為通才成立了一個試驗性的組織“ROOT”,裡面沒有傳統崗位的劃分,每個人承擔從產品策劃到開發、管理的全端工作,效率是傳統組織的好幾倍。基礎模型下一戰:讓模型“看得懂”、“記得住”、“用得起”圖源:AI生成Luma AI首席科學家宋佳銘:多模態需要走向“大一統”2026年,大家有必要在“大一統”路線上做一些探索,也就是將圖片、視訊、音訊、文字等模態的理解和生成混合在一個模型中。相比於單純的圖像、視訊模型,大一統的擴散模型的好處在於,有更強的In-Context Learning(上下文學習)能力和Zero-shot(零樣本學習)能力,天花板更高,落地的想像空間更大。不少廠商都選擇將不同模態的模型拼接在一起,而不是統一訓練。這種方法會帶來短期收益,但長期來看,會延誤建構更好模型的時間。前百川智能聯合創始人、來福電台創始人兼CEO焦可:AI 時代真正的壁壘是記憶2025年行業對記憶的研究開始變多,但依然非常早期。人的記憶系統很複雜,每天都在睡眠中將短期記憶與長期記憶進行合併、遺忘和抽象,我們是在進行一場持續的日更訓練。今天還沒有一套成熟方案能夠系統性地做到這一點。AI時代真正的壁壘就是記憶。這是所有AI產品的兵家必爭之地,我們之所以選擇從語音切入,也是因為語音能讓使用者最自然地表達出Long Context(長上下文)。誰能跟使用者說更多的話,誰才有使用者更多的記憶,進而更懂使用者,提供更個性化的服務。因此,對我們而言,DAU並沒有那麼重要,因為DAU隨時會走。我們更看重DTU,Daily Talk User(每日交流使用者),這代表每天有多少使用者產生新的記憶。以及LMU,Long-term Memory User(長記憶使用者),這部分才是 AI 產品真正的價值。前阿里/字節大模型帶頭人、Infix.ai創始人兼CEO、港理工人工智慧講座教授楊紅霞:“去中心化”帶來落地今天模型的落地有一個很大的鴻溝。不少高精尖領域、中小企業、醫院、政府機構都想用生成式人工智慧,但遲遲無法實現,核心原因是現在的以個別廠商為中心主導的大模型沒有他們所對應的領域資料。需要強調的是,模型知識的注入只發生在預訓練階段,所以模型在企業或機構的本地化部署,一定要啟動持續預訓練,因為醫院、企業、機構大量的本地化私有資料和知識,在網際網路上是無法獲取的。同時,現在不同企業或機構的資料是很難共同分享的,導致了現有範式下模型無法做到全球化和全行業化。我相信未來每家公司都會需要大模型這樣一個腳手架。所以,我們希望把“腳手架”做到最便宜、最易用、入門門檻最低,讓每一家企業或機構都有自己本地化部署的模型。第二件事,我們想通過模型融合的方式,把某個領域的模型做到全球化。比如不同醫院的醫療專科模型融合起來,就能得到一個醫療領域的基礎模型。所以所謂的“去中心化”,就是在各個領域,集大家的能力,一起做好領域大模型。具身世界模型突破口:演算法要創新,場景要驗證圖源:AI生成大曉機器人董事長,商湯科技聯合創始人王曉剛:世界模型真要有效,必須有下游驗證閉環2024年11月,我就主導發佈過智能駕駛世界模型,但當時行業對這項技術的態度是“不太信”。原因是,包括輝達Cosmos世界模型在內,當時不少公司把世界模型當“資料生成器”。雖然可以在實驗室裡生成一堆看起來成立的場景畫面,但缺少下游真實落地驗證,沒人能回答“這些資料到底好不好用”,信任很難建立。過去採集這類資料危險又貴,甚至得協調“演員車”上路復現。商湯則可以先在世界模型裡規模化生成大量場景畫面與解決策略後,再用上汽智己的實車對世界模型的決策進行檢驗、校準,讓模型能力在真實反饋裡越練越準。同樣,世界模型在具身智能上也需要下游場景驗證。比如,大曉機器人先採用硬體更成熟的四足狗做“上街巡邏”的工作,在任務執行中驗證世界模型的能力,在真實場景裡持續迭代。極佳視界創始人兼CEO黃冠:2-3年內將可能迎來物理世界的“ChatGPT時刻”真機的“VLA+強化學習”正在快速迭代和擴展,但面臨巨巨量資料瓶頸,“世界模型”是被認為是未來能解決物理世界通用智能真機資料瓶頸的方式。我認為,2-3年內將可能迎來物理世界ChatGPT時刻。關於“物理世界ChatGPT時刻”的定義是:在100種常見任務中,90%的場景下達到95%的成功率。之所以認為這個時刻會在2至3年到來,是根據現有技術進展速度所進行的推測。這個過程目前並不是由世界模型完成所有任務,而是仍然需要與VLA、強化學習互相配合。具體而言, VLA解決的是作業的複雜性,世界模型解決泛化性,強化學習解決精準率和可靠性。清華交叉資訊學院助理教授、星海圖聯合創始人趙行:值得探索的前沿方向,是讓機器人預知未來我們會去較為積極地探索世界模型,但它還沒有進入到工業化的技術階段。與靠資料驅動的VLA不同,我覺得世界模型是一個非常典型的、靠聰明頭腦驅動的工作。它需要定義出一個最合理的演算法,建模物理世界的運動規律。如果能把世界的動力學規律給建模出來,那麼我們就不用再靠模仿學習的方式去訓練機器人了,機器人可以直接知道每一個動作的後果。但是讓機器人預知未來,可能比讓機器人規劃現在的動作更難,這有點像為瞭解決一個難題還要創造另一個難題。所以它非常適合最聰明的、最前沿的實驗室去探索。 (36氪)
1年估值暴漲超500億!黃仁勳安利的AI創企融資35億,計畫IPO
ElevenLabs不只是一家做音訊模型的公司。AI音訊賽道,衝出一家百億美元獨角獸!智東西2月5日報導,昨天,英國AI音訊獨角獸ElevenLabs宣佈完成5億美元的D輪融資,估值達110億美元。其估值較去年年初的33億美元,實現了超230%的飛速增長。ElevenLabs聯合創始人兼CEO Mati Staniszewski還透露,該公司已在考慮IPO事宜。本輪融資由紅杉資本領投。已參與ElevenLabs多輪融資的a16z追加4倍投資,ICONIQ追加3倍投資,這意味這兩家投資機構增大了在ElevenLabs的持股比例。▲Mati Staniszewski發文宣佈融資(圖源:X平台)ElevenLabs於2022年成立於英國倫敦,最初主要從事文字轉語音模型的開發,後來也陸續打造了語音轉文字模型、AI音效模型、AI配音模型、AI音樂模型等領域。該公司既向企業提供語音API服務,也為創作者和品牌提供音訊生成平台ElevenCreative,還通過ElevenAgents平台向企業提供AI語音客服服務。你甚至能在知名遊戲《堡壘之夜》裡找到由ElevenLabs生成的音訊。2025年底,ElevenLabs的ARR(年度經常性收入)已經超過3.3億美元。自成立以來,ElevenLabs已完成五輪融資,累計融資總額達到7.81億美元。輝達此前曾參與ElevenLabs的C輪融資。輝達創始人兼CEO黃仁勳稱,ElevenLabs打造了世界上最好的語音AI產品,他主動向輝達團隊推薦了ElevenLabs。如今,黃仁勳在各類大會上以虛擬卡通形象出現時,就會用ElevenLabs的工具來復刻自己的聲音。▲黃仁勳與Mati Staniszewski(圖源:輝達)從融資規模、收入增長到資本陣容,ElevenLabs已經穩穩位居全球AI音訊賽道的第一梯隊。這樣一家成立不到4年、卻能在競爭激烈的語音AI領域中快速拉開身位的公司,顯然不只是踩中了風口那麼簡單。它背後的創業起點、關鍵選擇,以及對產品與市場的理解,值得深度拆解。01. 上線6個月拿下百萬使用者靠社交媒體實現爆發式增長ElevenLabs的兩位聯合創始人Mati Staniszewski和Piotr Dabkowski都來自波蘭。受到童年時觀看的那些配音糟糕的美國電影的啟發,他們決定打造一款AI工具,來解決這一問題。在創業之前,Mati Staniszewski曾在瀏覽器公司Opera、投資與技術供應商貝萊德以及資料智能上市公司Palantir任職。而Piotr Dabkowski自畢業後,就一直在Google擔任軟體工程師,直至2022年與Mati Staniszewski一同創業。初出茅廬的ElevenLabs究竟能給這個行業帶來什麼變化?在2023年投資ElevenLabs之際,a16z的投資人Bryan Kim闡述了他對ElevenLabs潛力的理解。Bryan Kim認為,儘管語音轉文字技術已經存在了數十年,但它未能發揮全部潛力。大多數合成語音缺乏吸引人的語調和發音,缺乏個性感,而高端的人工錄製語音服務雖然存在,但冗長的製作流程和高昂的成本使得這項技術在大多數即時和互動場景中難以實現。ElevenLabs的出現,就是要滿足這些場景對高品質語音的需求。2023年1月,ElevenLabs首次推出了語音設計和克隆產品,並對現有的文字轉語音模型進行了顯著改進。之後還陸續推出多款文字轉語音模型,擴展多語言支援,甚至拿下了一些已故知名演員的聲音版權,進行克隆並對外提供商業化服務。上線6個月後,ElevenLabs已積累超過100萬註冊使用者,創作了總計時長超過10年的音訊內容。2024年11月時,其使用者數量已經超過3300萬。2025年,其ARR邁過了1億美元大關。在2025年6月的一場採訪中,ElevenLabs的增長負責人Luke Harries透露,該公司能實現如此快速的增長,背後主要有兩大驅動力。一方面,ElevenLabs的基礎模型能力不斷迭代,在表現力、真實感上不斷提升。ElevenLabs認為,語音模型與其他AI模型不同,規模和資料量不是最重要的決定因素,反而是模型架構發揮著重要作用。領導ElevenLabs研究工作的聯合創始人Piotr Dabkowski憑藉自己的影響力,招募到了多位世界頂尖的語音AI研究員,該公司已在模型架構上取得一些突破。不過由於他們打造的是閉源模型,外界無從知曉這些改進究竟在那些方面。▲Mati Staniszewski(左)與Piotr Dabkowski(右)另一方面,ElevenLabs還很擅長市場行銷工作。該公司懂得如何利用社交媒體的力量,還通過舉辦駭客松比賽、製作另類Demo等方式破圈,實現爆發式增長。而在企業客戶方面,ElevenLabs認為在企業級市場應該採用自下而上的打法,也就是先從消費級和開發者切入,在建立名聲和信任後,大型客戶自然會來。02. 公司重心已成語音智能體創始人竟不看好音訊模型未來不過,ElevenLabs並不想把自己限定在音訊模型這一狹窄的賽道,該公司瞄準的是更大的市場。在一場與TechCrunch錄製的播客中,Mati Staniszewski稱,ElevenLabs想解決的根本問題,是人類與科技產品如何互動的問題,這是他們一直以來開發產品的主線。最初,ElevenLabs打造了文字轉語音模型,讓科技產品中的語音聽起來更像人。但要打造真正優秀的體驗,光有逼真的人聲是不夠的,AI還需要能夠生成聲音、音樂,並具備對語音的理解力。Mati Staniszewski認為這是該公司從成立以來到2025年上半年的最大重心。但事實上,Mati Staniszewski認為音訊模型這條賽道本身並沒有什麼前景:“這一賽道或許在未來1-2年內仍是成立的,但再過幾年,這項技術就會完全商品化(Commoditized)”。如今,ElevenLabs還在造模型的原因是,短期內它還是提升AI音訊產品質量的最好方式。但隨著這項技術日趨成熟、易於獲取,成為可大量採購的“標準件”,音訊模型或許會成為廣泛的底層基礎能力,而非核心競爭優勢。於是,在2025年下半年,Mati Staniszewski帶領ElevenLabs進行了一項重要的戰略調整,如今,ElevenLabs的首要任務是幫助企業部署對話智能體,並能以新的方式與使用者、客戶互動。Mati Staniszewski判斷,隨著智能體、對話智能體和語音智能體的興起,使用者可以與裝置交談了,但要讓這些智能體真正產生價值,就需要將大量資訊和知識庫帶入智能體內部,使其能夠與現有系統整合。整合後,這些產品還需要具備可測試、可評估、可監控的特點,這樣才能獲取企業級客戶的信任。這些智能體的主要應用場景,其實就是AI語音客服。ElevenLabs的智能體是多模態的,可以理解口頭或書面輸入,像人類一樣傾聽、閱讀並與客戶互動。企業還可對這些智能體進行定製化,在ElevenLabs提供的可視化工具中打造出對話流,精確定義這些智能體該如何與客戶互動。▲ElevenLabs的智能體產品(圖源:ElevenLabs官網)這一戰略決策,讓ElevenLabs得以在企業級市場進一步攻城略地。如今,在語音智能體賽道,他們的一些大客戶包括Cisco(思科)、Meta、Salesforce等等,而在音訊創作領域,迪士尼、Epic等影視與遊戲製作公司都在使用其產品。反映到ARR上,ElevenLabs在做出這一戰略轉向後,ARR增速明顯加快。2025年初,ElevenLabs達到1億美元ARR時,用時為20個月,而緊接著跨越2億美元ARR大關僅用時10個月。2026年初,當ElevenLabs宣佈實現3.3億美元ARR時,距離他們達成2億美元ARR的時間僅為5個月。03. 主打AI模型+產品不猛堆算力與資料語音AI賽道,並不缺乏優秀的模型。中國的MiniMax、阿里、海外的Google、OpenAI等公司都曾打造優秀的語音產品,那麼,ElevenLabs的差異化優勢在那兒?就像軟體和硬體的結合才是蘋果公司的魔力一樣,Mati Staniszewski認為,AI模型與產品的結合才能發揮最大價值。ElevenLabs雖然也會研究一些前沿方向,比如開源視訊模型與語音模型的結合,但他們更重視的始終是打造更好的產品,不會像競爭對手那樣訓練一些計算密集或資料密集的模型。同時,Mati Staniszewski還認為ElevenLabs具備更高的專注度,他們直接專注於解決人類與電腦進行語音互動的問題,該公司的願景是獨立於競爭對手們所做的事情之外的。拿到新融資後,ElevenLabs的首要目標是推動其智能體產品的發展。未來幾天,他們很快會推出適用於智能體平台的全新對話模型,能更快、更準確地理解和表達感情。如今,ElevenLabs已經是一家擁有400名員工的公司了,與其他估值相近的AI創企相比,這已經幾乎可以算是大公司了。ElevenLabs正在倫敦、紐約、舊金山、華沙、都柏林、東京、首爾、新加坡、班加羅爾、雪梨、聖保羅、柏林、巴黎和墨西哥城等地開展國際擴展,並配備本地化的市場推廣團隊,這對該公司旗下的語音AI業務而言,尤其重要。04. 結語:模型服務於產品成ElevenLabs突圍思路回頭看ElevenLabs的成長路徑,它並沒有走一條堆參數、拼算力的傳統模型公司路線,而是始終圍繞一個更底層的問題推進:語音和音訊,究竟在真實世界裡如何被使用。而在戰略層面,他們又足夠清醒地判斷出“音訊模型終將商品化”,果斷將重心轉向對話智能體與企業場景。這是一種“產品先行、模型服務於產品”的打法,讓ElevenLabs在語音AI這個擁擠的賽道中擁有了差異化的特點。而這或許也是頭部企業和頂級風投,願意重金押注ElevenLabs的關鍵。 (智東西)
當達沃斯還在熱議AI未來時,中國一家公司的AI教育已經服務了全球5000萬群體
作為全球最具影響力的思想與議程平台之一,達沃斯論壇向來被視為觀察世界走向的風向標。各國政要、跨國企業掌舵者、學者與國際組織負責人齊聚一堂,共同討論那些決定人類走向的長期議題。1月19日至23日,世界經濟論壇第56屆年會如期而至。但這註定是一屆被載入史冊的達沃斯——恰逢全球政治、經濟與技術格局正在重塑的節點,貿易壁壘與技術分化的陰影持續籠罩,世界處於一種前所未有的分裂與重組之中;與此同時,人工智慧作為新一輪生產力革命的核心動力,圍繞技術的長期價值、應用邊界與社會影響亟需展開更多的深度交流與對話。在這一宏大敘事中,松鼠Ai創始人栗浩洋作為僅有的兩家中國AI獨角獸企業家受邀出席2026冬季達沃斯並在AI論壇發言,這樣的出現具有特殊意義——當全球仍在辯論AI的未來走向時,以松鼠Ai為代表的中國企業已在教育領域沉澱出了被驗證有效性的產品。不僅如此,松鼠Ai更為全球在充滿不確定性的技術變革中,確立了一個可供參照的“確定性”坐標——當AI技術真正回歸以人為本,我們終將迎來一個更具普惠與光明的未來。AI的經濟價值,將被重新定義如果要衡量一場討論的重量,首先要看坐在談判桌前的是誰。本屆達沃斯的陣容堪稱“全球頂配”。政界不僅有中國國務院副總理何立峰、美國總統川普、歐盟委員會主席馮德萊恩等大國領袖出席;商界更集結了約 1700 位領袖,其中包括馬斯克、黃仁勳、薩提亞·納德拉、Demis Hassabis 等掌控著全球算力與未來的科技巨擘。在如此高規格陣容的頂層對話中,幾乎沒有人再懷疑 AI 的重要性。分歧只存在於一個問題:AI 究竟會加劇不平等,還是修復不平等?科技巨頭們對此有著不同的切面解讀。 輝達CEO黃仁勳將 AI 定義為“人類史上最大規模的基礎設施建設”,強調其作為社會底座的普適性;而微軟CEO薩提亞·納德拉則更關注落地,他反覆提醒:如果AI不能擴散至各行各業,成為一種普遍的賦能工具,那麼技術繁榮將是脆弱的泡沫。這些討論,表面上是技術路線之爭,底層卻指向一個更現實的問題:誰有能力、也有意願,把AI變成一種“公共價值和公共能力”。正是在這樣的全球性討論場中,松鼠 Ai 的出現引發了廣泛關注。松鼠Ai作為中國僅有的兩家受邀出席2026冬季達沃斯並在AI論壇發言的AI獨角獸企業,其智適應教學系統並非概念模型,而是已在真實課堂規模化應用、持續產生可驗證學習效果與經濟價值的人工智慧產品。在松鼠Ai創始人栗浩洋看來,AI不僅無可避免地讓財富向少數能夠駕馭它的人匯聚,但還能讓大眾,尤其是最基層的百姓百倍受益。他以親身經歷生動說明:“我的父親是一位特級教師,退休後別人請他講課的費用是每小時1000美金。而松鼠Ai智能老師,在上百次‘人機大戰’中證明其能夠戰勝包括我父親在內的特級教師群體,但每小時成本僅需10美金。這是百倍的普惠,填平了普通人與精英在教育、法律、醫療等關鍵領域的鴻溝。”在此基礎上,栗浩洋進一步提出了一個深刻且犀利的觀點——AI讓社會福利與生產力提升的方式,已經突破傳統統計體系:傳統經濟學的測算邏輯是"價值等於交易額",GDP等於市場支付的總和,但 AI 的價值往往不通過價格完全體現。“當消費者付費10美金使用松鼠Ai智能老師,經濟學家不應該只用10美金來計算GDP,實際上應該用1000美金來計算,因為這就是前AI時代同等價值的服務。傳統的計算方法完全忽略了AI給全社會帶來的百倍價值增量,從而會嚴重低估人工智慧的真實產值。"這種價值重構的終極指向,是將AI從一種“商業特權”進化為一種“公共能力”。 AI需要像水、電和網路一樣,脫離稀缺品的屬性,成為社會運行的基礎設施。AI的經濟價值,也需要被重新定義。松鼠Ai在達沃斯所展示的,正是這種“公共能力”的具象化:一方面,松鼠Ai打破階層壟斷,通過百倍的成本壓縮,讓貧困山區的孩子也能擁有“特級教師” ;另一方面,松鼠Ai向貧困家庭捐贈價值千萬的帳號,這不是一種慈善施捨,而是在驗證一種新的社會分配機制——讓技術紅利無差別地覆蓋每一個個體。穿越數字鴻溝的“中國方案”如果說過去兩年,人們還在為大模型的湧現能力感到興奮,那麼到了今年,達沃斯討論的核心詞已經悄然轉向:落地。在算力不再是瓶頸、模型參數捲到天際的今天,我們不再通過“誰擁有更高級的AI”來劃分階層,而是通過“誰能更平等地獲得AI的賦能”來衡量社會的文明程度。在這樣的背景下,松鼠Ai因為驚人的務實精神和落地能力,在達沃斯的聚光燈下顯得尤為閃耀。在AI教育領域,松鼠Ai已經率先把技術能力轉化為公共能力,為全球性問題提供最領先的現實解法。作為《時代》周刊(TIME)公佈的年度“最佳發明”,松鼠Ai的智適應學習系統,融合了認知科學、教育心理學與機器學習,能理解文字、圖像、語音,並生成個性化教學策略。沙利文和安永最新的行業報告中,將其認證為L5級自動駕駛的智能老師——系統可以像一個經驗豐富的老教師一樣,不僅能傳授知識,還能洞察學生的情緒,拆解知識的圖譜,甚至在學生自己都未察覺困惑時,精準地找到那個認知的斷點。這一“因材施教”夢想的實現,源於松鼠Ai將知識拆解為微顆粒單元,通過機率圖模型編織成動態知識圖譜。系統不僅判斷對錯,更通過反應時間、猶豫模式、習慣性錯誤等七十多個維度,即時推斷學生的思維卡點。就在不久前,松鼠Ai完成了一場目前世界範圍內最大規模的AI教學對照實驗——其發起的「最多人參與的AI與傳統教學差異化實驗」吉尼斯世界紀錄™挑戰成功。這是一場涵蓋1,662名學生、歷時兩個月、由艾瑞諮詢發佈權威報告、北師大納入教育部專項全程追蹤的嚴苛實驗。而這場實證,最終以AI教學組在提分、穩定性和補弱效應上的全面勝出而宣告成功。不同於許多尚處於實驗室階段的技術雛形,松鼠Ai已經在中國廣袤的土地上驗證了其模式的普適性。目前,松鼠Ai已與超過6萬家公立學校達成合作,並在全國開設了超過3000家線下“AI自習室”。從縣城、鄉鎮到城市邊緣與山區,松鼠Ai將“僅屬於富人的個性化教育”,變為每個孩子觸手可及的日常。這不是概念,而是規模化落地的技術現實。“AI智能老師+專業督學”的雙軌協同範式,進一步突破了地域與資源的限制。無論是一線城市的名校,還是偏遠地區的鄉村學校,這套系統都能穩定地輸出高品質的個性化教育服務。這種跨越地域、規模化落地的能力,正是世界渴望看到的“中國經驗”。在這個意義上,松鼠Ai 帶來的不僅是教育產品的革新,更是一場關於“技術權利”的啟蒙:在智能時代,獲得個性化的高品質教育,不應是昂貴的商品,而應是每個人觸手可及的基本權利。這也正是松鼠Ai在達沃斯語境中被反覆討論以及被強烈關注的原因——大量AI應用仍停留在概念階段,而松鼠Ai已經完成了從演算法、內容到學習效果的閉環驗證,並在真實規模中持續運轉。並且,松鼠Ai並不是在展示“更強的AI”,而是在證明技術可以被用來填平鴻溝,而非製造新鴻溝。做“教育平權”的全球踐行者如果把達沃斯理解為全球未來的“議程場”,那麼今年的核心討論並不僅是“AI 能不能做”,而是“AI 如何真正普及到全球、特別是發展中經濟體”,讓技術帶來的紅利不再被少數國家或企業壟斷。面對貿易壁壘、技術陣營和供應鏈重組帶來的“碎片化”擔憂,世界亟需一種能夠跨越國界的合作路徑。在所有領域中,教育是少數仍然不被地緣政治完全阻斷的合作方向。因為無論一個國家處於何種發展階段,教育始終是最長期、最基礎的需求;而AI技術,正在讓優質教育第一次具備全球普及的現實條件——它可以以可負擔的成本,提供可複製的教學質量,縮小資源差距。正是在這一點上,松鼠Ai的角色被進一步放大,並且模式已具備全球複製的潛力:在北美,應對教師短缺;在東亞,追求更精準的個性化;在中東,緩解人口增長帶來的教育缺口;在非洲,適應多語言、多體系的複雜需求。在全球討論AI未來走向時,標準與規則往往決定誰能主導產業生態。2023年,全球技術標準界的權威組織IEEE發出一封“重量級邀請函”:希望建立一套“AI教育大模型標準”。這一工作組匯聚了來自數十個國家的頂尖科學家與人工智慧企業,成員名單幾乎是全球學術界與產業界的“名人堂”。成員包括“機器學習教父”Tom Mitchell、史丹佛教授Stephen Ciesinski、哈佛教育學泰斗Chris Dede,以及中國科學院王飛躍、牛津大學Stefan Zohren、劍橋大學Steven Watson等世界級專家。在這樣一個“全球智庫級”的組織中,主席的選拔無疑是最關鍵的權力分配。令人注意的是,IEEE並未選擇西方學者,而是把工作組主席的關鍵位置,交給了松鼠Ai創始人栗浩洋。這種“規則層面的領先”,也是一種現實證明:全球AI教育未來的運行規範、介面標準、能力邊界,希望由全世界最成熟領先的企業來共同完善及最佳化。松鼠Ai也已經完全具備將AI教育產品推向世界、並在全球範圍內建立生態的實力。在達沃斯期間,松鼠Ai不僅在多個高層雙邊與多邊場合亮相,並參與了卡達投資局等重要國際交流活動,進一步證明其在全球教育科技領域的影響力正在上升。因為這種“教育平權”的方案不分國界。目前,松鼠AI正在率先為全球市場提供“中國機會”,基於教育數位化與AI教學的成熟能力,發展中經濟體可以獲得一種成熟的“可負擔、可持續、可複製”的普惠路徑。 (AI寒武紀)
2025年AI十大事件:DeepSeek開源炸場,Google絕地反擊,獨角獸扎堆IPO
卡帕西還點讚了AI Coding。智東西12月31日消息,昨晚,外媒The Information做了2025年度AI十大關鍵事件總結,細數了DeepSeek開源引爆整個大模型產業、Google強勢回歸、Meta優勢不再及小扎狂挖人等產業發展的重要節點。今年開年,DeepSeek攜開源模型炸場,一舉驚動全球。隨著DeepSeek的應用實踐,強化學習引起了行業內關注。今年,OpenAI在AI聊天機器人市場的領先優勢已大幅縮小,與此同時,Google強勢回歸,正帶著Gemini 3.0迎頭趕上;Meta則處於失寵的境地,花式挖人、巨額投資均未見成效。今年,AI應用開始實現真實營收,有超過25家AI應用創企實現了至少1億美元(約合人民幣6.99億元)的年化收入。晶片廠商、雲廠商與AI公司們形成了利益共同體,“循環融資交易”(circular funding deals)可能是AI熱潮中延續性最強的趨勢之一。此外,國外的OpenAI、Anthropic以及國內的智譜、MiniMax等AI獨角獸都將目光瞄準了IPO。The Information提到,在即將到來的2026年,以下事件值得重點關注:AI應用能否實現盈利,Google能否維持復甦態勢以及機器人和持續學習能力瓶頸能否突破,此外,Meta也正準備在明年發佈新的文字、圖像和視訊模型。值得一提的是,前特斯拉AI總監、OpenAI聯合創始人安德烈·卡帕西(Andrej Karpathy)對大模型的態度,尤其是在程式設計能力上,從表示懷疑發生了180度急轉,卡帕西稱:“如果能將過去一年左右出現的工具有效整合,我的工作效率可能提升十倍。”站在一年的末尾回望這一年,以下關於2025年AI的十大關鍵事件令人難忘:01. DeepSeek突襲Meta巨額投資AI,Google找回節奏1、一月的DeepSeek時刻2025年剛剛拉開帷幕,DeepSeek拋出重磅開源炸彈,宣佈開源DeepSeek-R1模型,並聲稱其性能足以比肩甚至超越OpenAI、Anthropic和Meta的頂尖AI模型,同時訓練成本卻低得多。一時間,矽谷驚呼四起,認為AI開發者、風投機構、輝達乃至雲服務提供商都將面臨巨大衝擊,驚呼中國已在AI競賽中超越美國。無論DeepSeek後續發展如何,這一事件已然動搖了許多開發者對美國AI技術的絕對信心,而國內開源模型持續受到歡迎和關注,也真切地證明了其在AI領域有著不容小覷的競爭實力。2、強化學習的興起強化學習(RL,Reinforcement Learning)正隨著DeepSeek的應用實踐,在AI行業的其他領域迅速流行開來。該技術的核心在於,通過獎勵模型達成特定目標、懲罰其他行為的方式來訓練模型。此後,包括程式設計、製作Excel表格乃至提供醫療建議在內的多種任務中,各大主流AI實驗室紛紛開始借助RL技術提升模型表現。這一趨勢還推動了RL環境(RL environments)的興起,即為AI模型建立可模擬真實應用的副本環境,供其練習與學習。例如,Anthropic的負責人就曾提到,公司計畫在未來一年中投入高達100億美元(約合人民幣698.72億元),用於開發和建構此類RL環境。3、AI應用開始實現真實營收過去一年,業內始終存在一個核心疑問:除了AI模型企業、雲服務提供商和輝達之外,是否還有其他企業能夠真正從AI中獲利?今年,答案似乎逐漸明朗。據The Information報導,目前有超過25家AI應用創企實現了至少1億美元(約合人民幣6.99億元)的年化收入,這絕不是小數目,2026年的問題將會是,這些公司中是否有能實現盈利的。4、Meta的失寵對Meta而言,2025年是艱難的一年。四月,Meta發佈的Llama 4模型在開發者社區中反響平平;隨後在六月,Meta創始人兼首席執行長馬克·祖克柏(Mark Zuckerberg)開啟挖人大戰,向AI資料標註創企Scale AI投資143億美元(約合人民幣999.17億元),以聘請其首席執行長汪滔(Alexandr Wang)及其核心團隊,以重整公司的AI業務佈局。然而這筆巨額投資至今未見明顯成效。自此之後,Meta新組建的AI團隊僅推出了一款令人失望的AI視訊應用Vibes,隨之而來的則是內部數次重組與人才持續流失。有報導稱,Meta正準備在明年發佈新的文字、圖像和視訊模型。5、Google的強勢回歸自2022年被OpenAI推出的ChatGPT突襲而一度措手不及,並在此後多年被貼上“AI落後者”標籤的Google,終於在2025年找回了自己的節奏。今年,公司接連推出一系列備受市場好評的模型,並於11月壓軸發佈了廣受讚譽的Gemini 3.0。這一模型在程式碼生成領域取得突破性進展,成為首批突破預訓練縮放瓶頸的例證之一。Gemini 3.0觸動了OpenAI,在這一模型發佈後,OpenAI首席執行長薩姆·阿爾特曼(Sam Altman)迅速宣佈公司進入“紅色警戒”狀態。儘管目前Gemini聊天機器人在使用者規模上仍顯著落後於ChatGPT,但它正在迎頭趕上。2026年,Google能否延續這一復甦態勢,將會是行業關注的重點。02. OpenAI、Anthropic瞄準上市機器人、AI持續學習能力存疑6、AI資金進入循環如果一家AI實驗室未能從微軟、輝達或亞馬遜這類巨頭獲得資金,用於支付向其採購晶片與算力的費用,那麼它的經營模式恐怕需要重新審視了。“循環融資交易”可能是AI熱潮中延續性最強的趨勢之一,其源頭甚至能追溯至2019年微軟對OpenAI的首輪融資。對於OpenAI、Anthropic這類創企而言,這已成為一種高效的融資手段,能直接支撐它們最大的開支項:計算資源。7、川普成為AI產業的盟友自今年年初上任以來,美國總統唐納德·約翰·川普(Donald John Trump)推行了一系列被視為對AI產業利多的政策舉措,例如,簽署行政命令限制各州對AI的監管權限,加速資料中心建設的審批流程等。考慮到眾多科技公司此前投入大量時間與資金進行政治鋪墊,此類政策傾斜並不令人意外。不過,Anthropic等公司對川普政府採取了相對謹慎的態度。8、AI機器人發展不及預期去年,風險投資家們向機器人初創公司注資數十億美元,這些公司當時宣稱大模型將幫助他們開發出真正實用的機器人。然而這一願景至今未能實現,甚至許多機器人仍在犯基礎性錯誤。此外,AI機器人似乎仍需要人類遠端操控,如近期特斯拉Optimus機器人在摔倒前做出“摘頭顯”動作,挪威人形機器人公司1X Technologies推出的家務機器人Neo也需要遠端操作員人工輔助。9、AI持續學習能力存疑儘管AI實驗室已創造數百億美元的收入,但頂尖研究人員對現有技術能否通向通用人工智慧(AGI)的疑慮卻日益加深。OpenAI聯合創始人、前首席科學家伊利亞·蘇茨克弗(Ilya Sutskever)稱,要實現真正的AGI,AI必須像人類一樣,能夠從現實經驗中持續、即時地學習,也就是持續學習的能力。這類AI目前尚未成為現實,但幾乎可以斷言,每個AI實驗室都已在此方向上展開佈局。倘若持續學習技術最終取得突破,其影響將輻射至整個AI產業,由於這類方法對資料和算力的需求可能遠低於當前模型,長期以來依賴算力擴張的行業生態或將面臨重構,這對輝達等算力巨頭而言,恐怕不是一個好消息。10、各大AI創企紛紛準備上市2025年,OpenAI、Anthropic與xAI等AI創企仍以令人矚目的高估值持續融資。近期,OpenAI和Anthropic相繼釋放訊號,正積極籌備在未來幾年內推動上市;與此同時,今年12月,智譜和MiniMax先後通過港交所聆訊並遞交招股書。它們的上市意願背後存在清晰的商業邏輯:作為資本密集型的行業代表,它們希望借助當前市場對AI類股的樂觀情緒,打通可持續的融資管道。如果它們上市成功,可能為個人投資者提供從AI浪潮中受益的機會,當然,也須同時承擔泡沫可能破裂所帶來的風險。03. AI大牛卡帕西評價模型程式設計能力稱工作效率能提升10倍此外,以下是其他正在發生的事情,對於大模型的能力,卡帕西的態度在今年發生了180度大轉彎。去年10月,卡帕西曾公開批評當前的大模型,尤其指出它們在程式碼生成這類被高度宣傳的場景中實用性有限。他在一次播客訪談中提到,AI程式設計工具只能在他需要自動補全單行程式碼或編寫範本程式碼時才有效。不過,情況似乎已悄然改變。上周,卡帕西在社交平台X上發表了截然不同的看法:“‘軟體工程’這個職業正在被重構,程式設計師編寫的程式碼片段正變得越來越少且處於輔助地位。”他進一步感慨:“我有種強烈的預感,如果能將過去一年左右出現的工具有效整合,我的工作效率可能提升十倍;而如果沒有這一工作,簡直像是一種能力缺失。”雖然不清楚卡帕西具體所指的程式設計工具或模型是那一款,不過,他曾發文對Anthropic的AI程式設計工具Claude Code讚不絕口。卡帕西特別提到,Anthropic於11月推出的旗艦模型Opus 4.5及近期其他新模型,在程式碼生成能力上取得了巨大進步。04. 結語:從2025到2026:迎接AI行業的持續變革今天是2025年的最後一天,這一年,技術狂飆從未停歇,我們目睹了DeepSeek突襲矽谷、Gemini 3的反擊;也見證了Meta略帶沮喪的一年、AI機器人能力不及預期的問題。2025年,全球AI競賽打得火熱。2026年的帷幕即將拉開,關於AI技術本質、AGI等終極問題的討論仍在持續進行中,以OpenAI、Anthropic為代表的AI公司背後的高估值和狂歡,能否平穩上市扶搖而上,抑或難逃泡沫破裂的結局,這些有待2026年乃至更久之後驗證。來源:The Information (智東西)
AI創業版黃仁勳:37歲華人0融資5年幹到240億,GoogleOpenAI都是客戶
37歲華裔學霸AI創業,0融資,估值240億美元。是的,白手起家,沒拿投資人一分錢。更強悍的是,純靠一己之力,輕鬆斬獲Google、OpenAI等AI巨頭的大單,硬生生給公司幹成了估值240億美元的超級獨角獸。而這家公司的創始人——Edwin Chen,如今也憑藉180億的身價,躋身福布斯400的最年輕富豪,也是這波新晉富豪中最富有的一位。AI創業成最年輕新晉富豪福布斯400新晉最年輕富豪——Edwin Chen,美裔華人,年僅37歲。從大廠打工人,到矽谷估值240億的超級獨角獸,他僅僅花了5年。Edwin畢業於MIT,先後在推特、Google和臉書工作,擔任過各種推薦演算法相關的職位,是一名資深的機器學習工程師和資料科學家。但無論身處那家大廠,Edwin始終無法繞開一座大山:稀缺的高品質人工標註資料。在工作進展屢屢受挫中,他意識到,沒有足夠的高品質資料,我們可能永遠都抵達不了AGI。這時候,Edwin忽然從科幻電影《降臨》的原著中得到了靈感。《降臨》講的是一位人類語言學家,試圖通過破譯外星文明的文字與其建立溝通。但隨著理解不斷加深,她卻逐漸掌握了一種語言之外的能力——對時間的非線性認知,乃至「預見未來」。在Edwin看來,在我們的世界裡,人類,就是那批擁有超能力的外星人。而AI可以通過標註資料,學習我們的思維模式,最終獲得獨屬於人類的超能力——智能。2020年,Edwin Chen躬身入局AI創業賽道,成立了資料標註公司Surge AI。而讓這家初創公司顯得格外引人注目的,是其反常的入局姿態——拒絕所有風投,一份投資者的錢都不拿,創始人押上自己打工十年的全部積蓄,獨自踏上了AI創業之路。我一直很討厭矽谷的攀比之風。Edwin直言,絕大多數依賴VC生存的矽谷初創公司,本質上都是一場「騙局」,他們眼裡只有「快速致富」。在他看來,想要真正掌握戰略制定話語權,保證公司始終行駛在創始人最初的設想中,不能把希望寄託於任何投資者。而這家白手起家的資料標註公司,不止打一開始「離經叛道」。就連技術路線上,也選擇了一條與傳統資料標註公司截然不同,甚至在當時會被認為「吃力不討好」的路子。回到2020年,GPT尚未問世,Scaling Law的重要性也未得到重視,可用於訓練的高品質資料很少。彼時的資料標註,是一項附加值相當低的工作。一般而言,只需要大量僱傭低成本勞動力,不要求任何專業背景,工作內容往往只是坐在電腦前區分貓和狗。這些公司生產的資料,和垃圾沒什麼區別。在他看來,資料標註公司的任務不應該是做髒活,資料標註的本質,是編碼「人類的豐富性」。這意味著,要讓最聰明的人類——研究生、博士,甚至哈佛大學的教授——將他們大腦裡的專業知識,轉化為AI能讀懂的的二進制程式碼。因此,Edwin的第一步,就是大幅抬高資料標註員的准入門檻。相比傳統資料標註公司,Surge要求資料標註員具備高等教育背景,甚至得是博士與高校教授。而他們承擔的工作內容,也比以往的資料標註員更加複雜。有時,他們需要刻意引導聊天機器人給出錯誤或有害的回答,再親自寫出更合理、更安全的版本;有時,他們要在不同模型的回覆中選出最佳答案,並詳細解釋好在那裡。隨著AI的高速發展,這一路線已然成為絕大多數同行的共識,資料標註員的隊伍中,博士比例越來越高。但學歷也不能說明一切。一個文學博士,未必擅長寫詩;一個物理學教授,也未必擅長講課。具體到實際標註工作中,對技能的需求會更加垂直化。為此,Surge設計了一套與YouTube推薦機制高度相似的內部匹配系統:持續評估每一位標註員的能力邊界,收集其歷史表現資料,將其動態分配到最合適的項目中。除了聘請常春藤盟校的精英,Edwin還僱傭了來自全球50多個國家的一百多萬名自由職業者。他們負責提出可能難倒AI的問題,評估模型回答,並編寫標準幫助人工智慧生成完美的答案。不過,上述做法都不新鮮,這套方法論基本算是目前所有資料標註公司的常規操作。Surge的差異化競爭力,體現在更底層的基因上。據Surge員工表示,Edwin相當喜歡「站在科技和人文的十字路口」的人才。在他看來,只有這樣的人,才能幫助AI真正捕捉不同語言背後複雜而微妙的文化與社會語境。這與Edwin自己的履歷也高度相似——語言和數學雙修,在MIT主修的數學,還會說法語,西班牙語和普通話。因此,在面試環節,Edwin不僅會考察候選人的程式碼能力,還常常把話題引向文學作品。Surge成立早期,Edwin曾面試過一位在音樂行業工作了十多年的鼓手,這位沒有任何科技行業經驗的求職者,最終成了公司的五號員工。這並非個例。截至目前,Surge約20%的員工都擁有類似的非傳統背景具體機制上,Edwin沒有解釋這種「人才基因」究竟會如何影響資料標註的質量。但這種做法的有效性,,或許能從Surge的業績表現得到些許印證。事實上,Surge的收費標準往往比市場溢價50%,極端情況甚至能比競爭對手高出10倍。儘管如此,Surge最早的一批客戶名單中,仍赫然出現了Airbnb、Twitch、Twitter等網際網路巨頭的身影。當Gemini系列處於黑暗時期時,Google一位研究員同樣向Edwin尋求了支援,雙方通話了兩個多小時。不久後,Google就和Surge簽署了一份年價值超過1億美元的合作協議。到2024年,Surge營收正式超過Scale AI,攀升至驚人的12億美元,公司估值也隨之來到240億美元。即便如此,這家炙手可熱矽谷「香餑餑」,依然對資本市場保持著高冷的姿態:我們對被收購不感興趣,也沒有上市的打算。在Edwin看來,不止是VC,投資者的每一筆錢都是一根繩子,最終五花大綁住公司的手腳。因此,在談到那些典型的「矽谷同行」時,Edwin的用詞相當犀利。他們都是些外包公司。甚至直接點名道姓:我覺得Scale已經徹底完蛋了,對吧?不過,在市場競爭異常激烈的今天,Edwin的理念究竟是否真的有利於Surge的發展,或許得畫一個問號。Surge不拿融資,有的是同行搶著拿。洶湧而至的AI熱潮下,大量資金正迅速湧入其競爭對手的錢包。這批資金充裕的公司,正通過「價格戰」搶走本屬於Surge的肥肉。事實上, Surge曾經的重要客戶OpenAI,已轉身投入其競爭對手Mercor和Invisible的懷抱。另一方面,Surge 最早的客戶之一,AI實驗室Cohere,雖沒尋「新歡」,卻偷偷將資料標註工作都轉移到了內部。歸根結底,資料標註這行幾乎沒有什麼護城河,客戶隨時可以切換供應商,甚至選擇自研。就連收購了Scale的Meta,現在仍在繼續使用Surge的服務。從長期來看,有一個更值得關注的問題——如果AI繼續進步,最終不再需要人工標註資料了,怎麼辦?這是懸在所有資料標註公司頭頂的達摩克利斯之劍。或許正是意識到了這些風險,Surge對資本市場的態度,近期也開始出現微妙變化。據悉,公司正在洽談一筆約10億美元的融資。如果交易完成,其估值有望進一步抬升至300億美元。與此同時,公司創始人Edwin,也開始逐漸從幕後走向台前,頻繁出現在大眾視野中。資料標註版黃仁勳Edwin Chen在佛羅里達長大,今年37歲。他的父母來自台灣,後來移民美國,在當地開了一家名為「北京花園」的中泰美式餐廳。Edwin十幾歲時就在那裡打工。從小,Edwin便展現出了跨學科「雙修」的能力——「語言+數學」。語言方面,小學的Edwin非常喜歡參加拼寫比賽,並給自己設下一個頗為宏大的目標:解鎖「20」門語言。雖然這個夢想最終沒能實現,但直到今天,他仍能使用法語、西班牙語和普通話。年輕的時候,他還會說印地語和德語。數學方面,他同樣進展迅速。八年級便開始學習微積分,很早就完成了中學階段的數學課程。高三時,他的大部分時間,已經是在耶魯大學教授的指導下參與研究學術課題。高中畢業後,Edwin進入麻省理工學院,主修數學、電腦科學和語言學。而語言和數學這兩條線,也終於在這段時期開始交叉。在校期間,他聯合創辦了一個語言學社團,還曾在CSAIL從事自然語言處理相關研究,涉及代數拓撲、複雜性理論以及機器翻譯等方向。而Edwin在Microsoft Research的第一份實習,也是研究語音識別和文字轉語音。Edwin的生活習慣同樣特別——上大學時,他推崇多相睡眠法,將睡眠分成多次短時休息,比如每六小時小睡30分鐘,而不是一次性睡足八小時。除此之外,他還是一名素食主義者。吃素的情況下,還幾乎每天走兩萬步。為尋找靈感,他經常在午夜散步到紐約的時代廣場。大學畢業後,Edwin先後進入Twitter、Google和Facebook工作,擔任機器學習工程師或資料科學家。話說回來,細細品味這位華裔學霸的履歷,似乎能看到另一位華人的身影——父母來自台灣,青年時期在餐廳打工,如今離職創業給AI公司賣「鏟子」…….簡直是資料標註界的黃仁勳啊。不同的是,相比Edwin,老黃的童年沒那麼一帆風順。沒有那項工作是我做不來的,我以前洗過碗,也打掃過廁所。九歲時,黃仁勳迎來「天崩開局」的美國生活——舅舅誤將黃仁勳和哥哥安排進了奧奈達浸信會學院。這是所管教問題少年的寄宿學校。由於對英語一竅不通,剛進學校的黃仁勳飽受霸凌,總會有學生在走廊裡推搡他,在操場上追趕他。每到夏天,奧奈達浸信會學院的學生們都需要通過勞動來掙生活費,黃仁勳總會被留下來打掃全宿舍的衛生間。當時,當時的家務是打掃全宿舍的廁所。我只有9歲,但我打掃得非常認真。不過,老黃在水深火熱的日子裡挺了過來,甚至還主動解鎖了其他技能點。臨近中學畢業,黃仁勳去到一家連鎖餐廳打工,幫別人洗碗端盤子,一點一點晉陞為服務員。然而,回憶起這些經歷,黃仁勳並不未將它們歸類於「創傷」。那是一段塑造性格的經歷。我學會了堅韌……我學會了無論做什麼工作,都要把它做好。被人霸凌、被要求掃廁所、給人洗碗端盤子,或許恰恰是這些惡劣的成長環境,才造就了今天的黃仁勳。而不論黃仁勳還是Edwin,事業大小有別,環境也早已變化,做的事情也有所不同,但刻在基因裡的底層原始碼似乎沒有變化,踐行的都是同一個底色——勤勞勇敢。 (量子位)
川名麻耶承認:我就是孫正義女兒!
孫正義女兒自曝身份。近日,日本科技獨角獸公司Spiber發佈的一份公告顯示,軟銀集團董事長孫正義的女兒亮相其中。根據Spiber發佈的公告,其已與川名麻耶(Maya Kawana)簽署業務支援相關協議。待協議生效前提條件滿足後,川名麻耶將於2026年上半年開展相關支援工作。相關支援實施後,Spiber將繼續借助與川名女士業務的協同效應,追求進一步的發展與價值創造。在公告中,川名麻耶簡介赫然寫著:1981年4月,作為孫正義長女出生。其他經歷包括:2004年加入高盛日本,2008年加入青羽BBT,2017年加入Afiniti日本分公司,2019年12月創立BOLD株式會社(BOLD Inc.),擔任首席執行長;2025年先後擔任Design Future Japan和Ai ROBOTICS的外部董事。川名麻耶強調,她選擇公開個人背景,旨在明確表明她與Spiber的合作基於長期視角,而非受首次公開募股(IPO)或企業併購(M&A)等短期資本收益驅動。這使她能夠全身心投入,助力Spiber成長為全球生物創業領域的領軍企業,並為實現這一目標做出深思熟慮、及時有效的決策。在孫正義本人年近7旬的背景下,這份公告也罕見提供了軟銀潛在繼承人的資訊。公開資料顯示,孫正義生於1957年,1978年就讀加州伯克利大學期間與同學大野由美結婚。1980年3月畢業後,拿著通過發明“多語種翻譯機”賣給夏普公司的1億日元回到日本,並於次年9月創立軟銀。過去幾十年裡,孫正義幾乎從不公開談論家庭,所以外界只知道他有兩個女兒,長女曾在高盛工作,除此以外一無所知。雖然川名麻耶履歷光鮮,但她目前在軟銀集團內部並未擔任任何職位,能否成為軟銀集團的接班人仍不得而知。孫正義目前擔任軟銀集團董事長和CEO,但2022年孫正義就宣佈退出該公司的日常經營,聚焦人工智慧業務。 (每日經濟新聞)
歐洲AI獨角獸Lovable再獲3.3億美元融資,估值飆升至66億美元
「氛圍程式設計」成為創投的熱門領域。新銳AI公司的估值在五個月內飆升超過2.6倍,這是如何做到的?瑞典「氛圍程式設計」新創公司Lovable近日宣佈,已完成3.3億美元B輪融資,估值躍升至66億美元。這意味著在短短五個月內,其估值從7月A輪時的18億美元增加了超過2.6倍,凸顯出AI工具賽道的巨大潛力與資本熱度。本輪融資由CapitalG和Menlo Ventures共同領投,Khosla Ventures、Salesforce Ventures、Databricks Ventures等知名機構跟投。(圖片來源:linkedin@Lovable)作為快速抓住AI機會的典型代表,Lovable成立於2024年,其核心產品是一款「氛圍程式設計」工具,允許使用者透過簡單的文字提示來編寫程式碼乃至建立完整應用。這種低門檻、高效率的開發模式,推動公司實現了爆炸式增長:成立僅8個月,年度經常性收入(ARR)便突破1億美元;又過4個月,ARR翻倍至2億美元,成長軌跡猶如火箭攀升。其顧客名單也同樣令人矚目,Klarna、Uber、Zendesk等全球知名企業都已進駐。平台生態活力充沛,每天有超過10萬個新項目誕生,首年累計建立項目數已超過2500萬,顯示出強大的使用者黏性與市場認可。對於新一輪融資的用途,Lovable有著明確規劃:深化與第三方應用的整合、拓展企業級功能場景,同時完善平台基礎設施,涵蓋資料庫、支付系統、託管服務等關鍵模組,協助使用者打造功能完整的應用程式和服務。(圖片來源:Lovable)值得關注的是,這家快速成長的AI獨角獸始終紮根歐洲。聯合創始人兼CEO安東·奧西卡(AntonOsika)在赫爾辛基Slush大會上坦言,曾多次面對投資者「將總部遷往矽谷」的建議,但他最終選擇了堅守。「現在我可以肯定地說,你完全可以從這裡(瑞典)打造一家全球性的AI公司,」奧西卡表示,“只要使命清晰、團隊凝聚、保持緊迫感,就能吸引到頂尖人才。”不過,公司近期也曾面臨挑戰,11月被指出未繳納適用於歐盟的增值稅(VAT)。奧西卡隨後在領英(LinkedIn)上回應,承認疏漏並承諾補救,同時也駁斥了所謂「歐盟稅收環境不利於高成長新創公司」的論調,重申對歐洲創新生態的信心。Lovable的崛起並非孤例,「氛圍程式設計」已成為創投的熱門領域。另一家明星公司Cursor在11月獲得23億美元融資,估值達293億美元,同樣在半年內實現估值翻倍,印證了該賽道持續受到資本追捧。一年,66億美元估值。Lovable紮根歐洲,以本土創新證明了:好產品無問西東,足以影響世界。 (創新觀察局)
60秒極限挑戰!中國GPU獨角獸殺出重圍,斬獲圖形頂會大獎
他們不光能造GPU,還能寫出全球頂級的演算法!摩爾線程這次開源給國產具身智能遞了一把「神兵利器」。2025年12月,SIGGRAPH Asia 2025在香港盛大啟幕。在緊張激烈的3DGS重建挑戰賽(3D Gaussian Splatting Reconstruction Challenge)中,摩爾線程交出了一份亮眼答卷!17日,團隊憑藉著自研技術LiteGS出色的演算法實力,以及卓越的軟硬體協同最佳化能力成功突圍,斬獲銀獎。這一榮譽,再次印證了摩爾線程在新一代圖形渲染技術上的深厚積澱,更贏得了國際學術界的高度認可。3DGS 範式革命,開啟AI加速的高效渲染時代3D Gaussian Splatting(3DGS,三維高斯濺射)是2023年提出的一項革命性3D場景表示與渲染技術,它以可參數化的3D高斯分佈為核心,實現了畫質、效率與資源佔用之間的卓越平衡。與傳統NeRF相比,3DGS在保持逼真渲染質量的前提下,將渲染效率提升數百至上千倍,並在光線追蹤、VR/AR即時渲染、多模態融合等方向展現出極強的適應性與擴展性。(*上圖僅作示意)作為近年來快速發展的神經渲染技術,3DGS不僅在三維重建與即時渲染等方向展現出卓越優勢,也在更廣泛的 AI 場景中具備潛在的基礎價值。尤其是在具身智能(Embodied AI)等需要智能體理解並與真實環境互動的前沿領域,高品質、低延遲的三維環境建模至關重要。3DGS以其高保真場景顯示、快速最佳化能力和輕量級結構,為建構精準的世界模型提供了可靠支撐,有助於提升路徑規劃、環境感知和複雜操作任務的能力。隨著AI技術向「理解並操作真實世界」方向不斷延展,3DGS正逐漸成為具身智能訓練場景中的關鍵基礎技術之一。正因其對未來圖形學技術路線的關鍵意義,3DGS已成為全球學術界與產業界競相投入的研究方向,受到SIGGRAPH Asia等權威機構的高度關注。極致挑戰 60秒高品質重建,走向實用化臨界點本次競賽為參賽團隊設定了極具挑戰性的任務:參賽者需在60秒內,基於主辦方提供的真實終端視訊序列(10–30秒)、存在誤差的相機軌跡以及終端SLAM點雲,在極短時間內完成完整的3DGS高品質重建。主辦方以PSNR(重建質量)與重建速度為綜合評價指標,力求在完全公開、公正的條件下得出權威排名。目前3D Gaussian Splatting Reconstruction Challenge(3DGS重建挑戰賽)的結果及資料集已向全球公開,相關資料可在SIGGRAPH Asia官方網站獲取。官網地址:https://gaplab.cuhk.edu.cn/projects/gsRaceSIGA2025/摩爾線程 以全端能力,實現精度與速度的極致平衡摩爾線程AI團隊以參賽編號「MT-AI」進入決賽階段,在重建精度與效率兩項指標上取得均衡且亮眼的表現:平均PSNR:27.58(位列前三)重建耗時:34秒(顯著領先多數隊伍)憑藉行業領先的3DGS 演算法建構能力與軟硬體協同最佳化優勢,摩爾線程最終獲得二等獎(銀牌)的優秀成績。開放協作 摩爾線程開源3DGS基礎庫LiteGS作為一種新興的場景表示與新視角合成技術,3DGS憑藉高渲染質量與即時渲染速度,在電腦圖形學與視覺領域實現了顯著突破。該技術通過數以百萬計的各向異性三維高斯基元來表示三維場景,以實現逼真的渲染效果,並在自動駕駛、虛擬現實、數字孿生等領域展現出巨大潛力。然而,儘管3DGS的渲染速度極快,其訓練過程卻往往需要數十分鐘甚至數小時,成為制約其廣泛應用的主要瓶頸。現有最佳化方案往往僅從單一層面入手,難以系統性地解決訓練過程中的性能制約。為此,摩爾線程自主研發了3DGS基礎庫LiteGS,首次實現了從底層GPU系統、中層資料管理到高層演算法設計的全鏈路協同最佳化:在GPU系統層面,摩爾線程創新提出基於「One Warp Per Tile」原則的「Warp-Based Raster」新範式,將梯度聚合簡化為一次Warp內歸約,並結合掃描線演算法與混合精度策略,大幅降低梯度計算開銷,同時實現高效的像素級統計能力;在資料管理層,引入「聚類-剔除-壓縮」流水線,借助Morton編碼以極低開銷對高斯基元進行動態空間重排,顯著提升資料局部性,減少快取失效與Warp分支;在演算法設計層,摒棄原有模糊的度量指標,採用更為魯棒的像素不透明度梯度方差作為緻密化的核心判據,精準識別欠擬合區域,其輕量化計算直接受益於底層光柵化器的高效統計支援。通過系統與演算法的協同最佳化,LiteGS在訓練效率與重建質量上均實現顯著領先,樹立了該領域新的性能標竿。在達到與當前質量最優方案同等水平時,LiteGS可獲得高達10.8倍的訓練加速,且參數量減少一半以上;在相同參數量下,LiteGS在PSNR指標上超出主流方案0.2-0.4 dB,訓練時間縮短3.8至7倍。針對輕量化模型,LiteGS僅需原版3DGS約10%的訓練時間與20%的參數量,即可實現同等質量,展現出卓越的工程實用性與技術前瞻性。目前,LiteGS已在GitHub平台全面開源,以推動三維重建與渲染技術的開放協作與持續演進。開源地址:https://github.com/MooreThreads/LiteGS摩爾線程此次在國際圖形學頂會賽事上的獲獎,不止是一次競賽勝利,更是精準把握全球技術發展趨勢並引領未來圖形計算技術方向的戰略體現。作為圖形學領域未來發展的重要方向,3DGS技術對演算法與硬體協同提出了極高要求。摩爾線程通過創新的演算法設計、深度最佳化的自研硬體以及高效的軟硬體協同,在本次賽事中展現了卓越的綜合能力。這一成就,印證了摩爾線程在圖形智能計算領域技術路徑的前瞻性與工程可行性,並體現了公司將前沿研究快速轉化為實踐成果的強大執行力。2025年12月20日-21日,摩爾線程將於首屆MUSA開發者大會設立技術專題,深入探討3DGS等圖形智能技術如何塑造未來,賦能具身智能等前沿領域,誠邀共同關注與探討。 (新智元)