#創業者
2026 AI年度展望:關於「大公司、獨角獸、創業者」的十條趨勢判斷
舊場景的驗證,新技術的競賽。封面來源|AI生成2026年,中國AI市場註定硝煙瀰漫。最重量級的玩家將在2026年展開殊死搏鬥。阿里對“千問”的戰略級投入將在2026年更加淋漓盡致,撒30億請使用者喝奶茶,就是一個聲勢浩大的開始;同樣的,大撒“元寶紅包”也不會是騰訊唯一的大動作。而字節卻是個很難打敗的對手,它已經佔據AI to C的一線位置,且手握最大的流量,“豆包手機”也不會是它對突破邊界的唯一試探。如果說此前幾年,大廠的AI業務尚在模型層的陽春白雪中,還有遲疑、走神的空間,但大廠如果想在AI時代依然是“大廠”,面對豆包高企的DAU,2026年是AI ToC市場最後一搏的機會窗口。這場戰爭的重要程度,絕不亞於打車大戰、支付大戰、外賣大戰……我們曾經歷的任何一場戰爭。對於“中廠”來說,隨著智譜和MiniMax的港股IPO、月之暗面和階躍星辰的融資落定、新一輪模型的發佈接力,“AI六小虎”的故事告一段落。是否有餘力衝刺AGI成了薛定諤的命題,但自我造血對六小虎來說迫在眉睫。他們需要找到各自差異化的道路,尤其是商業化的道路。正如一名六小虎高管所說:不要貪大盲目IPO,二級市場的嚴苛審視會立刻反映在股價上。不過,“目前沒有商業模式是成熟的,還需要經過幾年的探索。”某一線美元基金合夥人告訴我們。商業模式的分化,一定伴隨著組織特性的分化。一名大模型初創公司融資負責人一口氣舉出了5種主流的商業模式:ToC的訂閱和廣告付費、ToB的API售賣、ToB定製、按效果收費、軟硬體一體——每種商業模式對應著不同的選擇,例如,做ToC的一定要出海,做ToB的一定要會“打單”……不過,最活色生香,最令人期待的,還是在創業公司,在AI應用領域。每個人都想成為Manus,成為ARR過億美金被大廠重金收購的對象,但是最充滿不確定性的也是這個領域。難以琢磨,不可預測,卻充滿魔力。2026年,“智能湧現”將繼續用熱切的心情、開放的心態,關注AI創業領域。關於模型技術的迭代、商業化,不同玩家的處境,“智能湧現”訪談了十幾位身處一線的創業者、投資人、大廠員工,總結了2026年的10大命題。字節:守住優勢,追擊AI世界第一梯隊圖源:AI生成前flow員工:AI入口的最佳形態還沒有確定豆包做得最對的一個決策是,是將AI能力平權了——在很早的階段確認多模態為核心能力。在2025年,還抓住了最好的時機做增長。2025年,字節完成的一個重要里程碑,是通過引進吳永輝為主的世界頂尖人才,現在已經逐漸完成一流模型人才的儲備,在基礎模型層逐漸穩居在國內第一梯隊。但2026年,隨著AI助手和模型層的競爭變得更加激烈,如何留住這些人才,是最核心的命題。某大廠戰略人士:今年最大的挑戰,是讓豆包聯動線下服務2025年,豆包做得最勇敢的一個決策,是推出豆包手機。雖然這件事註定會被其他大廠圍攻,但這個舉動攪動了移動網際網路和手機廠商的現有利益格局,讓所有玩家都不得不加速行動。展望未來豆包面臨的長期挑戰,是如何保持AI模型能力在最前列,同時把AI助手與普通使用者的真實生活連接起來——尤其是電商、外賣這類線下服務,字節雖然都有佈局,在組織上,字節相比其他大廠來說,歷史包袱少、依然是一個年輕有活力的組織,但怎麼內部協作得更好也並不容易。阿里:再造新AI To C入口圖源:AI生成某千問員工:不只是對外AI入口,也會成為阿里的底層AI能力平台千問是阿里內部集全集團之力做的C端AI入口。從產品路線上,主打差異化,也是因為親民、親切的路線就已經有競品佔據了使用者心智,我們先以差異化的辦事、辦公場景切入市場,走專業路線,但長期目標是成為AI入口。未來,千問不只是對外的AI入口,也會為阿里很多業務提供底層的AI能力。2026年,我們的挑戰在於,阿里的業務體系龐雜,行業差距也很大。千問作為相對獨立的技術團隊,理解阿里內部其他業務對AI能力的訴求是困難的,怎麼和各業務單元之間做更好的協同,這是未來的挑戰。某大廠戰略人士:2026年,大廠真正開打ChatGPT之戰的一年阿里今年能從夸克切換到千問,並在千問這個產品上快速發力,背後是阿里強大的組織能力在支撐。今年會是大廠真正開打ChatGPT之戰的一年,這是因為一條主線仍在持續:只要模型能力持續提升,新的功能釋放出來,就會有反哺業務的機會。從競爭格局看,雖然市場已有過億DAU的產品,但市場遠遠沒有飽和,這是千問敢在這個時間段發力的原因。目前,各家大廠的通用AI助手產品其實同質化程度都比較高,真正的差異在於誰能更快地迭代,誰能更好地把握使用者需求,長期地進行營運。AI助手市場還有很大的增量空間。前阿里員工:用組織變革來換取決策速度AI時代給了大廠一個重新定義入口的機會。原來的搜尋、社交、電商入口都已經被佔據,AI助手有可能成為新的流量入口和推薦網路。問題在於,這個機會窗口可能很短。千問C端事業群的推出,某種程度上是阿里在用組織變革來換取決策速度——與其在內部慢慢協調,不如直接推出新產品,用市場來驗證。騰訊:AI應用和模型繼續補課圖源:AI生成前元寶員工:DeepSeek再次刷新“模型即產品”的重要性事實上,在接入DeepSeek之前,元寶就已經明確“模型即產品”的重要性,DeepSeek之後是更加強化了這一共識。這一年裡,元寶比較聚焦模型能力的提升,強化產品與模型的深度整合。另外,元寶早期很早就定下來選擇聚焦高知人群,走差異化路線,一是高知使用者對體驗和效果的要求更高,二是,他們作為AI領域的早期嘗鮮者和意見領袖,他們的使用習慣會影響周圍人群,形成示範效應。元寶成員:元寶要擺脫DeepSeek依賴目前混元在模型市場上還沒有絕對的優勢。元寶提供的搜尋服務,一部分基於混元,一部分基於DeepSeek。但截至2025年底,大多數使用者還是選擇DeepSeek作為默認模型。最近,TEG的搜推部門合併到了元寶的搜推。此前,TEG搜推負責的是元寶中基於混元的搜尋鏈路,元寶搜推負責的是DeepSeek的搜推鏈路。其中的意義,一方面在於提高合作效率。另一方面,我猜測,未來元寶的搜尋會對模型進行整合,以後內部可能就不會存在基於DeepSeek的搜尋、基於混元的搜尋,只存在“元寶搜尋”。某大廠戰略人士:關鍵要理清微信和元寶的戰略定位相比行業內其他玩家的快速迭代,騰訊的節奏相對謹慎。比如,混元策略可能是不在基礎模型層面做正面競爭,而是聚焦Agent模型等差異化方向。接下來,騰訊需要在自研模型能力上拿出更有說服力的成果。微信遲遲沒有將AI能力深度整合到裡面,也是因為國民級入口要面對的隱私和安全問題太多,難以在短時間裡解決。用“元寶派”等新產品的試水方式,本質上是希望加速產品形態的創新嘗試,而不影響原有使用者的體驗。2026年,騰訊更需要解決的關鍵問題,可能是理順元寶和微信的戰略定位,才能更好發揮騰訊在產品層面的優勢。百度:對著釘子造錘子百度集團執行副總裁、百度智能雲事業群總裁沈抖:智能經濟帶來無限機會,企業需要建構AI原生組織AI正開啟“超級周期”,其價值將遠超網際網路時代。與網際網路僅改變資訊互動不同,AI將深度重構“研產銷服”全產業鏈,撬動10兆級市場。大模型智能湧現,而智能體(Agent)是產業落地關鍵形態,已在程式設計最佳化、數字員工、工業SOP(標準化操作流程)等領域展現突破性效能。企業需建構AI原生組織,推動自上而下的變革。未來企業中層很有可能大幅縮減,形成“決策層+智能體”的高效架構。百度集團副總裁,個人超級智能事業群總裁王穎:AI應用必須想得全、想得對、做得好當前使用者在使用AI產品時,仍有三大明顯痛點:一是認知偏差,幻覺問題未解決,也缺少個人知識沉澱;二是落地斷層,AI手腦分離,即便能想但只能局部實現;三是體驗割裂,即便能做也要在不同工具中轉移,AI能力、模態與格式無法一站滿足,使用者完成任務過程磕磕絆絆,時時碰壁。要打造真正的超級個人智能體,賦能使用者成為“超級個體”,就應該充分解決掉上述的所有問題。我們一直希望把百度文庫和百度網盤打造成為超級個人智能體,讓AI應用想得全、想得對、做得好,為使用者提供個性化、自由化、通用化的能力。百度集團副總裁,百度電商、百度數字人業務負責人平曉黎:未來的數字人會持續自主進化隨著視覺、語音、智能體等AI關鍵技術的突破,數字⼈也在加速進化。1.0時代的數字⼈,只是簡單實現了虛擬⼈的表層,具備了基本的外形和聲⾳。2.0時代是超擬真數字⼈,隨著⼤模型的問世⽽得到顯著提升,實現了對⼈物形象的⾼精 度克隆、⽀持⼤動作、擺脫了紙⽚⼈的效果,實現了數字⼈語⾔指令碼和互動問答的⽣成。⽬前,業界主流的數字⼈就處在這個階段。去年,百度率先發佈了⾼說服⼒數字⼈,把AI數字⼈帶⼊了3.0階段,不僅形神⾳容⾼度協調、還會思考決策、能調度多智能體完成指定任務。⽽在不遠的未來,擁有世界知識、不知疲倦的數字⼈,能夠持續⾃主進化,還能夠⽀持千⼈千⾯的個性化情感互動,將在更多的應⽤場景上超越真⼈。模型商業化:賺高品質的錢圖源:AI生成某模型初創公司高管:售賣模型API,只能作為短期商業化的補充手段大模型主流的商業模式有5種:ToC的訂閱付費和廣告收費,ToB的API售賣,ToB和ToG的定製化,按效果付費,以及從資料側走向端側的軟硬一體。選擇ToC訂閱的廠商,基本都選擇了出海,因為國內使用者付費意願還不高;售賣API的模式,本質上是雲服務的延伸,未來雲廠商一定會將API價格打得很低,獨立模型廠商很難實現規模化,因此API只能作為短期商業化的補充手段。至於定製化,市場上一種論調是,大模型的泛化能力可以改變原有重交付的模式。但在國內,不僅需要有能交付的技術能力,人脈也很重要。對初創公司來說,按效果付費和做軟硬一體,兩種模式都有機會。Physical AI的想像空間很大,未來智能終端有望成為新的流量入口和下一代推薦網路。但兩種模式都對初創公司的能力提出了高要求。按效果付費的前提,是模型能力足夠強。做軟硬一體的交付,要求公司有豐富、無短板的多模態模型矩陣,也要求團隊有資深的端雲協同交付經驗。某模型初創公司成員:模型能力迭代,不跟著OpenAI走,跟著客戶需求走2023年以來,我覺得賽道上很多模型公司都有“OpenAI病”,自稱要做“中國的OpenAI”,產品矩陣也強對標OpenAI。但2025年,提要做“中國OpenAI”的公司變少了,反而提做Anthropic的變多了。其中一個很重要的原因是,大家發現,自己手上的錢和卡不夠了,無法支撐OpenAI那樣全面鋪開的產品矩陣。資源有限的情況下,有些東西就不得不放棄。Anthropic已經證明,推理能力、Coding能力有市場、有付費,所以不少廠商2025年以來都將模型的迭代方向轉移到這兩者上。所以,我相信未來不同模型廠商,模型能力也會根據自己的資源、優勢,以及下遊客戶的需求,產生分化。某一線美元基金合夥人:目前模型的商業模式都不夠成熟在產品層面,AI時代的產品形態還沒有完全定型,原因在於模型能力還沒成熟。比如視訊模型的一致性、理解能力,都還在發展。這些能力成熟後,到底能實現什麼功能、落地什麼場景,大家都還在探索。今天,像ChatBot類型的產品,大家都在用訂閱的方式收費。但這只是其中一種形態。OpenAI也在探索,ChatGPT要不要使用更高效的廣告模式,吸引更多使用者,而不是全部採取訂閱模式。所以,目前沒有商業模式是成熟的,還需要經過幾年的探索。找場景 :在垂直、細分領域找錢圖源:AI生成極致上下文CEO廖謙:創業公司要找垂直場景切入,做端到端的服務交付我不認為通用Agent會統一天下。在做使用者理解時,不同問題的互動形態完全不一樣,資訊蒐集方式也不同。通用Agent會讓上下文變得駁雜,而且很難定義任務的好壞,商業模式只能是成本導向。但垂類場景下,任務可以被明確定義,有行業統一標準。創業公司的關鍵是,要切入資訊生產場景,做端到端的服務,而非工具。另外,要做生產場景而非消費場景(娛樂、社交),後者是大廠的必爭之地,創業公司切入比較難。前百川智能合夥人、AI醫療公司緣啟智慧創始人兼CEO鄧江:不是所有的場景,都願意擁抱大廠創業公司相較於大廠有兩個優勢。第一,創業公司在技術上更垂直、更深入。大廠很難做這麼垂直的投入,他們做的都是更普世、更廣泛的技術投入。豆包、螞蟻這些大廠推出健康類產品,我是開心的。大公司每個決策背後一定有龐大的市場和資料支撐。反過來,每一種病症,都意味著巨大的市場空間。比如皮膚病,中國有上億的患者,把皮膚病做好,都足夠立足了。所以未來還是看你能不能把垂直的能力做深做透。第二,創業公司可以保持技術獨立。不是所有的場景,都願意擁抱大廠,因為大廠和客戶在某類場景上有深度競爭。無論資料安全,還是商業競爭,不管在那個行業、那個時代,獨立的技術公司都有自己的生存空間。攀峰智能CEO王銘:2026年是Agent“按效果付費”的元年傳統的SaaS工具模式,其經濟模型是“收取的訂閱費能否覆蓋算力成本”,至於使用者能否跑出結果,工具方並不負責。我們認為,未來的經濟模型應該會變成“獲取的任務分成能否覆蓋算力成本”,2026年會是按效果付費的元年。這從根本上改變了產品的驅動力,迫使我們會花更多精力去打磨那些能直接幫助使用者賺錢,離ROI更近的功能。這對資源有限的創業公司至關重要,因為大廠會逐漸往下尋找並佔據好場景。一旦驗證了Agent能幫使用者低門檻賺錢,傳播速度會非常快,因為使用者的決策成本幾乎為零——幫你賺到錢了,你再付錢。那裡去找錢:IPO是好事,但不要盲目IPO圖源:AI生成某一線美元基金合夥人:港股IPO是改善一級市場環境的契機至少在過去,我覺得中國一級市場沒有辦法顯著支撐長期、巨額,且不是淨利潤導向的研發投入。如果大模型企業不上市,未來在一級市場的融資效率肯定很低,只能在現在30億、40億美金的估值基礎上小幅地融。但港交所舉措越友好、IPO的公司越多,優質科技型企業有更順暢的退出管道,並且在資本市場能得到國際投資者更公允的定價,這些事實都會反哺到一級市場。如果一級市場更活躍,中國的創新環境也會更好。只有這樣的循環被打通,一級市場才有可能真正支撐起千億美元的科技公司,而不是讓公司在早期階段就考慮上市。作為對比,SpaceX等到估值1萬美金,才考慮上市。他們前期發展的資金全來自美國一級市場。綠洲資本創始合夥人張津劍:不要只做區域創新,要做讓全球資本看見的全球創新很多投資者認為,AI最後就是中美的遊戲。但美國有很多標的,比如輝達。但中國的AI標的,在世界上的面貌不那麼清晰。MiniMax 的港股 IPO讓海外投資者有了一個投資中國AI的清晰樣本。接下來每一家AI、具身公司的上市,都是中美之間鑿壁偷光的一扇窗,讓外界看到中國有那麼多企業推動全球創新,從招股書上也能看到,他們的很多收入也來自全球。同時,越來越多的海外投資人也想直接投資中國。2025年夏天,美國很多GP到中國走了一圈。歸根到底,只要中國有創新、有服務全球的能力,錢是會進來的。創業者就應該堅定地去探索全球創新,而不是區域創新。未來中美之間有多少牆,就會有多少洞,比如港股IPO,比如2025年的DeepSeek和宇樹,只要堅持創新,就一定有好的錢主動找過來。某模型初創公司融資負責人:走向二級市場是“雙刃劍”2026年初,月之暗面、階躍星辰接連宣佈了新一輪的大額融資。這件事向行業證明,一級市場還能支撐大模型發展。之前智譜、MiniMax的IPO向創業者釋放的訊號是,在一級市場不一定融得到錢了,所以大家在匆忙地走向二級市場。走向二級市場是一把“雙刃劍”。好處是企業擁有了更順暢的融資管道,更大的市場聲量。但也要意識到,企業很快會面臨商業化的壓力。能看到很多IPO的企業,立刻開始大力佈局ToB業務,因為ToB的優勢在於變現速度很快。二級市場給企業的業績兌現期是一到兩年,如果沒有達到預期,企業的股價會立刻下跌。AI組織:小是趨勢,人效是關鍵圖源:AI生成Honghub鴻鵠匯發起人鄒凌:稱職的極小團隊Founder,要會找機會、有執行力、能自我行銷能把一人公司或者這種極小組織公司良好經營起來的Founder,身上通常具備以下三種核心能力:一,找機會的能力。他們往往在某個行業深耕多年,可以從自身行業經驗中提煉真實痛點、找到可以用AI改進的低效環節。二,快速執行力,能借助AI獨立完成短時間內做出初版甚至多個Demo,然後迅速獲得反饋,聚焦最有潛力的方向迭代。此外,AI時代,很多早期項目並不依賴ToB銷售或獲客團隊,個人創業者還要擅長用社交媒體為自己“代言”。得有找到早期使用者、驗證需求,甚至帶來現金流的能力。清華交叉資訊學院助理教授、AReaL項目負責人吳翼:極小組織形式和全端創新能力是相輔相成的極小的組織形式和全端的創新能力是相輔相成的。不僅是創業公司,大公司中的AI研發團隊也有必要做簡化。因為人的溝通頻寬是有限的,但大的組織架構必然會走向職責劃分和管理,而人類糟糕低效的Context Sharing能力會成為整個團隊的效率瓶頸。傳統的組織中會把演算法和Infra團隊分開。如果做模型時Infra團隊和演算法團隊太過強調分工,容易產生一種情況,即演算法團隊像是個甲方,Infra團隊承擔做“髒活累活”的乙方角色。隨之而來帶來的問題是,做乙方的團隊,容易失去創新的空間;而習慣於做甲方的團隊,就可能不願意做髒活累活,這會很容易失去對於技術最底層的觀察、感知,和創新所需要的自驅力。因此,AI研發組織中,演算法和Infra是不能脫離成兩個團隊的。兩者共同設計、協同演進,才可以形成一支小而有戰鬥力的團隊。DeepWisdom創始人兼CEO吳承霖:不要迷信一人公司,組織的關鍵在“人效”行業認為AI能夠提效,進而替代人力。但當每家公司都有電腦的時候,其實相當於大家都沒電腦。卷度只會上升,不會下降。所以不要迷信一人公司,最終評價組織的維度應該是“人效”。每家公司80%的成本,其實是溝通成本,反而不是寫程式碼、文件的成本。AI可以精確規避溝通的隱形成本。一些頭部AI公司內部已經用AI代替人來分工。Claude能夠識別員工的所有歷史行為,識別技能體系,判定舒適區,然後派稍稍超出舒適區的任務。目前,人還需要作為AI的管理者。我們更需要的是技能全面、具有批判性思維的通才,去減少人之間的溝通問題。我們公司內部為通才成立了一個試驗性的組織“ROOT”,裡面沒有傳統崗位的劃分,每個人承擔從產品策劃到開發、管理的全端工作,效率是傳統組織的好幾倍。基礎模型下一戰:讓模型“看得懂”、“記得住”、“用得起”圖源:AI生成Luma AI首席科學家宋佳銘:多模態需要走向“大一統”2026年,大家有必要在“大一統”路線上做一些探索,也就是將圖片、視訊、音訊、文字等模態的理解和生成混合在一個模型中。相比於單純的圖像、視訊模型,大一統的擴散模型的好處在於,有更強的In-Context Learning(上下文學習)能力和Zero-shot(零樣本學習)能力,天花板更高,落地的想像空間更大。不少廠商都選擇將不同模態的模型拼接在一起,而不是統一訓練。這種方法會帶來短期收益,但長期來看,會延誤建構更好模型的時間。前百川智能聯合創始人、來福電台創始人兼CEO焦可:AI 時代真正的壁壘是記憶2025年行業對記憶的研究開始變多,但依然非常早期。人的記憶系統很複雜,每天都在睡眠中將短期記憶與長期記憶進行合併、遺忘和抽象,我們是在進行一場持續的日更訓練。今天還沒有一套成熟方案能夠系統性地做到這一點。AI時代真正的壁壘就是記憶。這是所有AI產品的兵家必爭之地,我們之所以選擇從語音切入,也是因為語音能讓使用者最自然地表達出Long Context(長上下文)。誰能跟使用者說更多的話,誰才有使用者更多的記憶,進而更懂使用者,提供更個性化的服務。因此,對我們而言,DAU並沒有那麼重要,因為DAU隨時會走。我們更看重DTU,Daily Talk User(每日交流使用者),這代表每天有多少使用者產生新的記憶。以及LMU,Long-term Memory User(長記憶使用者),這部分才是 AI 產品真正的價值。前阿里/字節大模型帶頭人、Infix.ai創始人兼CEO、港理工人工智慧講座教授楊紅霞:“去中心化”帶來落地今天模型的落地有一個很大的鴻溝。不少高精尖領域、中小企業、醫院、政府機構都想用生成式人工智慧,但遲遲無法實現,核心原因是現在的以個別廠商為中心主導的大模型沒有他們所對應的領域資料。需要強調的是,模型知識的注入只發生在預訓練階段,所以模型在企業或機構的本地化部署,一定要啟動持續預訓練,因為醫院、企業、機構大量的本地化私有資料和知識,在網際網路上是無法獲取的。同時,現在不同企業或機構的資料是很難共同分享的,導致了現有範式下模型無法做到全球化和全行業化。我相信未來每家公司都會需要大模型這樣一個腳手架。所以,我們希望把“腳手架”做到最便宜、最易用、入門門檻最低,讓每一家企業或機構都有自己本地化部署的模型。第二件事,我們想通過模型融合的方式,把某個領域的模型做到全球化。比如不同醫院的醫療專科模型融合起來,就能得到一個醫療領域的基礎模型。所以所謂的“去中心化”,就是在各個領域,集大家的能力,一起做好領域大模型。具身世界模型突破口:演算法要創新,場景要驗證圖源:AI生成大曉機器人董事長,商湯科技聯合創始人王曉剛:世界模型真要有效,必須有下游驗證閉環2024年11月,我就主導發佈過智能駕駛世界模型,但當時行業對這項技術的態度是“不太信”。原因是,包括輝達Cosmos世界模型在內,當時不少公司把世界模型當“資料生成器”。雖然可以在實驗室裡生成一堆看起來成立的場景畫面,但缺少下游真實落地驗證,沒人能回答“這些資料到底好不好用”,信任很難建立。過去採集這類資料危險又貴,甚至得協調“演員車”上路復現。商湯則可以先在世界模型裡規模化生成大量場景畫面與解決策略後,再用上汽智己的實車對世界模型的決策進行檢驗、校準,讓模型能力在真實反饋裡越練越準。同樣,世界模型在具身智能上也需要下游場景驗證。比如,大曉機器人先採用硬體更成熟的四足狗做“上街巡邏”的工作,在任務執行中驗證世界模型的能力,在真實場景裡持續迭代。極佳視界創始人兼CEO黃冠:2-3年內將可能迎來物理世界的“ChatGPT時刻”真機的“VLA+強化學習”正在快速迭代和擴展,但面臨巨巨量資料瓶頸,“世界模型”是被認為是未來能解決物理世界通用智能真機資料瓶頸的方式。我認為,2-3年內將可能迎來物理世界ChatGPT時刻。關於“物理世界ChatGPT時刻”的定義是:在100種常見任務中,90%的場景下達到95%的成功率。之所以認為這個時刻會在2至3年到來,是根據現有技術進展速度所進行的推測。這個過程目前並不是由世界模型完成所有任務,而是仍然需要與VLA、強化學習互相配合。具體而言, VLA解決的是作業的複雜性,世界模型解決泛化性,強化學習解決精準率和可靠性。清華交叉資訊學院助理教授、星海圖聯合創始人趙行:值得探索的前沿方向,是讓機器人預知未來我們會去較為積極地探索世界模型,但它還沒有進入到工業化的技術階段。與靠資料驅動的VLA不同,我覺得世界模型是一個非常典型的、靠聰明頭腦驅動的工作。它需要定義出一個最合理的演算法,建模物理世界的運動規律。如果能把世界的動力學規律給建模出來,那麼我們就不用再靠模仿學習的方式去訓練機器人了,機器人可以直接知道每一個動作的後果。但是讓機器人預知未來,可能比讓機器人規劃現在的動作更難,這有點像為瞭解決一個難題還要創造另一個難題。所以它非常適合最聰明的、最前沿的實驗室去探索。 (36氪)
黃仁勳在劍橋:創辦輝達 33 年,我還是個創業者
最近,黃仁勳登上劍橋大學講台,領取霍金學者獎。這是英國科技界的最高榮譽之一。往屆得主包括比爾·蓋茲(2019 年)、簡·古道爾(Jane Goodall,2020 年)、OpenAI 團隊(2023 年)。而這一次,屬於那位矽谷的晶片教父。但當他站上台,除了感謝,他更想說的是:33年後,Nvidia 仍然是世界上最大的初創公司。這不是回顧成功,而是重新出發。一個深知自己仍處在變革臨界點的創始人,在提醒所有人:AI 的真正革命才剛剛開始,我們都是創業者。接下來一小時的對話裡,他幾乎沒有談技術參數,也沒有提模型指標。他說的是:為什麼他說不解僱任何人?為什麼他從不寫商業計畫書?為什麼他說 AI 是下一場工業革命?我們整理出這場對話的關鍵內容,只講一件事:這些,對你意味著什麼?第一節|組織篇:如何建立容錯組織黃仁勳在劍橋說了一句聽起來很不矽谷的話:“外界都知道,我從不解僱人。”這聽起來反常規,但背後是一套為 AI 時代準備的組織邏輯。1、傳統管理制度,在 AI 公司會失效他說:我們要鼓勵創新,這就意味著必須讓人敢失敗。這是一個組織設計的前提:如果你想要員工用 AI 去嘗試新工具、新流程、新模型,那就必須允許他們失敗,而不是因為一次試錯被邊緣化。傳統管理裡的績效打分、360度評審、末位淘汰制呢?黃仁勳說都停了。因為他發現,這些制度在 AI 驅動的公司裡,會反過來打壓那些願意冒險、提出新想法、嘗試新模型的人。而這些人,恰恰最該被保留。他強調:“我們不該失去那 5%,因為他們可能就是剛承擔了風險、剛失敗、但明天能改變公司的人。”在 AI 發展節奏越來越快的背景下,這就尤其重要。因為模型、工具、崗位在不斷變化,你今天覺得不重要的人,可能就是明天最適應新發展的那批人。他們短期可能拉低平均分,但長期可能改變整個方向。2、那靠什麼運作?容錯機制和新型領導力如果一個組織不再靠獎勵最好的人、淘汰最差的人來運作,那靠什麼?黃仁勳的答案是:不是看你對不對,而是看你能不能幫別人成功。他給 “AI 領導者”下了新定義:職責不是下命令,是解決團隊解決不了的問題;價值不是始終正確,是敢承認錯誤、敢調整方向、敢第一個去試。兩句話值得記住:“隨著時間推移,領導者贏得了改變主意的權利。”“領導者的任務不是正確,而是讓別人成功。”這定義了一個全新的組織系統。在 AI 加速的今天,誰能建構真正抗不確定性的團隊,誰就能走得更遠。第二節|戰略篇:如何找到下一條路但這樣的組織建立了容錯組織,還需要一套匹配的決策方式。主持人問黃仁勳:你當年怎麼寫輝達的第一份商業計畫書?他笑著說:我從沒寫過商業計畫書。直到今天也沒有。全場安靜。他接著說:剛才我其實寫了一份新的,關於藥物設計。用了一張紙,一支筆,沒有數字,只有推理過程。這句話是整場對話最關鍵的部分:他把戰略從一堆數字,重新拉回到了推理本身。1、他的方法:不是寫計畫,而是畫推理鏈他形容自己的方法非常簡單:“我經常在白板前想:如果這是項目能實現的話,那麼下一步會發生什麼?如果是這樣,那我們應該怎麼做?”他不要市場調研,也不要資料報告。他要的是一條邏輯鏈:從一個事實出發,推到下一步,再推到下一步。輝達過去的每一次跨越,都是這麼來的:GPU 能不能做通用計算?通用計算能不能訓練模型?模型能不能理解視訊和物理?理解物理的模型,能不能理解分子?每一步都從能不能開始。2、最新的例子:蛋白質會和你說話這次在劍橋,他再次用這套方法推演了新方向:蛋白質有自己的語法和結構。當你訓練足夠的模型,它會告訴你它能做什麼。主持人問:你是說蛋白質會說話?他點頭:是的。這裡的“說話”,不是擬人化,而是一種新的理解方式:你給模型足夠多的蛋白質序列,模型會自己找出規律,就像找出一種語言的結構一樣。這就是他所謂的藥物設計。不是傳統的試錯,而是讓模型告訴你它可能會怎麼摺疊、怎麼反應。從 GPU 到藥物設計,邏輯鏈都是一樣的:找到規律,讓模型學會,然後應用。他說:你永遠不會準備好。一旦邏輯通了,就立馬動手做。戰略不是預測未來,而是弄清下一步會讓你學到什麼。他把資源投在能學到東西的方向上。不追熱點,不追賽道。模型更新太快,計畫永遠趕不上變化。這就是為什麼在 AI 時代,黃仁勳這套不寫商業計畫書的方法,反而更值得學。第三節|時代篇:如何判斷時代變化這套方法為什麼現在依然有效?因為他看到了一個根本性的時代變化。黃仁勳在劍橋這樣說:“AI 不再是工具,它將成為世界的新基礎設施。就像當年建電網、鋪光纜,我們現在在鋪智能網路。”他說的不是未來,而是已經開始。1、AI 正在變成底層基礎設施在傳統理解中,AI 是軟體,是App,是你在手機裡裝的一個功能。但黃仁勳不是這麼看。他說:每家公司都會用它,每個行業都要部署它。每個大的國家都得把它當成社會體系的一部分。誰先建好,誰就先發展。而 Nvidia 現在在干的,就是去幫每個國家建這套設施。Nvidia 在英國投資 20 億英鎊建AI叢集、支援新創企業,在韓國投放價值超 100 億美元的高端晶片,全球幾十個資料中心項目同時開工。為什麼要這麼做?他給出的理由很直接:“我們正面對嚴重的勞動力短缺。如果不是缺人,今天的全球 GDP 會更高。AI 不只是效率提升工具,它是填補勞動力缺口的工業解決方案。”這就是他眼中 AI 的定位:不是錦上添花,而是必需品。工業革命從英國開始,而現在,他認為人工智慧正在開啟新一輪工業革命。但這場工業革命和以前不同的是:它不會只停留在數字世界。2、下一代 AI:能動手、會理解物理世界很多人以為 AI 就是生成圖片、自動回答,但黃仁勳看到的下一步是:AI 要理解物理世界了。他說得很具體:要理解因果關係、慣性、摩擦、物體存在;要知道東西掉了不會消失、人走路不會撞牆;要能操作機械、理解環境、做出動作判斷。這就是具身智能(Embodied AI):能動手的 AI。從機器人、物流、倉儲,到建築、汽車、工廠控制,全都會被重寫。這不是 AI 的升級,是工業結構的重建。這也解釋了為什麼他反覆強調:別太早監管,別靠想像來立規則。因為只有讓 AI 真正進入物理世界、在實踐中迭代,才能知道它的邊界在那裡。誰能先動手,誰就先掌握主動權。AI 正在變成新的基礎設施,而具身智能會讓這套設施從雲端延伸到每一個物理空間。不是模型PK,也不是產品迭代,而是誰能先把智能鋪進工廠、醫院、倉庫、城市。結語|他遞出的那張紙黃仁勳在劍橋領獎,但他說的不是“我做成了什麼”。33年後,Nvidia仍是一家初創公司。沒寫過商業計畫書,但剛剛又寫了一份新的,關於藥物設計。做了六代技術跳躍,現在重新開始,什麼都不確定。他遞出的那張紙上,沒有數字,只有推理過程。這就是他在劍橋講的事。 (AI深度研究員)
紅杉資本AI峰會:世界,已經準備好了...
紅杉資本AI Ascent 20252025年5月2日,矽谷頂級風投機構紅杉資本(Sequoia Capital)在舊金山舉辦了第三屆 AI Ascent 峰會,集結了150餘位全球頂尖的AI創業者與研究者。與會嘉賓包括OpenAI的Sam Altman、NVIDIA的黃仁勳、DeepMind的Jeff Dean等重量級人物,場面座無虛席,盛況空前。本次大會圍繞一個核心議題展開:AI已經不是未來,而是現在。它不僅是技術範式的演進,更是推動整個商業社會進入“利潤即產品”的新時代。本文將圍繞紅杉資本三位合夥人——Pat Grady(市場與戰略)、Sonya Huang(產品與使用者)、Konstantine Buhler(前沿趨勢)——的主旨演講,提煉核心觀點,幫助讀者理解AI在2025年所面臨的機遇與挑戰。Pat Grady這是一個跑起來的時代1. AI市場規模是歷史等級的機會AI的市場規模遠超當年的雲端運算起步階段。Grady指出,AI市場在一開始就比當年的軟體市場大10倍。它同時切入“軟體價值鏈”和“服務利潤池”,意味著未來10-20年內,AI是絕對的增量市場。“軟體與服務都在被重構,市場已然開啟,誰先跑誰吃肉。”2. 不是“AI註定會來”,而是“AI現在就來”過去的技術浪潮往往需要使用者教育、管道建設,但AI不同:5.6億網際網路使用者、社交分發管道、豐富資料與計算基礎已經就緒。“這一次,發令槍一響,沒有任何 adoption barrier。”3. 真正的價值將沉澱在應用層Grady明確表示:基礎模型雖重要,但真正的價值與護城河會在應用層體現。誰能理解行業流程、誰能將AI嵌入真實場景,誰就能贏得這場比賽。“你要從使用者需求反推,而不是圍繞模型做產品demo。”4. “Go at Maximum Velocity”:以最快速度進入市場Grady援引紅杉創始人Don Valentine的名言“what now”,給出的答案是:以最大速度奔跑。他鼓勵AI創業者立即上線、迅速迭代,在競爭者之前打出使用者心智:“Run like heck。”“市場上現在有一個巨大的真空,如果你不填上它,別人就會。”5. 如何建構真正可持續的AI公司?收入 vs 真實使用:客戶是因熱度而買單,還是因為它確實改變了流程?關鍵指標是留存與粘性。從工具到結果定價:工具價值有限,但如果你賣的是“結果”,溢價能力將極高。資料飛輪:你的使用資料能否反哺模型,形成性能正反饋?總結:速度要快,基本面不能丟。只有真正解決問題的AI產品,才有可能穿越周期。Sonya HuangAI正在成為“日常剛需”1. AI進入使用者高頻行為2023年很多AI產品DAU/MAU極低(使用者只玩一次),而到了2024年,ChatGPT等產品的粘性已接近Reddit這種平台級應用。“AI不再是demo,而是日常習慣。”她分享了一個輕鬆的案例:自己在用AI生成跳舞GIF(Jib)刷爆GPU額度,而另一面,是AI在廣告、教育、醫療等行業帶來顯著效率提升。2. AI的“殺手級應用”正在浮現語音技術:Huang稱2024是AI語音的“Her時刻”(致敬電影《她》),聲音已經幾乎難以分辨人機。AI程式設計助手:無論是10x工程師還是小白,AI Code Assist工具正快速普及,並成為“日常生產力工具”。“AI程式設計工具已經實現了令人驚喜的‘PMF’(Product-Market Fit)。”3. 預訓練見頂,技術路線多元化Huang指出,大模型“繼續堆參數”的路徑已經邊際效益遞減,更多創新發生在:推理能力提升(Reasoning)AI工具鏈組合(Tool Use / Agent呼叫外部系統)AI結構搭建(如Anthropic的多Agent協同協議MCP)這些都表明,AI正在從單模型系統進化為“多模組協作系統”,產品形態也越來越複雜精細。4. 應用層仍是價值窪地Huang呼應Grady的判斷:未來10倍公司仍然會誕生在“AI賦能應用”層,不是底層模型本身。她特別提到:教育、企業服務等領域已經湧現出AI killer app,誰能打磨好AI UX,誰就能贏得未來。Konstantine BuhlerAgent Economy1. 從Agent到Agent Swarm,再到Agent Economy過去大家談AI Agent,如今很多公司已經部署了“Agent Swarm”(群體協作的AI代理)。下一階段將是:“Agent們將不再只是輔助人類,而是自主互動、交易、協作,形成類經濟網路。”但Buhler也強調:AI代理經濟必須是“以人為本的共生系統”,人類將繼續負責戰略、判斷與倫理,而Agent是效率執行器。2. 三大技術挑戰亟待解決持續身份(Identity & Memory):Agent要具備持久的記憶與行為一致性。通訊協議(Agent Protocols):Agent之間需要像TCP/IP一樣的通用協議,才能協作。信任與安全體系(Trustworthy):Agent具備執行力後,如何防止濫用?必須有“信任評級、安全審計”機制建立起來。這些問題決定了“AI能否真正成為可靠的系統組成部分”。3. 人類認知也需要更新Buhler提出:未來人類與AI共存,不只是技術問題,更是認知問題。Stochastic mindset:AI不是規則引擎,是機率分佈。管理者需要接受AI的“不確定性”。AI管理能力:如何制定目標、反饋機制、協作流程,幫助AI做出更好決策。高槓桿 × 高不確定性:未來小團隊+AI可以創造巨大的槓桿,但結果難以預測。“我們將迎來一人管理百Agent的時代,這需要組織結構與思維方式的重構。”4. 公司形態或將重新定義當AI Agent大規模參與決策、執行與流程管理時,企業不再是“人+流程”的集合,而可能變成“人類×AI網路”的系統。“真正的未來,不是人被AI取代,而是組織形態發生範式轉移。” (TDXII時差十二)