#紅杉
紅杉AI峰會2026主旨演講:從軟體時代到智能體時代的範式躍遷 | 全文圖解
在科技發展的宏大敘事中,我們正站在一個足以媲美工業革命的十字路口。近日,在備受矚目的紅杉資本“人工智慧巔峰”行業峰會上,紅杉資本的核心合夥人們與矽谷的頂尖創業者和技術專家齊聚一堂,共同探討這場正在重塑世界秩序的變革。本次會議揭示了一個核心共識:我們正從單純的“軟體時代”邁向全方位的“智能體時代”。會議深入探討了 AI 浪潮的獨特性,指出它是一場計算革命而非單純的通訊革命。核心議題圍繞“智能體(Agents)”作為新一代服務的崛起展開,提出了 MADS 戰略框架(護城河、可供性、擴散),並展望了未來機器將完成 99.9% 認知工作的圖景。儘管技術將重塑勞動力和生產力,但會議強調,人與人之間的聯結仍是價值的終極來源。核心觀點計算革命與 AGI:AI 是關於資訊處理的計算革命,不同於以往的通訊革命。長周期智能體的出現標誌著商業意義上 AGI 的降臨。MADS 框架:在模型之上建構競爭力的三要素——以客戶為中心的護城河(Moats)、降低使用門檻的可供性(Affordance)以及填補能力落差的擴散(Diffusion)。智能體即服務:軟體正在向服務演進,智能體將以極低的邊際成本實現無限規模化的專業服務(醫療、法律、開發等)。認知工業革命:認知工作將重演工業革命的歷程,未來絕大部分認知勞動將由機器完成,世界將進入“異類設計”和新科學發現的時代。人工智慧是一場關於資訊處理的計算革命,而非單純改變分發方式的通訊革命。軟體正在向服務演化,智能體將以極低的邊際成本,實現規模化的法律、醫療等專業服務。長期非同步智能體的成熟,標誌著商業意義上的通用人工智慧(AGI)已經降臨。護城河不再僅僅源於技術能力,而在於與客戶需求的深度繫結及阻力最小的使用路徑。未來99.9%的認知勞動將由機器完成,世界將進入“異類設計”與新科學發現的爆發期。當機器承攬了所有工作,人與人之間的聯結與情感體驗將成為價值的終極來源。不僅僅是更快的馬:計算革命的本質回顧科技史,從矽基電晶體到移動網際網路,每一波浪潮都在為今日的爆發積蓄動能。然而,當前的人工智慧浪潮與以往有著本質的差異。“這波浪潮是首個兼具軟體與服務屬性的變革,” 紅杉資本的合夥人在開場中指出,雲轉型的前十五年將軟體市場推向了數千億美元的規模,但人工智慧所觸及的是價值十兆美元的服務市場。僅在美國,法律服務的市場規模就足以等同於整個軟體行業。更深刻的差異在於技術本質。網際網路、雲技術和移動端本質上是“通訊革命”,旨在改變資訊的傳播與分發。而人工智慧則是一場“計算革命”,它關乎資訊是如何被處理和重塑的。這種底層邏輯的轉變意味著,我們不僅是在製造“更快的馬”——即提升10%或40%效率的生產力工具,而是在製造“汽車”——那些能徹底改變工作本質、組織形態乃至社會運行規則的顛覆性應用。商業通用人工智慧的降臨:從自動化到自主化在過去兩年中,技術轉折點接踵而至。從預訓練模型的震撼問世,到推理能力的大幅躍升,再到如今能夠處理長周期任務的智能體崛起。雖然學術界對通用人工智慧(AGI)的定義仍有爭論,但從商業和實踐的角度看,變革已經發生。“如果你能指派一個智能體去完成一項工作,並且它能在遇到故障後自我修復並持續工作直到任務完成,這就是商業意義上的通用人工智慧。”智能體不再是簡單的程式碼行間輔助,它們正演變為能夠感知環境、選擇行動並自主達成目標的複雜系統。從程式碼編寫到建築服務銷售,從內部辦公流程到複雜的科研任務,智能體的表現已經從“分鐘級”的持續性跨越到了“小時級”甚至更長。這種“把事情辦成的能力”,正在將人類從繁瑣的流程中解放出來,轉向更高層級的戰略管理。策略框架:在基礎模型之上建構護城河對於在基礎模型之上進行創新的初創企業而言,如何在技術快速演進的洪流中站穩腳跟?峰會提出了一個關鍵的戰略框架,即由護城河、可供性與擴散組成的競爭力支柱。首先是護城河。在計算革命中,底層技術的變化日新月異,但客戶的需求往往保持穩定。“為了建構護城河,你實際上應該關注客戶需求,因為你所建構的技術在明天可能就會變得無關緊要,而你以客戶為核心的緊密程度則會更加持久。” 其次是可供性,即為客戶創造阻力最小的路徑。優秀的智能體產品應該像錘子一樣,無需解釋,使用者一看便知如何使用。最後是利用技術能力與市場落地之間的“擴散鴻溝”,這正是應用層公司的巨大機遇所在。服務即軟體:重塑十兆美元的產業版圖“服務即新一代軟體。” 這一判斷預示著傳統軟體行業的終結與服務業的智能化重生。在醫學領域,智能體可以根據個體的基因組提供個性化建議;在法律領域,它們能代表客戶進行合同談判甚至法律訴訟。相比於人類員工,智能體具備無限的規模化潛力與極低的邊際成本。“人類難以實現規模化,且成本高昂;而智能體可以通過算力實現無限擴張,且你只需要支付令牌成本,而非薪水。” 儘管人類目前在適應力上仍具優勢,但隨著“苦澀的教訓”——即算力終將戰勝人類經驗的規律持續發生作用,智能體在專業領域的表現將很快超越普通人類。一個由非同步智能體自主運行、甚至機器製造機器的“黑燈工廠”時代正在加速到來。認知的工業革命:走向機器主導的創造力時代如果我們把工作分為體力與認知兩類,那麼人類已經完成了體力的工業革命。今天,全球超過99%的體力勞動由機器完成。而現在,認知領域正在重演這一處理程序。“我們相信,在不久的將來,地球上99.9%的認知工作將由機器完成。”這一轉變將帶來三個深刻的影響:第一,智能將成為像鋁一樣的廉價商品。曾經珍貴如珠寶的鋁,在電解法發明後變成了隨手可丟的包裝材料;曾經需要數十年磨練的博士級技能,未來可能只需呼叫一次令牌即可獲得,用完即棄。第二,世界將進入“異類設計”階段。機器的邏輯不同於人類直覺,當人工智慧設計晶片或建築時,會產生效率極高但外觀怪異的作品,我們必須保持開放心態。第三,人工智慧將催生出如熱力學般基礎的新科學,將神經元與令牌的運作系統化、公式化,幫助人類最終掌握意識的奧秘。人是萬物的尺度:在技術洪流中守望人性價值當機器可以處理所有認知任務,甚至能比人類更好地進行藝術創作時,人類的價值何在?峰會引述了古希臘哲學家普羅泰戈拉的名言:“人是萬物的尺度。” 任何脫離了人類體驗的事物,其價值都將不復存在。就像攝影技術的出現並沒有終結繪畫,反而催生了印象派與表現主義一樣,人工智慧的普及將逼問我們藝術與工作的本質。“人工智慧可以完成工作,但唯有人與人之間的聯結,才能讓你找到在乎的理由。” 在這個技術指數級增長的時代,那些讓我們之所以為人的特質——情感、關係與共同的體驗,反而成為了最稀缺、最珍貴的資產。十年之後,工作方式或許會翻天覆地,但那些在變革中建立的人際紐帶,將是我們在人工智慧巔峰之上最持久的收穫。天空之城全文整理圖解宏觀校準:AI 浪潮的獨特性Pat Grady: 大家早上好,你們過得怎麼樣?很好,很好,感覺好多了。嘿,感謝大家來到這裡。我們對此深表感謝。我們這樣做是為了回饋社區,因為我們正處在一個重要的時代,能夠為大家提供一個相聚的場所,這對我們來說是一種榮幸。這是我們迄今為止制定的最棒的議程,也是我們見過最優秀的參會者陣容。所以,我們首先想說的是,謝謝大家。我們知道你們都忙得不可開交。感謝你們今天能出席。像往常一樣,我們準備了一份非常特別的議程,索尼婭,穿著無可挑剔的服裝,康斯坦丁和我將先講幾句開場白。我們有幸參與了許多與各界有趣人士的對話,因此每年我們都希望嘗試將其進行一定程度的整合,並將我們所聽到的內容分享給你們。所以,我會先做幾句整體性的校準說明,然後由索尼婭談談我們當下的所見,接著由康斯坦丁談談我們對未來的展望。在校準部分,我們先從宏觀視角切入,回到矽基電晶體的時代,正是它賦予了該領域名稱,隨後這些電晶體被建構成由網路連線的系統,並以網際網路的形式走向大眾,支援了諸如雲端社交媒體等應用,最終以移動裝置的形式出現在我們的口袋裡,而這些裝置在今天所能實現的功能與魔法無異,那就是 AI。我們喜歡展示這張幻燈片,以前來過這裡的人應該都見過,是因為它提醒我們,所有這些浪潮都是相輔相成、不斷疊加的。我們似乎經歷了數十年的演進,才積攢了足夠的算力、頻寬、資料和人才,從而把握住當下的這個時刻。現在,這股 AI 浪潮有些不同。體現在三個方面。Sonya Huang: 首先,這是迄今為止規模最大的一波浪潮。Pat Grady: 這通常是事實,但這波浪潮有著更具體的獨特性,即它是首個兼具軟體與服務屬性的浪潮。第一行展示了雲轉型的前15年,期間軟體的市場規模(TAM)從約3500億增長到6500億,而云服務在其中佔據了約4000億的市場份額。第二行所展示的是全新的內容。這指的是目前似乎同樣可獲取的服務收入。10兆是一個相當整齊的整數。我們無法確定最終規模是10兆、5兆還是50兆。但我們確實知道,僅在美國,法律服務就是一個4000億美元的市場。這僅僅是一個垂直領域和一個地理區域。其規模就已等同於整個軟體行業。因此,這一機遇是巨大的。第二點。這是迄今為止最快的一波浪潮。我想我們都能感受到這一點。這意味著這片空白區域——請大家關注頁面上 AI 這一側——正在被迅速填補。這些圖示所代表的公司,正是得益於雲端運算、移動端以及現在的 AI 技術變革,才實現了超過 10 億美元的營收。Konstantine Buhler: 按照目前的處理程序和速度,未來還會有更多公司加入其中。計算革命與商業 AGIPat Grady: 第三點。這可能是最有趣的一點,我借用了我的合夥人康斯坦丁的觀點,即技術革命基本分為兩種類型。一種是通訊革命,旨在改變資訊的傳播方式。在座的大多數人所經歷的,僅僅是通訊革命。網際網路、雲技術、移動裝置,這些本質上都屬於資訊分發。這些是通訊領域的革命。AI 則有所不同。AI 屬於這一類。AI 是一場計算革命。它關乎資訊是如何被處理的。這聽起來可能只是語義上的區別,但它們在波形本質上截然不同。或許最直觀的感受方式是意識到:腳下的地基一直在移動。隨著新功能的不斷湧現,每個人所建構的底層技術基礎也在日新月異地變化。在過去的幾年裡,我們經歷了三個主要的轉折點。第一個是 ChatGPT 時刻。2022 年 11 月,世界見證了預訓練的強大能力。第二個是幾年後的 o1 模型,即推理能力。突然之間,圍繞推理時間計算的第二條縮放定律出現了。第三個是最近出現的 Claude Code Opus 4.5 ,現在是 4.7。世界見證了長周期智能體的強大能力。雖然這看起來像是連續體上的三個點,但第二和第三個轉折點之間存在某種程度上的斷層。這是一種非連續性的變化。如果不揣冒昧地說,我們認為這就是 AGI。而且,我可是學經濟學專業的。我們是風險投資人,不會去提出關於 AGI 的技術定義。好嗎?我們研究創始人、市場以及兩者的碰撞,也就是商業。但我們確實在研究商業。因此,從商業角度、實踐角度以及功能角度來看,如果你能指派一個智能體去完成一項工作,並且它能在遇到故障後自我修復並持續工作直到任務完成,這就是商業意義上的通用人工智慧。即使你認為那不是 AGI,也沒關係,順便說一下,索尼婭會在她的部分詳細討論這一點。即使你認為那不是 AGI,我也不認為那是 AGI,但我認為我們都能看出汽車已經到來了。過去幾年裡,我們見過了很多更快的馬。那些讓你生產力提升 10% 或 40%,卻並沒有從根本上改變你工作方式的應用程式。現在我們開始看到汽車了。那些讓你生產力提升 10 倍或 40 倍,並徹底改變你工作方式、工作本質以及組織本質的應用程式。汽車時代已經來臨。這是 Sequoia 的創始人 Don Valentine,他以愛問一個問題而聞名:那又怎樣?為什麼這一切如此重要?之所以重要,是因為就在過去幾個月裡,這場競賽已經開始了。而且這與我們習慣的競賽截然不同。駕駛汽車的方式與騎馬的方式是不同的。製造汽車的方式與照料馬匹的方式也是不同的。所以,這是一種非常不同的競賽。我們今天想把大家召集到這裡的原因之一,是因為沒有人擁有所有的答案。我們在一起交流的時間越多,就能學到越多,並有望弄清楚這一切將走向何方。建構策略:MADS 框架Pat Grady: 我們務必盡快採取行動,因為僅從商業角度來看,這關乎巨大的利益。市場規模高達 10 兆美元。我們有實驗室正從技術驅動的角度開展研究。我們也有初創公司正在以客戶需求為導向進行開發。雖然在座各位代表了所有相關實驗室,但你們大多數人是在現有基礎上進行建構。所以我們花一點時間,來討論那種以客戶需求為導向的方法。對於那些在現有實驗室基礎上進行建構的人,我們有些建議——既然是免費建議,那它就值你們付出的每一分錢——我們的建議是去參考 MADS。其實我們並不需要你們感到憤怒(Mad)。如果你們願意,當然也可以感到憤怒。如果那是驅動你們的動力,那也挺好的。儘管生氣吧。但這只是一個方便的縮寫,指代可供性(Affordance)、護城河(Moats)與擴散(Diffusion),這是在模型之上建構策略的三個特徵或三大支柱。首先談談護城河,純粹為了好玩。有人記得去年的這張幻燈片嗎?有一位,他還是我的合夥人。好的,那很酷。提醒一下,這張幻燈片展示了商品化周期,即從創意到實現客戶滿意所需經歷的價值鏈環節。我們實際上不會逐一去過這些價值鏈環節。我想在這裡指出的是,如果你從技術的角度出發,價值鏈中的每一個環節都會以略有不同的方式被處理。如果你從客戶的角度出發,那麼你在鏈條中所接觸的每一個環節都會略有不同。現在,這裡有一個違反直覺的部分。在這一場關於資訊處理的計算革命中,你往往會想要關注下方這些領域,因為那裡不斷湧現出各種酷炫的新事物。但為了建構護城河,你實際上應該關注上方這些領域。因為你的客戶需求變化速度遠不及技術能力演進的速度。你所建構的東西在明天可能就會變得無關緊要。而你以客戶為核心的緊密程度,則會更加持久。這並不是說產品和技術不重要。它們極其重要。且通常情況下,最好的產品會勝出。但在一個產品迭代極快、能力演進也極快的世界裡,當思考商業護城河時,我們建議你儘可能從客戶的角度出發,思考所有能夠圍繞這些客戶建立緊密聯絡的方式。好的,MADS 中的 A 代表的是 Affordance(可供性)。這是一個我們從設計領域借用的術語。錘子就是一個具有可供性的物體。我有一個兩歲的兒子。如果我給他一把錘子,他就會知道該怎麼用。他會抓起錘子開始敲打東西。這就是我們不給他錘子的原因。具有可供性的物體是不需要解釋的。人們一看就知道該怎麼用它。Claude code 極其強大。去讓一名普通的財富 500 強企業員工打開終端試試,看看他們能走多遠。雖然它很強大,但提供的功能可供性並不多。這並非是對 Anthropic 的批評,但對於任何希望在現有基礎上進行建構的人來說,這是一個機會。你可以為特定客戶及其具體問題創造阻力最小的路徑,讓他們能極其簡單地達成業務所需的結果。這就是可供性的概念。最後,MADS 中的 D 指的是擴散(Diffusion)。擴散鴻溝正是那些在應用層進行開發的公司所面臨的機會。技術能力向市場擴散的速度,遠低於這些能力被創造出來的速度。基礎模型的演進速度每天都在超越普通的財富 500 強企業,這一鴻溝正在不斷擴大,機會也隨之增長。因此,對於護城河(Moats)而言,請嘗試以客戶需求為導向進行思考。關於可供性(Affordance),試著思考如何為你的客戶創造阻力最小的路徑。而那個擴散鴻溝,正是你所擁有的機遇。除非早先那張空白區域逐漸被填滿的幻燈片讓在座的各位感到沮喪,那麼我們需要提醒你們的是,沒有任何領先是絕對穩固的。賽車界有這樣一句話:你無法在晴天超越15輛車,但你可以在雨天超越15輛車。而現在,基礎模型正湧現出如傾盆大雨般的新功能,這意味著沒有任何領先是絕對穩固的,但也意味著任何人都有機會勝出。這是一個多麼偉大的時代。接下來,我將把它交給索尼婭。智能體時代:服務即新一代軟體Sonya Huang: 我可以再說一句嗎?在觀眾席中看到這麼多友好的面孔真是太好了。今天在場的各位都是卓越非凡的人。能與大家共同置身於這個生態系統中,我感到非常高興。我這一部分的內容旨在探討人工智慧當下的發展,對於2026年而言,核心就是智能體。好,讓我們回溯到2022年。請舉手示意。這裡有人記得 Auto GPT 或 Baby AGI 嗎?好的。好的,明白了。這些項目在 GitHub 上一夜爆紅。它們的操作方式是呼叫 GPT3,為其配置一些工具,封裝在循環中,並讓它朝著目標運行。起初看起來很有前景,直到你看到那些智能體一次又一次地失敗。雖然看著挺可愛、挺招人喜歡的,但實際上完全沒用。Pat Grady: 我放這張幻燈片是為了提醒大家,我們其實早就預見到智能體時代的到來。Sonya Huang: 我們本可以在幾年前就預見這一切。但回到2022年,當時的模型確實還沒準備好。Pat Grady: 時間快進到今天,從年初開始,情況確實發生了質的變化。Sonya Huang: 突然之間,智能體遍地開花,而且它們似乎真的能夠投入實際運作了。其中有兩個智能體表現尤為突出:面向技術人群的 Claude Code,以及讓任何擁有手機的人都能使用智能體的 OpenClaw 及其所有龍蝦系列衍生產品。所以,無論你是硬核工程師還是普通使用者,現在的重點在於,人人皆可建立智能體。我們現在看到人們正在為各種用途建構智能體。甚至還有一些荒唐的例子,比如有的 open-call 智能體會專門去舉報鄰居的稅務欺詐行為。請不要這樣做。或者實際上,也許請這樣做。還有創業相關的事情。運行生成式媒體活動來銷售建築服務的 Agent。然後還有一個專業層面。我可以告訴你,在 Sequoia 內部存在一場巨大的競賽,看誰能建構出最好的 Agent 來更好地完成我們的工作。那麼,成為一個 Agent 意味著什麼?這裡有一個可能的定義。Agent 是一個系統。它感知其環境,選擇行動,並自主地朝著一個目標前進。順便說一下,我想這是我自己用 C-dance 製作的。我對此感到非常自豪。視訊模型已經取得了長足的進步。更具體地說,我認為智能體具有三個功能元件。首先是推理和規劃的能力。這是直覺的基準水平以及即時思考的能力。其次是採取行動的能力。這包括使用工具、搜尋、編寫和編譯。最後是朝著目標不斷迭代的能力。這正是賦予智能體在長周期內完成任務能力的持久性。因此,代理(agency)結合了這三樣東西。簡而言之,就是把事情辦成的能力。如果我們把代理拆解為模型、工具和協作框架(harnesses)這些組成部分,過去一年裡每個部分都在飛速進步。首先,模型即大腦。這是目前發生的最重要的事情。衡量指標圖表測量的是模型在執行複雜任務時,能夠持續推進而不偏離軌道的時間長度。我們已經從一年前的十分鐘量級發展到了今天的數小時量級。所以,這是目前發生的最重要的事情。模型終於變得足夠強大,能夠維持長周期任務的性能表現。其次,工具即手腳。這些賦予了模型訪問各種能提升我們電腦生產力工具的能力,例如用於檔案系統和開發工具的終端、iMessage、Slack、網頁搜尋、電腦使用等等,應有盡有。過去二十年間我們為人類打造的各種工具,最終也能夠轉化為對智能體而言極其有用的資源。有一種普遍的論調認為 SaaS 已死。但我認為恰恰相反,隨著使用這些工具的智能體數量增加,其價值將會爆發式增長。增加。模型和工具賦予了智能體執行能力。而控制框架(harness)則賦予了它們持久性。即保持任務專注、進行調整併持續運行的能力。這一反饋回路現在確實開始加速運轉了。特別是在有了強化學習之後,我們正在對這些智能體進行“駕駛學校”式的訓練,也就是在 RL gyms 中訓練它們。Pat Grady: 我們正在不同領域推動性能的提升,從機械工程到設計,旨在尋找突破。我們同時也看到了自我改進的初步曙光,即機器製造機器。Sonya Huang: 例如,Andrej 的另一個研究項目在短短兩小時內自主提升研究能力,達到了 GPT2 等級模型的水平。那麼,一個到處都是智能體的世界會是什麼樣子?智能體的存在處於一個智能程度的滑動量表上,讓我們以程式設計為例。在 2023 年,我們擁有了標籤頁自動補全功能。這是一種 AI 在行間輔助人類的方式。Pat Grady: 這種方式雖然在增量上有所助益,但從根本上說並不具備變革性。Sonya Huang: 我們現在擁有了智能體開發,即一個人與一個智能體對話,指導它做什麼,或許還能管理一個智能體團隊。但這種範式正在被進一步推進。我們現在看到了後台智能體、非同步智能體以及能夠衍生出子智能體的智能體。我們認為,在這種整體範式下,非同步智能體極有可能在規模上超越當前範式,這僅僅是因為該系統所能提供的槓桿效應。Pat Grady: 最後,在推進前沿尖端領域方面,即我所說的“黑燈工廠”,將人類審查徹底從系統中剝離。Sonya Huang: 這聽起來很瘋狂,但我已經在生產環境中見過這種情況,包括在網路安全公司中。只要具備足夠可靠的護欄機制和足夠優秀的工程能力,這是完全可能的。因此,我們正在智能體化的處理程序中不斷攀升。智能體正從在你身邊提供微小協助的助手,進化為需要管理的實習生,進而轉變為能夠自我管理的實習生,最終演變為值得信賴、無需監督即可部署到生產環境的實習生。這就是正在發生的演進,不僅是在程式碼編寫領域,而是覆蓋了所有智能體應用。對於在座的創始人而言,最重要的啟示是:服務即新一代軟體。帕特在我認識他以來一直強調這一點,我們的合夥人 Julian(他今天也在觀眾席中)也發表過一篇關於此話題的優秀文章。我們對此早已知曉,但我認為這一趨勢正在真正地成為現實。在醫學領域,你可以聘請一個尊重你的基因組、為你提供個性化建議、能夠為你開具處方藥物並推薦臨床試驗的智能體。在法律領域,你將能夠聘請能夠代表你協商合同,甚至進行訴訟並為你達成和解的智能體。在數學和科學領域,我們正看到能夠解決這些問題或發現新型超導體的智能體。這難道不令人振奮嗎?或者在消費領域,那些可以為你管理收件箱、日程表、財務狀況以及申報稅務的個人智能體。我們預計未來智能體將無處不在。這在一定程度上是因為聘請智能體比僱傭員工要容易得多。人類難以實現規模化。而智能體可以通過算力實現無限規模化。讓員工保持滿意度是一件困難的事。除了我以外,我總是很快樂。Agents 的維護成本很低。人類的成本很高。你需要支付他們薪水。你需要支付 Agents tokens。通常情況下,用 tokens 完成任務的成本要低於支付等值的薪水。現階段,人類通常仍然更聰明。但 bitter lesson 的影響持續存在,很快 Agents 在許多方面就會變得更聰明。因此,這張幻燈片的重點並不是說我們人類要失業了。我認為適應力是人類獨有的特質。但我們預計智能體在應用層的部署將會迅速進行,且規模增長速度前所未有,因為其經濟效益顯而易見,且具備固有的可擴展性。綜上所述,智能體的數量正以某種指數級,或許是超指數級的速度激增。當商業活動在智能體之間展開時會發生什麼?它們可以互相支付嗎?當智能體能夠自行協商交易條款時,會發生什麼?未來是否會出現成群結隊的智能體來監管我們,以防範網路安全威脅或 Megadon 之類的事件?我們只知道這個世界正在極速變得詭異。最後,我想借用 Bene Gesserit 的心境來結束此次發言。Long Horizon 智能體已經到來。它們所處的曲線,非常清晰。對於創始人而言,我想每個人都有看到人們借助 AI 在極短時間內完成艱巨任務的案例。例如,來自 Z'd 的 Nathan 在假期期間獨自一人利用 Claude 完成了一個原本需要三年的登月級項目。Brett Taylor 用一個周末的時間重建了 Sierra。Notion 團隊僅用了六周時間就重寫了 800 萬行程式碼。因此,每個人都有這些時間線被壓縮的例子。但我認為,在 AGI 實驗室之外,很少有人真正見識過會發生什麼。當你將這些被壓縮的時間線進行疊加時。而這正是現在所能實現的。所以,無論你想像中未來一百年能建構出什麼,我們認為借助智能體,現在一百天內就能實現。接下來我將交給康斯坦丁。未來展望:認知的工業革命Konstantine Buhler: 謝謝你,索尼婭。好的,非常感謝索尼婭和帕特帶來的精彩概述與分析。在這一部分,我們將簡要探討接下來的發展方向。我們的目標是,因為我們都知道自己正處於 AI 時代。它將會是什麼樣子?它將會帶來怎樣的體驗?它的特徵是什麼?在演示的前半部分,帕特將技術革命分為計算和通訊兩個維度。我們在這裡將工作類型再進行一次劃分。一種是體力工作。這可以是 Pony Express 上的包裹,也可以是 Falcon 9 運載的衛星。工作等於力乘以位移,即物理位移。接下來是認知工作。例如 Pythagoras 提出該定理。例如 DeepMind 解決蛋白質折疊問題。有意識的思考。這些是非常不同類型的工作。但我們相信它們將遵循非常相似的變革模式。那麼讓我們談談體力工作,因為我們已經經歷過工業革命帶來的變革。Pat Grady: 在人類歷史的絕大部分時間裡,世界上所有的工作,或者說幾乎所有服務於人類的工作,都是由某種肌肉力量完成的。Konstantine Buhler: 依靠人或動物。靠人去搬運東西,或者靠動物牽引人類前行。這一切始於1700年,但其淵源可追溯至幾千年前。隨後,局面開始發生轉變。水力和風力。蒸汽機。此後,處理程序開始加速。蒸汽機。內燃機、電動機。時至2026年,可以估算得出,地球上超過99%的人類體力勞動已由機器完成。將你帶到此處的飛機、房間內所有物品的製造,以及支撐你此刻所體驗的人類巔峰生活的各項運輸保障。我們認為認知的演進也將經歷類似的歷程。我們只是處於一個較早的階段。在人類歷史的大部分時間裡,地球上所有的人類思考主要都是由人類完成的,或許還有一點來自動物,比如牧羊犬驅趕羊群。在機械勞動之上,曾存在過一小部分輔助工具,例如星盤或時鐘。Pat Grady: 現在,在過去幾百年裡,進展其實並不大。直到電子計算出現。Konstantine Buhler: 而在過去一百年裡,試想一下,此時此刻為了服務你這樣的人類,正在進行著數以兆計的計算。所有這些工作,所有這些正在發生的認知工作,都是為了在任何時刻服務於我們。數以兆計的計算。我們相信 neural network 是下一個大浪潮,並且在不久的將來,地球上 99.9% 的認知工作將由機器完成。這種類比非常鮮明,好消息是我們已經經歷過這樣一場革命。認知革命將與工業革命非常相似,只是規模要大得多,速度也快得多。那麼,生活在這樣的未來會是什麼樣子?我想以四個短篇故事的形式,分享對這個未來的一些思考動因。四個故事:智能、設計、科學與藝術Konstantine Buhler: 第一個故事。19世紀中葉,美國想要為首任總統及最偉大的戰爭英雄 George Washington 建造一座宏偉的紀念碑。因此,我們設計了當時世界上最高的建築——Washington National Monument,並且我們想要用世界上最珍貴的金屬來裝飾其頂端。當時 100 盎司的這種金屬是世界上最珍貴的,珍貴到我們甚至將其放在 Manhattan 的 Tiffany's 進行展覽。那種金屬就是鋁。在 Washington National Monument 竣工後的幾十年裡,一位年輕的發明家發明了電解法,即從泥土中分離出鋁的工藝。此後不久,鋁便被用來包裝糖果和三明治,然後被扔進垃圾桶。Pat Grady: 鋁就是智能。電解法就是人工智慧。Konstantine Buhler: 我們即將進入這樣一個世界:一些耗費數十年光陰練就的、達到博士水平的寶貴技能,在呼叫後轉瞬即逝,用完即可將其揉作一團直接扔進垃圾桶。第二個故事,我們正在進入一個異類設計的世界。我們今天所見的世界,其核心邏輯皆是為了人類而設計。眾所周知,這種設計經過了最佳化,使之符合我們的大腦邏輯,因為世界上幾乎所有的認知活動都是由我們完成的。然而,當認知活動由機器來完成時,情況將會大不相同。2006年,NASA 正在為一項大型航天任務,即衛星太空任務最佳化天線。傳統上,他們的天線看起來是這樣的。那是一種優美的幾何對稱圖案,在一定的功率限制下最佳化了表面積。這一次,他們決定將任務交給電腦,並使用一種類似於強化學習的進化演算法。Pat Grady: 結果就是眼前的這個天線。生產力顯著提高,且不符合人類的直覺思維。Konstantine Buhler: 在這個 AI 時代,當我們把認知任務交給機器時,我們將得到的結果是不符合我們直覺的。Pat Grady: 當 AI 設計晶片、汽車和建築物時,它們看起來可能會大相逕庭。Konstantine Buhler: 對於我們即將進入的世界,必須保持開放的心態,因為 AI 的思維方式與我們不同。它將具備異類的設計風格。第三個動力學故事關於新興科學。並非新興科學。我們都知道存在新興科學。我所說的是新興科學領域。在工業革命初期,湧現了像 Newcomen 和 Watt 這樣偉大的工程師,他們完善了內燃機。簡單來說,就是把石油化工產品注入活塞,點火燃燒,數百萬乃至數十億計的粒子發生爆炸。Pat Grady: 爆炸推動活塞,從而做功。Konstantine Buhler: 在近100年的時間裡,這一切都處於修修補補的階段。當時工程師只是在說,那樣效果稍微好一點。或許你可以將其視為一種規模法則,但那實際上是工程師們在擺弄產品,看如何能進行微小的改進。在120多年後,Sadi Carnot 出現了,並將這一切總結為一門新的科學——熱力學。Pat Grady: 他說,等一下,這裡有數百萬或數十億的粒子。Konstantine Buhler: 我們實際上可以將這一切系統化、公式化。而在當前的情況下,這裡有數十億個神經元,數兆個 Token。此刻,我們正處於 AI 的修補階段。即使我們認為這是一門已被認知的科學,事實並非如此。未來,我們將在接下來的幾十年內迎來一門如熱力學般基礎的科學。在座的各位或許就有人能開創這門科學。而這門科學將被納入高中的教學課程中。它將具有如此基礎的地位。它將幫助我們掌握 AI,甚至幫助我們掌握意識。第四個故事。非理性的藝術。在人類歷史的絕大部分時間裡,即數萬年間,藝術一直朝著寫實主義的方向演進。這是一幅大約 25000 年前的洞穴壁畫。從埃及象形文字、希臘陶器到文藝復興時期的畫作,這是一場向寫實藝術邁進的宏大變革。看看這其中的差異。歷經數萬年。人類的偉大勝利。Pat Grady: 隨後工程技術應運而生。銀版攝影法,早期攝影技術。Konstantine Buhler: 突然之間,我們花費數十年人生去磨練、力求每一筆觸都完美的技藝,瞬間消失了。那麼世界對此作何反應?他們認為繪畫藝術已經終結。噢,就這樣結束了。機器能比任何人類做得更好。藝術即是藝術,藝術已終結。那麼,發生了什麼?人類是如何回應的?人類的回應是提出疑問:這種藝術的目的是什麼?是為了以眼睛所見的方式捕捉那一刻嗎?還是為了以內心和靈魂所感的方式捕捉那一刻?Pat Grady: 印象派、表現主義、立體主義、新表現主義,所有這些新的藝術形式都是人類對科學領域這一巨大變革所作出的回應。Konstantine Buhler: 兩千五百年前,希臘哲學家 Protagoras 寫道:人是萬物的尺度。他的意思是,任何事物若脫離了人類,便不存在價值。無論是鋁材、藝術,還是智能,皆是如此。Pat Grady: 它之所以有價值,僅僅是因為那份體驗。AI 可以完成工作,AI 也終將完成工作,但唯有人與人之間的聯結,才能讓你找到在乎的理由。Konstantine Buhler: 這就是我們今天齊聚一堂的原因。十年之後,工作方式將發生巨大的變化。一切都將迎來翻天覆地的改變。但唯一不變的,是你們今天與身邊人建立起的關係。它們將長久延續。那將是你們回首往事時最珍視的部分。那也將是今天最有價值的收穫。因此,我鼓勵大家與身邊的人建立聯絡,盡情享受這次 AI Ascent 的時光,並真正地擁抱那些讓我們之所以為人的特質。 (Web3天空之城)
馬斯克官宣1兆瓦晶片計畫,紅杉合夥人力挺:xAI會贏!
【新智元導讀】馬斯克最新豪言震動矽谷:晶片自己造,資料中心要上天,目標直指人類星際文明。很多人第一反應是「又在吹牛」,但紅杉合夥人Shaun Maguire卻反手押注:xAI會贏。上周,馬斯克豪言:「買不到晶片,我們就自己造!」馬斯克宣佈自建晶圓廠「Terafab」,目標每年1太瓦算力,還要把資料中心送上天。這座新晶片工廠坐落於美國德州奧斯汀,目的是實現晶片遞迴式改進,並探索非傳統計算方式;終極目標是讓人類文明邁向星際文明,征服星辰大海。不過,工廠規模前所未有,終極理想太過宏偉,以至於有聲音認為這是馬斯克在炒作、吹牛、畫餅——剛剛,美國知名風險投資機構Sequoia資本合夥人Shaun Maguire,卻力挺馬斯克,拋出了一個極具爭議的判斷:xAI將會獲勝。他認為,人們又一次低估了馬斯克,尤其低估了xAI。Shaun不是一個圍觀者,他是Sequoia合夥人,主導或共同主導了Sequoia對SpaceX、X/xAI等項目的投資。換句話說,他既是技術型投資人,也是最早、最堅定押注馬斯克體系的人之一。這篇長文重要的地方,不在於Shaun「又支援馬斯克」,而在於他試圖把外界對馬斯克的理解,從「政治人物」重新拉回「技術組織者」。表面上看,過去幾年馬斯克的公眾形象確實變了。五年前,更多人把他當成技術狂人;現在,更多人先看到的是政治立場、社交平台爭議、監管對抗和輿論漩渦。但在Shaun看來,這些東西並沒有改變馬斯克的底層工作方式,他仍然在追逐那個他一貫追逐的目標:找出制約技術躍遷的最大瓶頸,然後不惜代價地拆掉它。Shaun在文中還給了另一個非常重要的判斷:就算馬斯克+xAI贏了,也不代表其他前沿實驗室會輸;數字智能會是史上最大的市場之一,而物理智能最終可能更大。市場誤判xAI,根源不在模型榜單,而在於外界已經不再用「技術組織者」的視角理解馬斯克。馬斯克真正稀缺的能力預見未來Shaun這篇文章提到馬斯克一個重要的能力:識別拐點的能力。在那些極其反直覺、極難看清的技術賭局上,馬斯克的直覺可能是世界最強的大腦之一。他大概有80%的機率是對的:比如「只做電腦視覺」「火箭可復用」「AlexNet是通往AGI的路徑」。今天回看,這些判斷都像常識。但在它們還是非共識的時候,敢重倉下注的人並不多。AI上也是一樣。2012年,AlexNet橫空出世,直接把深度學習從邊緣研究推向主舞台。那篇NIPS 2012論文證明,深而大的摺積神經網路,配合GPU和巨量資料,可以把圖像分類效果抬到一個此前難以想像的水平。這件事的重要性,今天人人都知道。但真正難的是在2012年、2013年那個節點即時看懂。因為在那之前,神經網路已經低迷了很多年。AlexNet不是簡單的精度提升,它幾乎相當於宣佈:算力、資料和深層網路的組合,可能會重寫整個AI路線。更關鍵的是,馬斯克顯然很早就把這件事和現實世界問題綁在了一起。他並不是停留在「這論文很重要」,而是迅速把視覺智能與自動駕駛聯絡起來。後來的Tesla路線,無論外界是否認可,核心都圍繞一個極強的前提展開:如果人類主要靠視覺駕駛,那麼機器也可能主要靠視覺學會駕駛。這種押注,後來一步步演化為Tesla更明確的camera-first路徑。再看2013年末的深度強化學習。2013年12月,DeepMind證明深度神經網路和強化學習結合後,可以直接從像素輸入學習控制策略。標題:Playing Atari with Deep Reinforcement Learning 連結:https://arxiv.org/abs/1312.5602此後,AI不再只是「看懂」世界,也開始顯露出「學會行動」的雛形。Google對這件事的反應非常快。2014年1月26日,Google確認收購DeepMind。從論文出現到收購確認,時間非常短。值得注意的是,馬斯克在那個階段已經成為OpenAI的共同創始人之一。所以,Shaun想證明的並不是「馬斯克總是對的」,而是每當重大、反直覺、未來性極強的技術拐點出現時,他往往能在多數人還沒反應過來之前,就先認出來,然後立刻下注。他很早看懂了AI,但也錯過了最關鍵的轉向講到這裡,必須把神話戳破一點。雖然馬斯克善於預測技術,但他也不是一路全對,他看懂了很多,但也確實錯過過一次關鍵轉向。這次轉向,就是語言模型。問題是,AI不是沿著單一主航道前進的。2017年,Google團隊提出Transformer。那篇《Attention Is All You Need》幾乎重寫了自然語言處理的底層架構:不再依賴RNN和CNN,而是用attention機制直接建模全域依賴,大幅提高了平行訓練效率,也打開了後來大語言模型爆發的技術通道。今天回頭看,這當然是一條通往大模型時代的總閘門。但馬斯克並沒有像對AlexNet、DeepMind那樣,在Transformer出現後立刻重排自己的AI優先順序。他在這一時期,階段性低估了語言路線成為AGI主入口的速度。真正的轉折點,在2022年11月30日。那一天,OpenAI正式發佈ChatGPT,這是一次把大模型能力首次大規模推向公眾的引爆點。三個月後,2023年3月9日,xAI成立;同年7月12日,馬斯克正式對外宣佈xAI,並強調這家公司將與X、Tesla等體系形成緊密協作,同時保持公司實體上的分離。這個時間差非常短,因此,更像是某個判斷在極短時間內被修正了。Shaun的推測是,ChatGPT讓馬斯克重新接受了一件事:語言也是通向AGI的可行路徑,而且不是補充路徑,而是必須補上的主路徑之一。這不是放棄視覺路線。恰恰相反,是把語言路線重新加回那張更大的技術藍圖裡。視覺負責接觸世界,語言負責抽象、壓縮、推理和泛化;機器人負責行動和反饋;平台負責資料分發與使用者介面;算力基礎設施負責把一切真正放大。xAI的成立,說明馬斯克終於接受,AGI不能只靠視覺體系推進。xAI也成了馬斯克技術版圖裡被補上的最後一塊關鍵拼圖,補上這塊之後,原來相互獨立的東西:X平台、Grok、Tesla視覺棧、Optimus、訓練叢集、現實世界資料,才開始有了被統一解釋的可能。xAI:算力在手,AI不愁現在把這個框架套到 xAI。外界覺得它最近很混亂:12位創始成員裡,過去一年走了超過一半;在程式碼能力與營收上,xAI目前落後Anthropic和OpenAI。很多人因此斷言xAI已經「追不上了」。但換個角度,Shaun認為:在xAI,算力(compute)才是馬斯克的最高優先順序,其次才是模型能力排名。而現在,xAI的算力已經進入「加速走向支配」的軌道。很多人會反對,比如說Google的資料中心硬體非常強:MEMS光開關、TPU等等。馬斯克自己也發過一條推文:可以具體解讀是:Google會擁有西方在地球上規模最大的算力;中國會成為地球上規模最大的算力;SpaceX 會成為太空裡規模最大的算力。但最終,太空會贏。關鍵在於:隨著Colossus 2的進展 + SpaceX對「軌道資料中心」的信心 + SpaceX在硬體執行上的能力,馬斯克把「算力」從xAI的最高優先順序裡「放下來了」,因為目前一切進展順利。於是,Shaun Maguire判斷:xAI現在的兩大優先順序變成了——模型,以及一個新優先順序:產品。Claude Code可以說是第一個真正意義上的AI產品。它之前的很多東西更像「介面」,真正的「產品」是超強後端 + 最簡前端。ChatGPT 也符合這個模式:突破級後端,通過一個提示詞(prompt)輸入框給到大眾。Claude Code的不同在於:它把模型變成了一個「整體大於部分之和」的系統。類比早期Google:最初的Google Search嚴格說也不是「產品」,而是一套天才級後端,外面套了一個白頁面 + 搜尋框。隨後,Google用 Android、Chrome、免費 Gmail、SSO、Docs、Drive 等把護城河一點點圍起來。Claude Code是AI從「強後端 + 提示詞介面」邁向「深度纏繞、粘性極強的產品體系」的第一步。因此,Shaun Maguire認為:算力走上正軌 + AI 產品在最近一個季度開始湧現,觸發了xAI的一次巨大優先順序重排。外界看著像亂,但就像2018年末的 Starlink,本質是轉向與聚焦。就像2018年「火箭復用已基本解決」,如今「算力也在滑翔路徑上」,接下來是模型 + 產品。馬斯克的AGI援軍,正在路上Google已27 歲,OpenAI已10 歲,Anthropic則有5歲多,而xAI 才3歲出頭。但如果xAI走的是另一條路呢?別人忙著做程式碼,馬斯克忙著搶算力;別人忙明年路線圖,馬斯克忙長期壁壘。未來幾年,xAI會有好幾支援軍:Starlink的自由現金流Starlink是最吸金的生意之一。相關業務「Direct to Cell」可能更強(已800萬活躍使用者)。Starlink + Direct to Cell 會成為SpaceX/xAI 的「現金牛業務」(像當年搜尋業務之於Google)。太空算力聽起來像科幻,但這就是未來。Shaun測算顯示,其營運利潤率略低於星鏈,但所處的卻可能是有史以來最大的市場。簡單說:造一顆3噸、100kW算力的衛星,成本低,回報高,最差也是下一個雲巨頭(30%利潤率,市場幾兆美元)。TerafabTesla+SpaceX+xAI剛宣佈的超級項目:每年生產 1 TW(兆瓦)晶片的垂直整合工廠。供應鏈自己掌握,就是一切。Tesla Optimus人形機器人加上觸覺和互動後,學習速度暴增。這是物理世界的強化學習。馬斯克最有條件完成「物理AI」的跳躍。此外,馬斯克非常專注,堪稱工作狂,不親眼所見,根本無法理解這種工作態度。他不是在工作,那是在玩命。他是首位將自己的作息調至「四星上將」等級的公司CEO,長期與一線員工並肩作戰,晝夜不歇。輿論操盤手想讓你們看到的只是紛擾與式微。但事實上,多條長達數十年的路線圖正在交匯,催生出前所未有的加速發展。太空、晶片、能源和AI,正在融合。在所有這些領域,馬斯克都是領軍人物。xAI將獲勝,還是大勝:勝利的規模將是空前的,甚至難以想像。但Sequoia合夥人Shaun Maguire不認為這會是零和博弈——我們所有人都將受益。這將是歷史上蛋糕做得最大的時刻。真正被低估的,是下一階段AI入口很多人以為,外界低估的是馬斯克的個人能力。今天討論xAI,但應當看到一個更大的問題:下一輪AI主導權,會不會從聊天機器人,轉向現實世界智能系統?如果答案是會,那麼舊規則已經開始失效了。過去兩年,行業最焦慮的問題是:誰的模型更強,誰的產品滲透更快,誰先吃掉搜尋、辦公、程式設計入口。接下來真正殘酷的問題可能變成:誰能把語言模型變成現實世界裡的感知器、控製器和執行器;誰能把數字智能變成物理智能的上游作業系統;誰能在模型之上,掌握更長的反饋鏈條。那時被改寫的可能不只是某個產品,或某家公司的估值,而是整個AI產業的分工方式。贏家未必是今天看上去最強的人。真正的競爭,也許才剛剛開始。 (新智元)
紅杉資本:2026,這就是 AGI
最近在用 OpenClaw 的時候,我在想一個問題:AGI 已經來了嗎?如果需要回答這個問題,可能還是要定義下什麼是 AGI。然而關於什麼是 AGI,眾說紛紜。比如最近,Google DeepMind 創始人提出了一個很有趣的 AGI 的定義:訓練一個 AI 模型,將它的知識庫截斷到只到 1911 年,如果它能夠像愛因斯坦獨立發現廣義相對論,那麼它就是 AGI。然而,專門訓練一個大模型來驗證一個人的觀點,即便對於Google來說,也未免太奢侈了。直到昨天,我在紅杉社區看到了一篇文章,我突然有個感受:也許 2026,AGI 已經來到了。原文:https://sequoiacap.com/article/2026-this-is-agi/幾年前,一些頂尖 AI 研究者告訴我們,他們的目標是通用人工智慧(AGI)。當時我們迫切想知道一個清晰的定義,便天真地問:“你們怎麼定義 AGI?”,他們頓了頓,猶豫地對視一眼,然後給出了後來在 AI 領域廣為流傳的一句話:“嗯,我們每個人都有自己的定義,但看到它時我們就會知道。”這一小插曲,正是我們探尋 AGI 具體定義時的典型縮影。這一目標一直沒有結果。雖然 AGI 的定義至今模糊不清,但現實已經毫無懸念:它就在這裡,此刻已然降臨。程式設計智能體是第一個例子。還有更多正在路上。Long-horizon agents,在功能意義上就是 AGI,2026 年將是它們的爆發之年。在繼續討論之前,我們得先明確一點:我們沒有足夠的道德權威來為 AGI 提出技術定義。我們是投資者,研究的是市場、創始人,以及這兩者碰撞孕育出的產物:企業。鑑於此,我們的定義是功能性的,而非技術性的。新的技術能力引出了唐·瓦倫丁的問題:那又怎樣?答案的關鍵在於其現實世界的影響力。通用人工智慧的功能定義AGI,就是能把事情搞明白的能力。就這樣。我們明白,這種模糊的定義解決不了任何哲學爭論。但從實用角度看,當你想做成一件事時,你到底需要什麼?不過是一個能自主解決問題的 AI 而已。至於它是怎麼做到的,遠不如“它能做到”這件事本身重要。一個能解決問題的人,通常具備三個核心能力:紮實的基礎知識儲備;基於這些知識進行推理的能力;以及通過反覆試錯找到答案的能力。能解決問題的 AI 具備三方面核心能力:一是基礎知識(預訓練),二是基於該知識進行推理的能力(推理計算),三是通過逐步迭代得出答案的能力(長程智能體)。第一個關鍵要素(知識/預訓練)正是 2022 年那個「ChatGPT 時刻」背後的驅動力。第二個要素(推理/推理時計算)隨 2024 年底 O1 模型的發佈登場。第三個要素(迭代/長程智能體)則在最近幾周浮出水面:Claude Code 等程式碼智能體已突破能力閾值。具有通用智能的人可以連續幾小時自主工作:他們會犯錯,也會自己修正,不用別人吩咐就能知道下一步該做什麼。現在,通用智能體也能做到這一點。這是前所未有的。什麼叫把事情想明白?一位創始人給他的 Agent 發消息:“我需要一個開發者關係負責人。一個技術能力足夠高、能贏得資深工程師尊重的人,但又真正喜歡用 Twitter 的人。我們向平台團隊銷售產品。去吧。”智能體的第一步操作很直接:在 LinkedIn 上搜尋 Datadog、Temporal、Langchain 等競爭對手公司的“開發者布道師”和“開發者關係”崗位。結果出來好幾百份簡歷,但光看職位頭銜根本分不清誰真的能勝任這份工作。它轉換了思路,開始關注真實表現而非資質:它會在 YouTube 上搜尋各類會議演講,找到 50 多位演講者後,再從中篩選出那些演講互動性強的人。智能體將這些演講者與 Twitter 帳號進行了交叉比對。其中一半人的帳號要麼長期不活躍,要麼只是轉發公司的部落格文章,顯然這些不是我們想要的類型。但有十幾個人擁有真正的粉絲群體:他們會發表真實觀點、回覆網友,還能吸引開發者互動,而且內容很有格調。智能體進一步縮小了篩選範圍,開始排查過去三個月發帖頻率下降的使用者。活躍度降低往往意味著員工對當前崗位的投入度在下降。最終,三個名字浮出了水面。智能體對這三位候選人做了背調:第一位剛官宣新職位,已經來不及了;第二位是一家剛融到資的公司創始人,顯然不會離開當前崗位;第三位是 D 輪公司的高級開發者關係負責人,他們公司剛裁了市場部。她最近分享的主題正好是這家初創公司瞄準的平台工程領域,推特上有 1.4 萬粉絲,發的梗圖還能吸引工程師互動,不過領英已經兩個月沒更新了。Agent 寫了一封郵件,內容提及了對方最近的演講,以及這家初創公司理想客戶畫像的契合點,還特別提到小團隊能帶來的創作自由。郵件提議進行一次輕鬆的交流,而非正式的推銷。總時長:31 分鐘。創始人並未在招聘網站發佈職位描述,而是已經鎖定了唯一的最終候選人。這才是解決問題的真諦,在模糊中摸索著達成目標:提出假設、驗證假設、碰壁、調整方向,直到找到突破口。智能體沒有按既定指令碼行事,它像頂尖招聘者那樣在腦海裡反覆推演,卻只用了 31 分鐘就不知疲倦地完成了全過程,而且沒人教過它該怎麼做。值得注意的是:智能體智能體仍然會犯錯,它們會產生幻覺、丟失上下文,有時甚至自信滿滿地走錯方向。但發展趨勢清晰可見,這些問題也越來越容易解決。走到今天,我們經歷了什麼?去年的文章裡,我們曾指出推理模型是 AI 領域最重要的新前沿。而長程智能體則通過讓模型採取行動並隨時間迭代,將這一範式向前推進了一步。想讓 AI 模型「思考」更久,可不是件簡單的事。基礎推理模型的「思考」時長通常只有幾秒到幾分鐘。目前有兩種技術路徑,看起來都表現出良好的效果和可擴展性:強化學習(reinforcement learning)和智能體框架(agent harnesses)。強化學習的思路是,在訓練過程中通過引導和督促,讓模型從根本上學會長時間保持專注、不偏離目標。而智能體框架則針對模型的已知短板:比如記憶交接、資訊壓縮等問題,搭建專門的支撐架構。強化學習的規模化研究,目前仍是各大實驗室的主攻方向。他們在這一領域成果斐然:從多智能體系統的突破,到 AI 工具的可靠應用,都取得了顯著進展。設計優秀的智能體應用框架是應用層的核心任務。如今市場上一些廣受歡迎的產品,正是憑藉其精心設計的智能體應用框架脫穎而出:比如 Manus、Claude Code、Factory 的 Droids 等。如果要押注一條指數增長曲線,長程智能體的性能曲線絕對是首選。METR 一直在持續密切跟蹤 AI 完成長程任務的能力:其進步速度呈指數級,每 7 個月就翻一倍。按照這個指數趨勢推算:到 2028 年,智能體將能可靠完成人類專家耗時一整天的任務;2034 年可完成耗時一年的任務;到 2037 年,甚至能完成耗時百年的任務。所以呢?很快你就能僱傭一個 AI 智能體了。這正是通用人工智慧的試金石之一。你現在就能「僱傭」 GPT-5.2、Claude、Grok 或 Gemini 了:醫療領域:OpenEvidence 的 Deep Consult 智能體可充當專科醫生法律領域:Harvey 的智能體能作為初級律師開展工作網路安全領域:XBOW 智能體扮演滲透測試員角色DevOps 領域:Traversal 的智能體充當站點可靠性工程師(SRE)GTM 領域:Day AI 智能體可同時擔任業務開發代表(BDR)、解決方案工程師(SE)及營收營運負責人招聘領域:Juicebox 智能體作為招聘專員數學領域:Harmonic 的 Aristotle 智能體充當數學家半導體設計領域:Ricursive 的智能體扮演晶片設計師角色AI 研究領域:GPT-5.2 和 Claude 可作為 AI 研究員從空談者到行動派:對創始人的啟示這對創始人來說意義深遠。2023 到 2024 年的 AI 應用都很會聊天,有些甚至是老練的對話高手!但它們的實際影響卻很有限。2026 和 2027 年的 AI 應用將不再是工具,而是實幹夥伴。它們會像同事一樣,和你並肩工作。使用頻率也會從一天幾次,變成全天無間斷,甚至多個 AI 實例同時運行。使用者不再是偶爾省幾個小時,而是徹底轉變角色:從獨立貢獻者變成 AI Agent 團隊的管理者。還記得之前大家熱議的“賣成果”嗎?現在這真的能實現了。長程智能體究竟能完成那些工作?它的能力與模型的單次前向傳播有天壤之別。在你的領域裡,這類智能體能夠解鎖那些新能力?那些任務需要持續投入,且瓶頸在於持久注意力?如何將這項工作產品化?隨著工作場景的使用者介面(UI)正從聊天機器人向智能體委託模式演進,你們領域內的應用介面又會發生怎樣的變化?你能否穩定完成這項工作?有沒有在「近乎偏執地」持續最佳化智能體框架?反饋閉環是否完善?這項服務該怎麼推廣出去?能不能圍繞價值和成果來定價和打包?準備出發!是時候把握長程智能體的指數級增長浪潮了。如今,你的 AI 智能體大概能穩定工作 30 分鐘左右。但用不了多久,它們就能完成一整天的工作量,最終甚至能承擔相當於一個世紀的工作任務。如果你的規劃能以百年為尺度,會帶來怎樣的改變?一百年,可以把那 20 萬份從未交叉驗證過的臨床試驗資料徹底打通;一百年,能把歷史上所有的客服工單都翻一遍,從中找出真正有價值的資訊;再用一百年,美國的稅法體系也能被梳理得邏輯清晰、條理分明。你之前那個看似遙不可及的路線圖,現在竟然變得切實可行了。 (特工宇宙)
紅杉重磅宣言:2026,AGI已至!
多年來,AGI(通用人工智慧)如同科幻迷霧中的海市蜃樓——頂尖研究者們對其定義各執一詞,甚至以「看到才知道」的模糊共識迴避爭論。然而,一場靜默的革命正在發生:長程智能體(Long-horizon Agents)的突破,讓AGI從哲學辯題落地為功能現實。多年前,一些頂尖研究者告訴紅杉,他們的目標是實現通用人工智慧(AGI)。當時,紅杉天真地問:「你們如何定義AGI?」他們停頓片刻,略帶猶豫地相視一眼,然後給出了一個後來幾乎成為AI領域某種信條的回答:「嗯,我們各自都有自己的定義,但等我們看到它時,自然會知道。」這就是大家對AGI具體定義的不懈追尋的見證之一。事實證明,這個定義確實難以捉摸。雖然定義難以明確,現實卻非如此。AGI已經到來,就在當下。編碼智能體是第一個例證。未來還會有更多。長遠規劃智能體在功能上已相當於AGI,而2026年將屬於它們。AGI不再是哲學辯論,而是你的「虛擬同事」矽谷AI初創公司創始人馬克自述他的經歷,曾經招聘一個人,需要發佈職位描述,篩選數百份簡歷,初篩50人,面試15人,最後發出offer。總共要耗時數周,成本上萬。如今只需要給智能體指令:「我需要一個懂Kubernetes、有開源貢獻、能在開發者社區建立影響力的工程總監」。智能體按分鐘推進:0-5分鐘:掃描GitHub,篩選5000+個Kubernetes相關倉庫,識別活躍貢獻者 。5-15分鐘:交叉驗證LinkedIn、技術部落格、會議演講記錄,篩掉那些殭屍帳號。15-25分鐘:分析推特互動質量,去掉以及只轉發僱主文章的人,識別真正有影響力的開發者。25-31分鐘:發現目標人選剛結束大廠項目,撰寫個性化邀約郵件。從接到需求到獲得精準候選名單,僅31分鐘。上述場景,來自紅杉發佈的部落格。文中用「能把事兒搞定」,來通過功能性重新定義了AGI,稱當下的長程智能體已跨過關鍵門檻;AI應用將從「對話者」升級為「執行者」,可以被視為AGI了。長程智能體的發展軌跡AGI的發展,有三個關鍵時刻。第一個是知識,源於預訓練,代表事件是2022年末發佈的ChatGPT。第二個是推理時計算,可以對應2024年OpenAI的o1及2025年初的DeepSeek R1。第三個關鍵點是迭代/長程智能體,其代表事件是在過去的幾周內,Claude Code和其他程式設計智能體跨越能力閾值。具有通用智能的人,能夠獨立工作數小時,自己犯錯後修正,並在無需被告知的情況下弄清楚下一步該做什麼。通用人工智慧也要能做到同樣的事情。圖1:不同歷史階段的人工智慧能夠完成的任務耗時2025年3月的一篇研究[2],發現了一個智能體領域的摩爾定律:在過去6年中,智能體能夠完成的任務時長,一直呈指數級增長,約每7個月翻一番。這可比摩爾定律的18個月翻一番快得多。這意味著智能體能力的增長,要遠快於硬體性能的增長。這裡的任務,涵蓋了軟體程式設計上的各類問題,相當廣泛,而上述結果不依賴於特定的資料集,其結論相當魯棒。根據這一趨勢預測,在未來不到十年內,我們將看到AI智能體能夠獨立完成當前需要人類花費數天或數周才能完成的軟體程式設計任務。在2025年3月,那時的大模型在人類完成時間少於4分鐘的任務上幾乎有100%的成功率,但在人類需要花費超過大約4小時的任務上,成功率低於10%。而按照歷史經驗外推,能以50%機率成功完成的多步任務數,大約每年增長1-4倍。如果過去6年測量的趨勢在未來2-4年內繼續,2028年智能體可完成人類專家一天工作量;到2030年,通用型自主智能體將能夠執行一系列為期一周的任務,而2037年或能處理需專家百年時間的任務。一個能夠替代人類專家終其一生才能解決問題的智能體,說什麼都該被視為通用人工智慧了。這就是紅杉這篇文章真正想說的。不必糾結通用智能的定義及其哲學爭論。只要能把事兒搞定,就是通用智能。這種強調結果的思考方式,更關注現實影響,無論是投資者,創業者還是打工人,都需要押注智能體能力的指數增長曲線,據此重估創業與商業機會。明白通用人工智慧打工人要轉變思路2023-2024年的AI應用多為「對話工具」,而2026年後,智能體將成為「虛擬員工」。醫學領域,OpenEvidence的深度諮詢功能可以進行醫療諮詢。在法律界,智能體Harvey可以擔任助理律師。即便是晶片設計,也有發表了AlphaChip的研究者創立了「Ricursive Intelligence」。2026年和2027年的AI應用將從對話者成為行動者。它們將像同事一樣存在。使用頻率將從每天幾次增加到全天候,同時運行多個實例。智能體將不止是讓使用者節省幾個小時,而是讓使用者角色從「個人貢獻者」轉為「管理一組智能體」。對於打工人來說,能夠完成長任務周期的智能體,其能力與大模型的單次呼叫有著本質的不同。每一個人都需要思考,在你的領域,長時程的智能體解鎖了那些新能力?那些任務需要持久的注意力,如今這些任務是時候外包給AI了。等到這些任務外包給AI之後,需要人來思考並回答下面三個問題1. 如何將AI自動化的工作產品化推廣出去?你能對此定價和包裝以創造價值嗎?2. 工作介面從聊天機器人發展到智能體,將在你的領域如何影響人機互作?3. 如何在智能體完成任務的過程中提供反饋,從而讓智能體能夠可靠而穩定地完成複雜任務,而非痴迷改進智能體的介面。此外,能完成長時間任務的智能體的出現,也會帶來更多的隱患。曾經大模型的安全,只需要考慮會不會回覆有害問題,而在連續工作幾個小時,去解決複雜問題的智能體上,就要小心智能體「刪庫跑路」,或者侵犯個人隱私,將人類世界的偏見引入等問題了。監管缺失也不容忽視,目前尚無法律定義「智能體作為員工」的權利義務。A呼叫B公司提供的智能體完成的特定任務,所引起的合同糾紛、責任認定等問題仍懸而未決。 (新智元)
紅杉坐鎮,900億IPO正式敲鐘
中國最大零食IPO。今日(1月28日),湖南鳴鳴很忙商業連鎖股份有限公司(簡稱:鳴鳴很忙)正式掛牌上市,成為港股“量販零食第一股”。本次IPO發行價每股236.6港元,公開發售獲認購超1500倍,開盤大漲88%,市值超900億港元,締造中國最大零食IPO。這是中國消費行業一個標誌性的整合案例。回想2023年11月,從湖南長沙起家的零食很忙與從江西宜春走出的趙一鳴零食完成戰略合併,共同組建“鳴鳴很忙”,由零食很忙創始人晏周出任新集團董事長。作為公司最大的外部機構股東,紅杉中國團隊見證了這家“國民零食”的成長軌跡。“鳴鳴很忙從社區煙火中讀懂了中國家庭最樸素的消費渴望——要的不是低價,而是‘值得’;追求的不僅是折扣,而是輕鬆感的日常小確幸。”紅杉中國合夥人蘇凱感慨,今日的IPO將是更宏大的起點。5年前,紅杉團隊出手締造市值900億從零食很忙的故事說起。時間回到2016年,湖南85後晏周已在房地產銷售行業深耕多年。一次偶然的機會,他敏銳捕捉到零食賽道在下沉市場的爆發潛力,毅然創立長沙零食很忙食品有限公司。次年,晏周與幾位合夥人共同籌資,在長沙一間不足40平方米的鋪面中,開設了零食很忙的首家門店。經歷創業初期的艱辛,品牌開放了加盟,隨後四年內迅猛擴張,門店數量突破450家,遍佈湖南大街小巷。一個關鍵身影在此間悄然浮現。大約2020年10月前後,紅杉中國團隊正系統性地掃描新消費領域中有特色、受消費者歡迎的品牌與業態,已在長沙開出多家門店的零食很忙,很快進入視野:門店形象清新明快,商品組合與營運策略令人眼前一亮;同時他們通過調研發現,品牌已在本地消費者中積累了不錯的口碑。“當時晏周還沒有對外融資。”紅杉中國合夥人蘇凱向投資界回憶當時景象,二人初次見面是在長沙一家酒店,這位創始人給人留下“清爽利落”的印象。交流中,晏周深入闡述了對當下家庭消費趨勢的洞察:零食如何成為習慣性消費,以及散裝零食市場的廣闊空間。這些細緻而精準的洞察,在日後公司發展中一一得到驗證。在蘇凱看來,晏周是一位不僅能深刻理解消費者,且更具“審美線上”和前瞻思維的零售創業者。可以說他為傳統已久的零食行業帶來了一種新的零售形態:一方面,通過標品折扣建立價格心智;另一方面,通過非標品零食創造差異化和情緒價值。當時零食很忙的每一家門店,都能通過裝修、營運、選品持續調動消費者的情緒,讓消費者逛零食店逛出“爽感”。更關鍵的是,零食很忙在門店體驗、商品組合與營運效率上,均顯著優於同類競爭者,成為一個極具吸引力的投資標的。2021年5月,零食很忙迎來關鍵轉折點——完成2.4億元A輪融資,由紅杉中國與高榕創投聯合領投,啟承資本、明越資本跟投。有了這筆投資,品牌開始高速向全國擴張,並很快與另一家迅猛生長的品牌——趙一鳴零食正面相遇。趙一鳴零食創始人趙定,安徽蕪湖人,早年經營多家休閒食品店,於2019年重新創業,以兒子之名創立品牌,寓意“像對待孩子一樣用心經營”。2020年,趙一鳴零食全面放開加盟。從江西宜春起步,趙一鳴零食快速拓店,很快與零食很忙形成競爭態勢。在戰況最激烈時,兩家門店常常比鄰而開,“有零食很忙處,必有趙一鳴”。直到2023年11月,這兩大零食頭部玩家宣佈戰略合併。根據招股書,在新成立的“鳴鳴很忙”中,晏周任集團董事長、執行董事兼總經理,直接持股25.75%,以及通過6個持股平台累計控制公司39.14%的投票權;趙定任副董事長、執行董事兼副總經理,通過上海鳥窩控制22.69%的投票權。今天,鳴鳴很忙成功登陸港交所,成就近年消費領域經典一幕:從激烈競爭到戰略合併,再到IPO上市。開出20000家店一個創投圈研究樣本透過招股書,鳴鳴很忙核心模式可概括為兩個關鍵詞:下沉、加盟。截至2025年9月30日,鳴鳴很忙門店總數達19517家,覆蓋全國28個省份及所有線級城市,其中約59%的門店紮根於縣城及鄉鎮。截至2025年11月末,鳴鳴很忙全國在營門店數達21041家。財務資料方面。2025年前三季度,鳴鳴很忙實現收入463.71億元,同比增長75.2%;經調整淨利潤18.10億元,同比大幅增長240.8%。2022年至2024年,公司收入從42.86億元升至393.44億元,同期經調整淨利潤從0.81億元增長至9.13億元,三年復合增速為234.6%。回顧鳴鳴很忙崛起的歷程,身後投資人留給外界深刻印象,集結了紅杉中國、黑蟻資本、五源資本、高榕創投、啟承資本等投資機構,以及好想你等零食巨頭。其中,紅杉中國是陪伴最久的投資方之一,並且由合夥人蘇凱和投資合夥人郭山汕聯合主導。自初次相識後,蘇凱便與晏周建立深厚信任,“紅杉中國在投後上有一個大原則,就是‘幫忙,不添亂’,而且在重大問題的決策上,往往站在公司這邊。”左起:鳴鳴很忙執行董事兼首席財務官王鈺潼、紅杉中國合夥人蘇凱、鳴鳴很忙董事長、執行董事兼總經理晏周在蘇凱記憶裡,當初在公司進行數位化轉型的時候,紅杉中國憑藉豐富的經驗提供了一些思路。隨著門店數量快速增長,傳統零售依賴人工經驗和局部最佳化的方式開始遇到明顯瓶頸。圍繞數位化議題,紅杉中國公司組織過數位化專題研討,介紹了一些成功實現數位化的企業與公司交流,並引入技術與AI領域的專家資源,與公司一起從真實業務場景出發拆解問題。他聊起了幾個例子:比如,針對非標小零食無法逐個掃碼、門店結賬效率受限等具體挑戰,雙方探討了通過視訊流識別“一盤貨”、實現快速結賬等基礎技術方案,從而明確數位化在提升零售效率中的實際落點。另外,在公司從采貨配貨發展到需要商品規劃的階段,量販式在發展初期,所有的店都賣同一套商品,門店的營運就是簡單的配貨。但當公司營運有幾千家甚至上萬家店的時候,面對不同地方的不同客群,就需要不同的商品結構,當時公司就面臨這樣一個重要轉型。“我們與公司管理層展開了系統的商品規劃討論,並且對接了許多業內專家來幫忙出謀劃策,覆蓋商品結構設計、上新節拍、毛利組合以及不同門店的差異化組態等具體問題。”至2025下半年,商品部在組織和職能上,開始真正轉變為“商品中心”,成為支撐規模化營運的重要中樞。更關鍵的是,在重大問題的決策上站在公司這一邊。2023年,當零食很忙和趙一鳴零食決定合併的時候,作為主要的機構股東,紅杉中國很快同意了方案,給公司投了一張重要的信任票,推動了兩家的順利合併。上市前,鳴鳴很忙創始人晏周對紅杉中國的長期支援表達了感謝。他頗為動情:“這份信任始於400家店的初期,經歷合併時堅定支援,再到今天戰略和治理的悉心幫扶。紅杉中國不像投資人,更像我們一個長期相伴的外部合夥人,關鍵節點的決策永遠是篤定地站在公司一側,沒有計算,沒有權衡,就是相信。”基於這樣的互信,紅杉中國蘇凱作為公司董事也多次受邀參與公司戰略研討會,持續為整合後的融合發展提供助力。IPO前,紅杉中國持股7.07%,為鳴鳴很忙最大外部機構股東。如此,又締造了創投圈一個創業者與投資人互相成就的典型案例。收穫季回顧過去一年消費上市潮,紅杉中國的身影尤為活躍。2025年2月,古茗登陸港交所。此前,古茗僅開放過一次外部融資,紅杉中國率先拿到了入場券。如今,公司市值已接近IPO首日的三倍。3月,紅杉中國以基石投資者的身份入股蜜雪冰城。幾天前,東鵬飲料港股上市的基石名單上也出現了其身影。這些只是紅杉中國重倉消費的冰山一角。從早期風險投資到跨境戰略併購,紅杉中國一直深耕在消費賽道:既投資了SHEIN、亞瑪芬體育、泡泡瑪特、卡游、喜茶等代表性企業,也通過收購整合了Marshall、Golden Goose等國際品牌,在全球消費版圖中扮演著獨特角色。開啟2026年,紅杉中國的IPO節奏依舊強悍——短短二十天內,已接連收穫五個超級IPO,堪稱“最忙IPO敲鐘VC”。更多IPO正在趕來:乳業龍頭“君樂寶”不久前剛向港交所遞交主機板上市申請,“杭州六小龍”的宇樹、雲深處紛紛啟動上市處理程序,還有機器人公司玖物智能等科技項目也在衝刺IPO的處理程序中。梳理這些IPO不難發現,紅杉中國往往是最早投進去的那一批投資人,並在企業成長中持續扮演關鍵角色,成為多家公司的最大機構股東。正是這一筆筆紮根產業的重倉,以及長情陪伴與深度賦能,他們才總能收穫時間的餽贈。歲末年初,創投圈或許又迎來一個好年份。回望過去一個週期,VC/PE經歷了漫長的冬天,而最近大家明顯感受到拐點的到來,密集發生的IPO敲鐘便是最生動寫照。正如一位見證數輪週期的創投大佬忍不住感慨:“今年,大家臉上的笑容明顯多了起來。” (投資界)
紅杉將巨資入股,Anthropic融資超250億美元,估值高達3500億美元
Anthropic本輪融資目標高達250億美元甚至更多,GIC和Coatue各領投15億美元,微軟和輝達承諾合計投資150億美元,其餘超過100億美元的資金缺口將由包括紅杉資本在內的風險投資機構和其他投資者填補。紅杉資本首次大舉投資這家OpenAI競對,標誌其AI賽道戰略轉向"全覆蓋"。 在人工智慧領域的資本競賽中,紅杉資本(Sequoia Capital)正打破常規,首次大舉注資OpenAI的主要競爭對手Anthropic。此舉不僅標誌著這家老牌風投策略的重大轉變,更助推Anthropic的新一輪融資規模邁向歷史性高點。1月18日,據英國金融時報消息,知情人士透露,Anthropic本輪融資目標高達250億美元甚至更多,由新加坡主權財富基金GIC和美國投資機構Coatue領投,雙方各出資15億美元。科技巨頭微軟和輝達承諾合計投資高達150億美元,而其餘超過100億美元的資金缺口將由包括紅杉資本在內的風險投資機構和其他投資者填補。這一巨額注資將使Anthropic的估值達到3500億美元,較四個月前的1700億美元實現翻倍增長。這一交易凸顯了頂級投資機構在人工智慧賽道上的“全覆蓋”策略,不再侷限於押注單一贏家。紅杉資本此前已投資OpenAI及Elon Musk旗下的xAI,如今加入Anthropic的投資者行列,顯示出市場對頭部AI模型廠商持續增長潛力的強烈信心。報導稱,儘管融資談判仍在進行中,最終數字可能發生變化,但預計交易將在未來幾周內完成。與此同時,Anthropic正積極籌備首次公開募股(IPO),可能最早於今年啟動。紅杉資本的策略轉向報導指出,知情人士稱,Anthropic尚未最終決定接納那些投資者進入本輪融資,具體的融資總額仍有變數,但交易預計將在未來幾周內敲定。據報導,紅杉資本此次擬議的投資,緊隨其去年底的高層人事變動之後。此前負責紅杉資本的Roelof Botha曾對向少數高估值初創企業集中投資持謹慎態度,並因錯過了Anthropic此前的幾輪融資而受到關注。Roelof Botha曾在去年的一次採訪中表示,風險投資並非一種資產類別,“向矽谷投入更多資金並不能產生更多偉大的公司”。然而,隨著Roelof Botha在去年11月離職,合夥人Pat Grady和Alfred Lin被推選為共同領導人,紅杉的投資風向顯然發生了變化。作為Google、蘋果、Airbnb和Stripe的早期投資者,紅杉此前已參投了OpenAI去年的融資輪次以及馬斯克旗下的xAI。報導指出,熟悉紅杉思路的人士表示,儘管風投公司通常避免在同一領域支援互為競爭對手的初創企業,但人工智慧帶來的巨大金融機遇改變了這一傳統邏輯。該人士稱:“這(Anthropic的交易)是一輪規模如此之大的融資,以至於它已經從風投投資轉變為股票投資。”紅杉方面持有大量OpenAI和xAI的股份,並堅信這並非一場贏者通吃的比賽,各家公司將擁有各自獨特的能力。業績爆發與IPO籌備Anthropic旗下擁有Claude聊天機器人,並因建構面向軟體工程師的AI工具而在市場中佔據了利潤豐厚的細分領域。該公司的收入增長迅猛,年化收入已從一年前的10億美元增長至如今的約100億美元,實現了10倍的增長。據彭博此前報導,隨著業務規模的快速擴張,Anthropic已開始為公開上市做準備,IPO可能最早於今年到來。公司已聘請律所Wilson Sonsini啟動籌備工作,並與銀行就公開上市進行了初步對話。不僅僅是Anthropic,包括OpenAI以及馬斯克旗下的SpaceX在內的科技獨角獸,也都在為公開募股奠定基礎。這些潛在的IPO項目一旦落地,有望躋身史上規模最大的公開募股行列。 (invest wallstreet)
10億,開年第一筆機器人融資,字節紅杉都出手了
網際網路大廠、頂級VC和地方政府抱團下注。投中網獨家獲悉,自變數機器人已於近期完成10億元A++輪融資。本輪融資由字節跳動、紅杉中國、深創投、北京資訊產業發展基金、南山戰新投、錫創投等頂級投資機構及多元地方平台聯合投資。除字節外,自變數此前也曾先後獲得美團、阿里的投資,由此成為國內唯一同時被這三家網際網路大廠投資的具身智能企業。阿里和美團,此前都押注了不少具身企業。在這輪投資競賽中,字節倒是鮮少出手,畢竟具身和機器人看起來跟字節的主業關聯沒那麼大,這個小背景也為此次出資增添了看點。再捋捋本輪的其他投資方。紅杉也出現在去年9月公佈的那輪A+輪投資人名單裡,所以,此次算是頂級VC二次出手自變數。有別於在AI上的高出手頻率,紅杉在具身和機器人賽道上頗為謹慎,宇樹和智元之外,兩次押注自變數足以說明對這家公司的看好。另一家頂級VC深創投,去年10月聯合匯通金控和深圳市引導基金,成立專門的人工智慧和具身機器人基金,目標規模20億元。出手自變數,是深創投AI基金成立以來的第一筆投資。此外,南山戰新投也出現在此前和本輪披露的投資方中,這是深圳南山區的戰略直投平台,主要投向戰略新興產業和未來產業。與此同時,自變數也吸引了來自其他地方政府的資金,比如,此前的北京機器人產業投資基金,這一輪的北京資訊產業發展基金以及錫創投。成立於2023年的北京資訊產業發展投資基金,是北京市政府主導設立的四大百億級產業投資基金之一。錫創投,則是無錫當地管理規模最大的國有創投平台。總之,網際網路大廠、頂級VC和地方政府抱團下注,一方面說明,資本市場對具身基礎模型重要性已經達成集體共識,另一方面,也印證了資本對自變數這家公司技術和發展潛力的認可。正如我們此前在《具身智能創始人,找我面試了》裡寫過的,當下具身企業已經出現分層,投資人更多是在已經上牌桌的那幾家裡選擇自己相信的創始人和技術路徑。話說回來,具身模型這個方向的創業和資本熱度,其實要比人形機器人來得稍晚一點。近兩年,隨著具身智能持續吸引市場目光,機器人的運動與控制能力取得顯著進步,行業競爭焦點逐漸從“肢體”轉向“大腦”。如何為機器人建構能理解物理世界、能操作、能靈活應對複雜多變場景的智能“大腦”,使其真正勝任多樣化的實際物理世界的工作,成為突破的關鍵。自變數機器人創立於2023年12月,是國內最早一批聚焦自研具身模型的創業公司之一。創始人兼CEO王潛,本碩畢業於清華大學,博士在美國南加州大學從事機器人學習、人機互動及家庭服務機器人等前沿研究。他還曾創立量化基金,希望用賺到的錢支援自己的機器人研究。直到AI浪潮起勢,2023年年底,王潛解散基金回國,創立自變數機器人。聯合創始人兼CTO王昊,為北京大學計算物理學博士,其學術研究橫跨物理、自然語言處理及人工智慧等多個領域。他曾在粵港澳大灣區數字經濟研究院(IDEA研究院)擔任大模型團隊演算法負責人。曾有投資人告訴我,如果把當下的具身創業團隊按背景劃分類別,自變數大體屬於偏AI大模型背景的團隊,在行業內並不多見,這樣的履歷和人才配置或許有助於探索出解決實際問題的技術範式。具身智能這兩年在資本市場熱度非凡,但無法否認,這還是一個新興的概念,尚無統一、明確的定義。不妨來看看自變數是怎麼定義的。在他們給出的解釋中,具身智能基礎模型是獨立於、平行於大語言模型、多模態模型等虛擬世界基礎模型的物理世界的基礎模型。劃重點,這個定義強調“獨立於”“平行於”,落點是“物理世界的基礎模型”。強調獨立地位,意味著這個領域有一套不同於大語言模型和多模態模型的規則和設計邏輯。這點倒是不難理解,機器人畢竟不是只負責聊天,而要在真實世界裡完成任務,因此純粹以語言為基底的設計邏輯與物理世界的實際互動規律可能存在隔閡。無論是李飛飛的“空間智能”,楊立昆的“世界模型”,還是黃仁勳的“物理AI”,大體指向的都是這一點。另外,基礎模型的核心目標,在於突破泛化性與通用性瓶頸,物理現實世界的複雜性要求機器人能夠具備即時處理非結構化、動態及隨機任務的能力,自變數的具身智能基礎模型以所有機器人的感知資訊(例如視覺、觸覺、語音等)為輸入,直接輸出機器人的動作、視覺,以及語言等。在此背景下,自變數自研的WALL-A的核心架構,深度融合了VLA與世界模型。WALL-A,首先是一個原生多模態輸入輸出架構,能夠實現具身多模態思維鏈。此外,WALL-A利用世界模型機制進行時空狀態預測,協同視覺因果推理理解環境反饋,並通過可學習記憶機制從資料中內化物理常識。這一融合機制,能夠顯著提升機器人執行非結構化環境中移動操作任務的零樣本泛化能力。當中的關鍵一環,基礎模型進化的燃料,是資料。都知道大語言模型性能快速提升依託的是scaling law法則,但大語言模型所需要的文字類資料可以從網際網路上直接獲得,具身智能模型所需的真實物理互動資料則較難收集。對此,全球科技精英們正在從資料、模型、算力等多個方面加快投入。自變數機器人創始人兼CEO王潛也表示:“具身智能的下一階段競爭,本質上還是資料閉環建構的基礎模型與模型進化能力的競爭”。在資料採集的方法上,行業內大體分成真機採集、模擬生成和視訊學習幾種派系。作為國內最早規模化擴展真機資料採集的公司之一,自變數自研了主從遙操、外骨骼、無本體等多種數采裝置,實現了各種數采裝置上的資料驗證和模型突破。自變數還搭建了模型驅動的資料管線,通過資料生成、資料過濾、資料增強、資料標註等環節持續產生規模化的高品質資料。理想狀態下,硬體-資料-模型可以實現閉環迭代。基礎模型能夠給資料處理和硬體設計等各個環節提供反饋,從而迭代更高品質的資料和更高效率的數采裝置,如此又進一步提升了基礎模型的效果。2025年9月,自變數還開源了其自研端到端具身基礎模型WALL-OSS,推動具身智能技術的開放普及。模型的進化,讓自變數的機器人在真實場景中展現出對環境的適應力。據自變數介紹,在跨越室外與室內場景的移動操作場景裡,比如在外賣配送與紙箱回收中,面對強風乾擾或視線遮擋,機器人不僅能像人類一樣腦補被遮擋物體的全貌,還能在遭遇卡頓時通過強化學習策略自主糾錯,無需人工干預即可完成閉環。這種適應力也體現在複雜困難的物流場景。面對堆疊混亂的包裹,機器人憑藉基礎模型的零樣本泛化能力識別異形件,並利用強化學習快速適應工作節拍。從模型演算法、資料驅動的需求出發,自變數也定義了機器人的硬體架構。在過去一年,自變數設計發佈了“量子一號”、“量子二號”兩款高性能的機器人本體,同步實現了機械臂、關節模組、動力驅動器、主控製器等核心零部件的全面自研與演算法深度適配。全端自研硬體促成了整機成本的大幅下降,為具身智慧型手機器人的規模化量產與商業化普及奠定了基礎。我瞭解到,自變數已逐步進入工業製造、物流和養老等多個場景之中探索商業化落地。剛剛喜迎新年,可以預見的是,今年具身和人形機器人的大額融資還會不斷刷新。去年年底,投中嘉川CV Source統計了具身智能在2025年的投融資資料,得出的結論是:前10家公司,拿下了40%的融資。巧的是,當時的統計結果中,拿到最多融資的正是自變數機器人。除去當前這一輪,在兩年的時間內,自變數已連續完成8輪融資。去年9月份的A+融資中,阿里雲、國科投資、國開金融、美團、君聯資本、紅杉中國等頂級機構聯手注資近10億元,直接將其去年的融資總額推高到數十億。資本市場的青睞,可見其技術實力和團隊進化能力。錢,正在流向不缺錢的頭部企業,這對於剩下的具身公司來說未必是個好消息。2026年,在階段性的demo秀之後,這個行業到底有多少泡沫和水分,也將進一步在真實的商業場景中進行驗證。在我們此前的交流中,有投資人認為,2026 年行業可能會慢慢進入交成績單的階段,PMF(產品市場匹配)會逐漸成型,真正有商業價值的訂單會慢慢湧現出來。 (投中網)
深圳硬體公司做AI陪伴機器人,拿下紅杉投資,使用者量破百萬
當一群大廠員工離開公司創業時,陪伴機器人還是個不太熱門的賽道,但是他們已經堅信這會是個百萬千萬級使用者的市場了。2018年,他們在深圳成立Enabot賦之科技。因為團隊中有不少養寵人士,出門在外的時候,又找不到一款滿意的寵物陪伴機器人,Enabot打算切入這個賽道。很快,感知演算法、多模態互動與室內導航技術迎來關鍵突破,Enabot團隊看到了將構想落地的清晰路徑。2019年12月,Enabot推出首款移動機器人產品EBO S,採用不倒翁式的圓潤造型,具備全屋移動監控功能,可以鑽進各種家具底尋找躲藏的寵物們。這款產品初期表現不錯,在海外眾籌平台籌得資金超過200萬元。但遠談不上是個爆款。正如輝達GPU誕生時,不可能知曉幾十年後會被大規模用在AI運算中。很多公司的轉折點來自意外。Enabot很快發現了奇特之處。這款最初定位為“寵物陪伴機器人”EBO S上市後,迅速被使用者挖掘出許多遠超預設的場景。獨居老人的子女通過它,得以遠端洞悉父母的生活狀況;面對咿呀學語階段最好動的小孩,EBO S化身“電子保姆”即時跟隨看護;異地情侶也可以用它達成遠端陪伴的效果。他們迅速做出反應,在寵物陪伴產品之外,也開始研發家庭機器人產品等,進一步聚焦老人、小孩陪護。Enabot家庭機器人產品EBO X(圖源/企業)截至2025年9月,Enabot全球使用者量已突破100萬,產品進入全球160多個國家和地區。在此之前,公司已獲得紅杉、龍湖資本、九合創投等頭部機構多輪融資。MarketsandMarkets預測,全球情感陪伴機器人規模或在2027年突破百億美元,年複合增長率超過17%;其中,具備移動能力與情感互動功能的品類將是增長最迅速的細分賽道。在這個重視情緒價值的年代,陪伴機器人或許會在人們生活中嵌入得更深。但也正因人類的情緒幽微多變,企業也需要更有敬畏心。從陪寵到陪人在陪伴機器人領域,寵物陪伴與人類陪伴的核心需求存在顯著差異。Enabot品牌負責人佟少楠告訴硬氪,寵物陪伴更聚焦 “看護 + 互動” 雙重訴求,而人類陪伴則側重情感共鳴與場景適配,因此,二者在相關產品的功能設計、使用者體驗最佳化與研發迭代上的方向也各有側重。從前,寵物陪伴場景中,使用者面臨的痛點包括遠端看護的視角侷限、單向互動等問題。儘管傳統監控裝置可以即時呈現寵物狀態,但其功能僅停留在觀察層面,無法主動發起與寵物的互動。而當寵物出現長時間靜止不動的情況時,對於“是否意味著健康出現問題”“獨自在家是否感到無聊”等不易察覺的隱性需求,傳統監控裝置也難以進行有效應對。機器人技術恰好解決了這個痛點。針對使用者因無法與寵物即時互動而產生的焦慮,Enabot在寵物陪伴機器人產品線中,基於其移動能力與感知系統,將雷射點、逗貓棒等寵物喜愛的互動模組融入機器人,開發了遠端操控觸碰、引導寵物活動等功能。即使使用者不在家,也可使用App遠端操控機器人主動與寵物互動。Enabot寵物陪伴機器人的遠端互動功能(圖源/企業)對比之下,人類陪伴場景中,產品設計邏輯發生了轉變,從解決功能性問題轉向滿足情感性需求。人類對陪伴的期待,遠不止於基礎的資訊傳遞或安防監控,而是渴望獲得真情實感、能引發共鳴的互動體驗。這就意味著,機器人必須具備更強的情緒感知與自然互動能力。“我們不僅需要通過語音、表情、對話內容建構真實的陪伴感,還必須考慮到使用者年齡跨度大的特點,確保操作足夠簡單,”佟少楠向硬氪解釋道,“任何複雜的學習過程都會破壞情感聯結的自然流暢。”在功能架構上,Enabot采了用“實用功能+情感陪伴”的設計方案,一方面通過自主移動與環境感知能力,提供安防巡視、事件提醒等實用功能;另一方面借助AI情感演算法與與擬人化互動,能夠識別使用者人臉定時發起提醒,提供娛樂內容、發起視訊通話,甚至通過與寵物互動來間接緩解使用者的焦慮。實用功能與情感陪伴兼具(圖源/企業)為了打破使用者對機器人 “移動監控” 的固有印象,Enabot著重強化了AI大模型的對話能力與角色豐富性,其家庭陪伴機器人產品搭載了多個大模型助手,可支援6大角色切換,並提供北京、河南、廣東等20余種方言與地方口音 。消費級陪伴機器人的演進遵循著明確的路線,然而,隨著市場迅猛增長,這個賽道還沒成熟就已經競爭白熱化。在Enabot團隊看來,這種情況下,企業更需在功能設計、形態結構與成本控制之間實現平衡,避免陷入同質化競爭。所以,Enabot的技術迭代相對理性,也沒有以堆疊很多AI功能為目標。“如果盲目引入AI技術、產品卻與使用者體驗脫節,導致互動生硬卡頓,這樣的品牌是難以同使用者建立情感共鳴的。”佟少楠表示。無論是解決寵物陪伴,還是追求實用與情感價值兼具的人類陪伴場景,Enabot的目標始終明確:在具體場景做細做深。這也代表了當今一部分硬體公司的突圍思路,將簡單的功能做透,而非追求大和全。Enabot機器人生產車間(圖源/企業)“電子分身”VS虛擬朋友後疫情時代的社會圖景中,“孤獨經濟”正以前所未有的態勢擴張。Statista調研資料顯示,全球超過60%的都市獨居者表示需要非人類陪伴體來緩解孤獨感。從獨居青年的生活陪伴,到空巢老人的健康守護,再到都市白領的情緒疏導,當線下互動變得不確定時,陪伴機器人成為一種新興的情感連接方式。有趣的是,當陪伴機器人進入到全球市場,迥異的文化背景,正塑造著多元使用者對陪伴機器人截然不同的需求與期待。比如在以中國為代表的東亞市場,陪伴機器人的定位遠超普通智能裝置,更被賦予“家庭情感紐帶”的深層期待。這種定位源於東亞社會獨特的家庭結構與情感模式。根據Enabot使用者調研畫像顯示,雙職工有娃家庭、異地親屬家庭等複合型家庭作為其核心使用者群體,他們對產品的核心訴求,是突破空間阻隔、能夠實現“遠端共在感”,完成細膩的情感表達。所以,Enabot設計了一些很有儀式感的功能。當異地家人過生日時,使用者可以遠端操控Enabot機器人眼燈播放圖片傳遞祝福;其自訂表情功能,還能用可愛的文字、動態圖案等與父母互動。這些頗具互動設計,精準契合了東亞社會中高頻、密集的家庭互動模式。歐美市場則呈現出截然不同的需求圖景,國外使用者更看重機器人的擬人化互動、情緒共鳴能力,並將其視為“電子寵物”或“虛擬朋友”。佟少楠告訴硬氪,歐美使用者更傾向於低侵入式陪伴、即有邊界感的接觸,他們希望感受到機器人的存在,卻不希望被頻繁的互動打擾。這種需求差異既源於對個人空間的重視,也與相對獨立的家庭結構相關。在實際使用場景中,Enabot機器人更像是一位“克制的智能管家”。在實用功能方面,它是一位可靠的機動保安;機器人可以在待機情況下監測環境變化,並在感知異常時提醒使用者、二次查驗等,有效改善了傳統固定監控裝置的被動查看屬性。在深度陪伴層面,使用者期待機器人不僅能記憶偏好、適應個性化交流節奏,更應成為可共同創作的夥伴,比如一起構思故事框架或協作設計簡易互動遊戲。與此同時,歐美使用者展現出鮮明的自主解決傾向。當裝置出現故障時,他們更傾向於讓機器人通過自診斷功能檢測問題並嘗試自主修復,僅將必要日誌上傳至指定平台。這種“最小化人工干預+閉環資料流轉”的模式,既滿足了使用者對產品獨立性營運的需求,也通過減少資料互動環節強化了隱私保護。Enabot產品在海外展會上(圖源/企業)陪伴機器人的本質,始終是“關係的具象化”。縱觀全球市場,它既承載著家庭情感的延續,也體現出對個人空間的尊重。這種差異背後,源於對使用者痛點的深刻理解。當前,行業正處在從“工具理性”向“情感價值”轉型的關鍵節點。陪伴機器人的發展已不再侷限於功能迭代或技術突破,而是轉向更深層的價值重構——如何讓科技更好地服務於人的情感需求,如何在人機共處中找到恰到好處的平衡點。在這個過程中,Enabot的迅速崛起印證了一條有效的發展路徑,從解決功能痛點、到滿足情感需求,那些能夠精準把握使用者真實需求的企業,將在未來的市場競爭中佔據先機。 (EDA365電子論壇)