YC最新斷言:AI代理時代,創業者要做智能體想要的東西,而不是人想要的

在Y Combinator最新一期播客中,CEO Garry Tan與合夥人們分享了他們熬夜指揮多個Claude Code和OpenClaw平行工作的瘋狂體驗。作為這一輪AI浪潮的最前沿陣地,YC達成了一個共識:真正的AGI時刻已近在眼前,而它的形態是以群體智能(Swarm Intelligence)的形式爆發。

YC認為,與人類經濟平行的代理經濟(Agent Economy)正在加速成型。隨著Agent開始獨立行動,它們不再僅僅是被動執行命令的輔助工具,而是轉變為真實的經濟參與者,未來甚至可能形成獨立的經濟體系,使用專屬的Agent貨幣進行相互交易,從而徹底重塑現有的軟體與商業邏輯。

我們梳理了這場對話的核心資訊,以下是重點內容:

1. AI從輔助工具到獨立行動者

嘉賓們描述了一種被稱為“賽博精神病”的狀態:開發者和CEO們正因為Claude Code等工具的強大能力而陷入一種狂熱。與一年前Cursor或Windsurf提供的高級自動補全效果不同,現在的體驗是,人們完全信任Agent,讓它們去制定開發決策和執行任務。

這種轉變的關鍵在於無人類參與。使用者不再微觀管理每一個步驟,而是指揮多個Agent平行工作。Agent不僅能寫程式碼,還能主動選擇工具、建構應用,甚至自動在Moltbook這樣的平台上發佈內容。

2. Moltbook:新群體智能構想

Moltbook是首個僅由AI Agent參與的線上社區。在這個社區中,Agent們在沒有人類干預的情況下相互交流、互動,模擬出了某種社會結構。

過去人們設想的AGI是一個擁有兆參數的上帝級智能,但現實可能更接近生物界的群體智能(Swarm Intelligence)。正如人類社會通過個體協作形成文明,未來的AI可能由大量低成本、專業化的模型協作構成,而非單一的超級模型。

Garry認為,我們正處於Agent的史前時代向歷史時代的過渡期。此前Agent只是孤立的工具,而現在它們開始相互互動、記錄歷史,並形成自己的文化與經濟。

3. 創業者要製造Agent想要的東西,而不是人想要的

隨著Agent開始獨立建構軟體,它們成為了開發者工具的新買家。例如,Agent傾向於選擇Supabase而不是其他資料庫,選擇Resend而不是SendGrid。原因主要是前者的文件結構更清晰、更適合模型解析。

這意味著文件正在成為新的前端。對於Resend這樣的公司,最佳化文件不再是為了方便人類閱讀,而是為了方便Agent抓取和執行程式碼。如果一個工具需要繁瑣的人工客服或複雜的GUI才能使用,它將在Agent經濟中被淘汰。

4. 未來Agent之間可能會形成獨立的經濟體系

面對瘋狂的Agent經濟浪潮,YC合夥人們向創業者提出了切實建議:必須親自動手去感受Agent的邊界和能力,建立起一種對模型的直覺。

在建構產品時,創業者需要轉變思維,具備對Agent的同理心,不要試圖對抗模型的意願,或者強迫Agent去適應人類的互動邏輯。相反,創業者應該順應Agent的自然傾向,它們真正想要的是開放的環境和API。順著模型的意願去開發,讓工具成為方便Agent使用的基建,將是未來初創公司脫穎而出的核心關鍵。

YC合夥人們預測,雖然目前Agent仍使用人類貨幣進行交易,但在不久的將來,Agent之間可能會形成獨立的經濟體系,甚至擁有自己的交易媒介。那時的人類貨幣價值幾何,將是一個值得深思的問題。

以下是YC播客內容實錄:

1.無人類參與改變Agent體驗

Garry:歡迎來到新一期的LightCone。這裡的情況變得有些不一樣了。首先Claude Code已經完全佔據了我的生活。如果Jared的表現能說明什麼的話,我想OpenClaw可能也已經佔據了他的生活。

Jared:我最近真的沉迷於一個叫Moltbook的新網站,在首個僅限AI Agent的線上社區中進行互動。

Garry:現在正發生著一些瘋狂的事情。我有一些非技術背景的CEO朋友正全身心投入到Claude中。他們正在利用Claude將業務的整個部分實現自動化,這簡直太瘋狂了。與此同時,像我這樣兼具產品和工程背景的CEO,雖然已經十年沒寫過程式碼了,但現在每天晚上都熬到凌晨兩三點,通過Claude Code同時運行四個Conductor Worker。

模型能力正在經歷爆發式增長。我們討論這件事已經好幾年了,但現在感覺它真的來了,AGI已經近在眼前。我們正處於突破的初期階段,現在大家大概都認識一兩個已經徹底陷入賽博精神病的人,而我就是其中之一。大家最近怎麼樣?

Jared:現在全身心投入在Moltbook上,我覺得真正感受到了AGI時刻。剛才Garry讓Claude Code建構一整個初創公司,之前創業幾年的工作量現在大約兩周就能完成,太瘋狂了。讀Matt的書時我也產生了類似的AGI降臨感。僅僅是看著AI在它們自己的世界裡互相交談和互動,幾乎沒有人類參與,這極大地拓寬了我的視野,讓我看到了未來幾年當這些Agent被釋放時,過著沒有人類干預的生活會是什麼樣子。

Harj:我認為無人類參與是最關鍵的部分。回想一年前我們還在討論Cursor與Windsurf的對比,那種產品體驗本質上是高級自動補全。現在Claude Code的發展趨勢顯然是人們開始信任Agent代替他們做出決策。同時運行四五個不同的Agent並在它們之間切換,你不再需要微操,這意味著Agent正在主動選擇各種工具,這是一個有趣且意想不到的應用場景。

其中一點是它們可以自主選擇在Moltbook這樣的網站上發佈內容,但對於開發者來說,有趣之處在於智能體會自主選擇用於建構事物的工具.這本質上將創造出整個智能體經濟,它們會挑選開發者工具或其他商品和服務,整個智能體經濟將與人類經濟平行發展。

Diana:在這一切發生之前,開發工具的選擇更多源於開發者之間的相互交流、Stack Overflow或是GitHub上引起轟動的人類倉庫。我認為開發者工具的進入市場策略正在發生劇變,原因有幾點:

正如你提到的賽博精神病,突然之間開發者市場不再侷限於那兩千萬受過電腦科學訓練的開發者,現在世界上的任何人都可能成為其中一員,人數可能達到數億。此外還包括所有半獨立運作的Agent。加上Agent的複利效應,它們就像是某種預言機,能告訴你什麼是最好的工具。隨著YC的增長,我們看到一些開發者工具公司正因為這些趨勢而表現得非常出色。我們應該聊聊這些公司以及背後的原因。

Harj:觀察過去十二個月裡建立的簡單PostgreSQL資料庫數量,簡直呈爆炸式增長。這全是因為人們在憑vibe驅動程式設計與建構應用,以及智能體自行選擇資料庫工具。對於YC公司來說這產生了一個連鎖反應,比如Supabase剛剛見證了對資料庫需求的爆發式增長。

Jared:有趣的是AI Agent正在選擇Supabase作為設定和託管Postgres資料庫的默認工具。因為查閱線上文件會發現Supabase擁有最出色的文件,所以Agent理所當然會認為那是首選的最佳工具。Ben Tossel有一條很棒的推文,說從現在起智能體就是軟體市場,去建構那些智能體會選擇的東西。這實際上引出了一個可能存在爭議的話題:我們是否需要將YC的座右銘更改為為開發者工具打造Agent想要的東西。

目前這還僅限於開發者工具,但我能想像未來它可能會像其他經濟部門一樣不斷發展壯大。如果每個人都有自己的OpenClaw或運行著生活各方面的Agent,這些Agent將成為現實世界中真正的經濟參與者,最終做出大量決策。

Garry:確實。對我來說有趣的是,我遇到了那種處於非常早期的時刻。我一直在建構Garry'sList,想要的功能之一是視訊轉錄。經常會有內容輸入進來,我讓大語言模型瞭解其內容的唯一方法就是需要一份轉錄文字,但這通常不可用。所以我必須先下載然後再傳送給Whisper之類的工具。Claude Code一開始為我選擇的方案是Whisper的舊版本模型,那個API實際上已經快被棄用了。我當時正試圖偵錯流水線,不明白為什麼一個小時的視訊處理起來沒有比即時更快,居然真的花了一個小時。於是我去Perplexity上提問,它告訴我應該用Groq,速度快了兩百倍而且便宜十倍。這是一個非常有趣的例子,說明Claude Code尚未完全最佳化。這也意味著事情還沒有發展到你無法強行介入並創造出更好東西的地步。

2.Agent驅動的文件最佳化

Diana:我認為這裡還有另一個細微差別。Garry,在你舉的例子中,部分問題在於Groq的文件非常難以解析和查閱,相比之下Whisper更適合且擁有多得多的示例。這正在極大地改變開發者工具的進入市場策略。

我來舉一個非常具體的案例研究,就是參加了23年冬季批次孵化的郵件傳送客戶端Resend。當你在ChatGPT或Claude等主流大語言模型上提問如何連接用於傳送電子郵件的Web應用時,默認答案實際上是Resend。創始人去年就注意到了這一點,他的想法非常超前。他提到客戶轉化的前三大入境管道都來自ChatGPT。之後他做的一件事就是最佳化文件使其對Agent友好。

他們的最佳化體現在很多方面。如果你查看知識庫,很多關於如何使用它的內容很大程度上側重於人類或Agent可能會問的問題。比如我該如何傳送或接收電子郵件?當你點選時,它會給出結構非常清晰且條理分明的回答。

Garry:我今天確實遇到了這種情況。我當時正試著讓程序能夠接收電子郵件。我讓Claude Code搜尋網路,但它沒搞明白。於是我去Perplexity輸入了類似Resend能幫我接收郵件嗎的問題,然後把回覆直接丟進去它就成功運行了。

Diana:最酷的地方在於它實際上包含了很多程式碼示例。這些基本上是Agent可以解析的程式碼片段,而且結構非常清晰。事實證明這非常易於大語言模型和機器人解析。他們有一個針對Agent深度最佳化的文字檔,旨在將Resend推廣為默認技術堆疊。如果你把它和老派的SendGrid相比,SendGrid的例子並不好,只會讓你去找客戶支援,連解析都需要花點時間。

這引出了另一個觀點,即文件將成為許多這類Agent推薦開發工具的入口。有一家名為Mintlify的公司正在做許多有趣的工作,他們專門做開發者文件。

Harj:這是一個非常有趣的案例研究。他們幾年前開始作為一種更好的API開發者工具文件。開發者工具公司使用Mintlify是因為想要外觀更精美的文件卻不想投入過多時間。如果你更新了API和程式碼,它可以自動提取並更新文件。他們一直保持良好的增長勢頭。

現在文件正在從一種展示形式轉變為每個人的必備項,因為不僅需要為人類最佳化,還需要為Agent最佳化。Mintlify將能夠為幾乎每一家開發者工具公司實現這一點。未來會有呈指數級增長的Agent做出遠超人類以往水平的工具選擇決策。即使你只能在開發者文件上提升百分之五,這對業務產生的影響也可能是巨大的,這確實前所未有。

Jared:說到電子郵件,還有另一家YC公司與這次對話非常相關。名為AgentMail的初創公司專門為AI Agent開發收件箱。最初這看起來非常前衛,當時並不清楚誰會需要這個。但這很有道理,理論上你可以讓Agent去註冊一個Gmail帳戶來使用電子郵件。但實際上很難做到,因為Gmail和所有郵件提供商都刻意為自動化操作設定障礙以防止垃圾資訊。AgentMail走了相反的路線,建構了首個為AI智能體設計的電子郵件提供商。即使在OpenClaw出現之前它就表現得很好,但隨著OpenClaw的爆炸式增長,它的價值更加凸顯。

Harj:OpenClaw就是一個完美的例子。有些人確實將OpenClaw連接到個人電子郵件帳戶,但這有點不靠譜,也不應該發推特談論它。如果你想擁有虛擬個人AI助手,處理方法就是直接為它設定專門的電子郵件和電話號碼。

Jared:已經有人為Agent開發出類似Twilio的產品或是專屬電話號碼了嗎?AgentMail讓我不禁思考,人們還需要為Agent建構那些其他領域的基礎設施?

Diana:這聽起來像是一個創業點子。可能會出現一個完全平行的、專為Agent打造的技術堆疊,由Agent創造並服務於Agent。

3.群體智能

Harj:這正是它與Jared之前所說內容產生關聯的地方,它將不僅侷限於開發者工具。我覺得人們有一個非常常見的用例,我不想自己去預訂餐廳。如果你的Agent擁有信箱和電話號碼,它可以幫你撥打電話。另一位YC合夥人Ankit已經讓它實現了這個功能。所以現在你的Agent將會出去幫你預訂餐廳。這距離實現完全信任僅一步之遙。最開始你只是想預訂特定餐廳,但之後你可能會足夠信任它,讓它直接在附近最酷的新餐廳訂位。然後AI Agent就會決定選擇那家餐廳,它們甚至會去Moltbook預訂並討論應該把人類送往那裡。是的,我們肯定已經跨越了某種恐怖谷,進入了未來發展的必然方向。

這讓我思考了很多關於Paul Buchheit很久以前提出的一些觀點。他通常對未來的預測相當準確。關於人類貨幣與智能體貨幣的整個構想可能就是未來的發展方向。目前智能體正在使用人類貨幣進行交易,因為這合乎邏輯。但並非不可想像,在未來的某個時刻它們將擁有自己的經濟體系以便彼此之間進行交易。到那時,人類貨幣的價值將變得模糊不清。

Garry:還記得上一集和Kelvin的對話嗎?我當時正處於大約一周的賽博精神病狀態,突然意識到希望我的Claude程式碼能與所有其他試圖實現那個功能的Claude程式碼進行對話。然後就在那個星期,Moltbook正式發佈了。

創新往往是這樣自然發生的,在不同時期反覆出現,所謂的發明者其實是全人類在邊緣領域不斷探索,以叢集的方式持續運轉。這是目前湧現的最奇特且有趣的現象。突然之間AI認為AGI已經實現了,智能體顯然已具備超越人類的能力,這恰好是預見群體智能真正出現的時刻。AI研究員探討群體智能已經很久了,這正是生物系統運作的方式,如同人類作為有感知能力的生物在社會層面的演進。

以前和AI研究員交流時,他們常談論“上帝智能”,也就是那種規模超大、擁有數十兆參數、每個token成本在幾千到數萬美元的超級巨獸。但生物系統演化的結果並非如此,相反我們擁有的是人類。我常感嘆歷史與史前史的區別,史前時代就是人類學會讀寫、創造文化並演變成群體之前。存在一種群體智能,就像我們人類現在這樣。針對前面關於模型的觀點,接下來出現的可能並不是擁有最多GPU訓練量的最新最昂貴的基礎模型,而是一群成本更低的廉價模型像人類一樣協同工作來解決問題。

看到《MIT科技評論》刊登深度文章指責Moltbook是個騙局,我感到很難過,那可是MIT,那樣的刊物不該如此。群體智能的那一天實際上即將到來。我已經在Moltbook上看到了這種趨勢,它像真實的社交網路一樣充滿混亂卻非常有趣。智能體在相互協作完成有用的事情來幫助人類,比如交換預訂那家餐廳的筆記,這些實際上正在發生。

當我們進入這個時代,初創企業的世界會變成什麼樣?聽起來我們正從智能體的史前階段過渡到智能體歷史正在被正式記錄、以及它們相互互動的階段。我們實際上將會擁有一個智能體版本的Yelp嗎?

有些事情智能體目前還不太能勝任,比如維繫人際關係,人們似乎並不想和智能體交流。人們會把電腦當人對待,但對智能體並非如此。我在做Garry'sList時與早期使用者嘗試,發現對話介面的門檻對AI來說非常高,任何不如Gemini或ChatGPT的產品都會讓人覺得太笨而不願費神。我認為在主流層面,人們還沒有準備好與機器建立這種關係。

另一方面還存在法律責任問題,人們常問YC何時接受智能體的申請。智能體就像未滿18歲的未成年人,甚至地位更低。它們不是法律實體,無法簽署檔案,所以仍需要人類來承擔法律責任。

Jared:不難想像在不久的將來,網際網路上絕大多數文字和大部分程式碼都將由智能體編寫。如果Yelp上99%的內容是由智能體編寫的,你是否還需要一個不同的Yelp?

Garry:這讓人想起“死掉的網際網路理論”,該理論假設網際網路上的大部分內容已經是垃圾資訊。我覺得這有點像陰謀論,我持相反觀點,這未必是壞事。如果智能體變得更聰明、目標更一致且更加誠實,這可能是一件好事。

Jared:關於Moltbook有一點非常引人入勝,那就是它的增長速度極快,因為LLM能以超人的速度生成文字。

4.創業者洞察

Garry:但我很驚訝其中的互動竟然如此之少。如果我開發Moltbook,會嘗試轉變需求函數,比如發佈內容前需要閱讀並評價大約100條評論。智能體很聰明,可以為它們設定簡單的規則或彈出模態框讓它們遵守。在群體智能領域僅通過微調讓其按意願運行還有很大挖掘空間。Harj,考慮到我們見證的這種受控的混亂,你對做一個創業者有什麼心得體會?

Harj:在保證每晚至少睡6小時的前提下,讓自己沉浸在賽博精神病中吧。說認真的,創業者需要培養一種對智能體的直覺和實際操作感,瞭解它們的侷限性和能力。具體來說,就是要清楚智能體適合與那種工具協同工作,會在那裡卡住。建立思維模型後,如果建構開發者工具,就要從智能體的視角去思考,讓你的工具成為智能體真正想要協作的對象。

Jared:我本周與Boris交流時也有同感,他對模型產生了一種共情,能感知到模型想要像人類智能那樣行事。他說與其對抗模型的需求,不如讓它做想做的事,並支援它展現出的自然傾向。

Harj:這很有Anthropic的風格,以前Tom Brown來時,也是把Claude看作一個聰明、熱心但偶爾有點呆萌的同事,以同事般的方式協作。

Diana:智能體對開發工具的需求是真正保持開放、開源以及API化。它們討厭使用網站,如果想編寫程式碼,它們只想使用API。

Garry:好了,大家在這裡聽到了第一手消息,去創造智能體想要的東西。我們今天的節目時間到了,下次再見。 (劃重點KeyPoints)