OpenAI董事長:太多AI應用是在表演!AI泡沫遠比想像更嚴重,會有人賠大本;應用不應追求AGI;微調或不再重要;支援抽成模式

“應用型 AI 公司不應該追求 AGI。”

“我們確實也處在一個泡沫期,會有人賠掉大量資金。”

“我們平台上的某個 agent,每生成一條回覆,背後可能會觸發 20 多次推理呼叫。”

上周,OpenAI 現任董事長、Sierra CEO  Bret Taylor 做客一檔播客欄目,期間的談活內容引起了業內的關注。

Bret 的經歷透露著一種技術人獨有的傳奇色彩,可以說是少數完整見證科技行業發展的資深人物之一。他早年是 Google 的工程師,之後創辦了社交網路 FriendFeed,並在 2009 年將其賣給 Facebook,隨後擔任 Facebook CTO。後來他創立了協作工具 Quip,並將其賣給 Salesforce,並一度做到了 Salesforce 聯席 CEO。

但現在,Bret 離職創辦了 Sierra(提供企業級對話式 AI Agent 平台)。這家公司在做這樣一件事情:重新定義企業如何利用 AI 提升客戶服務體驗。在此期間,他還曾擔任 Twitter 董事會主席,見證了馬斯克收購事件;在 OpenAI 經歷 CEO Sam Altman 被解僱又復職的風波後,他成為董事長。

這樣的的經歷,堪稱一種行業“沉浸式”觀察的第一人稱視角。

這次對話的背景是,Bret 的 Sierra 剛剛完成了新一輪融資,市值來到了 100 億美元。當然,還有一個故事背景:就是 GPT-5 的發佈近一個月,使用者的反饋從差評慢慢趨向於好轉。

所以,主持人 Alex Heath,重點問了 AI 應用和大模型這兩件事。

在AI應用方面,站在 AI 圈的核心,Bret 的視角反而沒有偏袒 AI 的炒作,對話中他在理性地思考AI產品即將帶來的二階、三階的影響和變化,並坦承現在市面上的 AI 產品更多是表演性項目。“要麼等,要麼自己做!”

我們現在可能還在馬斯洛需求層次的底層,很難想像到達“自我實現”的頂端是什麼樣子。

而對於模型技術方面,Bret 認為,Agent的技術秘方不在於自己預訓練一個模型,他們會微調多個模型。

系統裡有很多不同的模型,不是單一的供應商,也不是固定的參數規模,參數量只是衡量模型複雜度的指標之一。

此外,這次談話當然也繞不開聊到 OpenAI 以及整個 AI 行業的走向。他舉了幾個非常令人興奮的例子。其中,他特別提到了 WhatsApp 上的業務 Agent,以及駕駛途中的辦公 Agent.

比如在巴西,有人直接在 WhatsApp 上辦理抵押貸款。我問他在幹嘛,他就直接上傳 PDF 檔案。突然間,你會發現,如果未來每家公司都用會話式 agent 來做客戶服務。
那可能每家公司都會在 WhatsApp 上有一個業務入口,或者智能音箱可能會捲土重來。
想像一下,你在通勤途中,一邊駕駛,一邊通過個人 agent 整理郵件、對話交流,你的通勤時間一下子就變得超級高效。

“三年前,我心目中的 AGI 已經實現”,但是AI的泡沫要比麻省理工的那份研究報告實際上更嚴重些。

OpenAI的走向會通往那裡,是為AGI時代提供基礎設施,還是把大模型商業化?Bret 給出了堅定的答案:前者。

對於近日 GPT-5 發佈的爭議,他回應:絕對是質的飛躍。並表示,以後人們對“模型到底提升了多少”的感知,會越來越取決於他們要解決的問題的複雜度

提及大火的程式碼 Agent,Bret 指出,客戶其實真正需要的不是讓 Agent 幫我寫程式碼,而是解決方案。

……總之還有很多料,之類不再逐一展開了。

以下是 Alex Heath 和 Bret Taylor 的完整對話,enjoy:

01、OpenAI董事長下場做Agent前做什麼?

Alex Heath:

我想從 2023 年初說起。當時你剛離開 Salesforce,還是聯席 CEO。能聊聊當時決定創業的過程嗎?你是如何最終確定做 Sierra 的?

Bret Taylor:

我宣佈離開 Salesforce 的時間,正好和 ChatGPT 發佈幾乎是同一周。我不知道你相不相信“宇宙暗示”這種東西,但對我這種極客來說,用到這種產品的那一刻,我滿腦子都在想它。

說實話,我當時並不百分之百確定離開 Salesforce 後要做什麼。我只是想先離開,再慢慢思考人生方向。結果我立刻就沉迷進了這項技術。我自己在用它,[LinkedIn 聯合創始人] Reid Hoffman 也是我的朋友,他當時給我演示了 GPT-4 的早期版本。我完全被它展現出來的同理心和自然的人類表達震撼了。

我之前一直在關注 AI,但老實說,如果你在 2023 年 10 月讓我解釋“大語言模型”是什麼,我可能會一臉茫然。

後來我意識到,這項我其實沒跟得那麼緊的技術,真的要改變世界。我知道我必須在這個領域做點事情。雖然還不知道具體做什麼,但沒關係。這讓我想起當年第一次接觸網際網路的時候,直覺就是:它會改變一切。我想要在那個浪潮裡工作。

然後我和 Clay Bavor(我認識 20 年的老朋友)一起吃飯,本來沒打算和他一起創業,但在飯桌上我發現他也同樣痴迷。他當時還在 Google 給 Sundar Pichai 工作,結果一頓飯下來,多點了幾道菜,最後我們決定一起開公司。雖然完全不知道要做什麼,但基於一個前提:當科技發生地震式的變革時,商業機會會大量湧現,使用者需求、企業需求和軟體商的能力都會被重新洗牌。

就像網際網路出現後,造就了今天股市上最大的幾家公司,比如 Amazon 和 Google,同時也衝擊了微軟(不過微軟最終挺了過來)和 Siebel Systems(就沒那麼幸運)。這種“新貴 vs. 舊王者”的格局大洗牌,會打開巨大的市場。網際網路的典型市場是搜尋和電商,而大語言模型也會重塑無數市場,從軟體開發到客戶服務。

所以我們決定先休整幾個月,然後和大量潛在客戶聊,最終創辦了 Sierra。我們要做的是客戶體驗的 AI Agent。現在包括 ADT 家庭安防、紐約的 Ramp、SiriusXM 等公司都在用 Sierra 的 Agent 來接電話、處理線上對話,甚至幫使用者升級套餐或在警報響起時主動打電話通知你。這真的很令人興奮。

02、Agent的商業模式:按結果付費,佣金分成

Alex Heath:

跟我聊聊Sierra,以及你們是如何與新客戶進行實際合作的。請跟我講一下整個流程,因為這是一個非常新的領域。我的意思是,客戶支援本身並不新鮮,但你們的工作方式是全新的。那麼,與之前在其他公司的工作方式相比,你們與客戶合作的方式有什麼獨特之處呢?

我先從我們的商業模式開始,因為我認為這有助於回答你的問題。Sierra 與傳統軟體公司不同的一點是,我們只按結果收費。所以對於我們的大多數客戶來說,這意味著當 AI 代理自主解決客戶致電或聊天時提到的問題時,需要支付一定的費用。如果 AI 代理需要轉接給真人,則免費

Bret Taylor:

我們非常喜歡這種商業模式,而且我認為它將成為代理商的標準商業模式,因為“agent”(代理)一詞源於“agency”(代理機構),其原則本身就意味著一定程度的自主權。我認為大多數經驗豐富的代理商都會主動開始並完成一項任務,無論是為銷售團隊開發新的銷售線索,還是解決客戶服務諮詢,或是為反壟斷審查進行法律分析,無論它是什麼。

如果人工智慧代理不僅能幫助人們提高工作效率,還能真正完成任務,為什麼不直接為出色的工作付費呢?看看大多數公司,如果工作成果可衡量,比如銷售,你往往會支付佣金,對吧?這不僅僅是工資。所以我認為,讓代理按佣金獲得報酬,這不僅是供應商、合作夥伴和公司之間良好的激勵機制,而且從根本上來說也感覺很合理。這就是為什麼我認為它會像雲端軟體的出現一樣。當馬克·貝尼奧夫和帕克·哈里斯創立 Salesforce 時,它提供的是訂閱式服務,而不是永久授權,這改變了軟體的格局;同樣的道理也將發生在代理身上。

現在回到我們如何與客戶合作的問題,這引出了一個問題:如果只有當軟體運行良好時才能獲得報酬,那麼軟體供應商與公司之間的關係究竟是什麼?大多數軟體供應商與客戶之間都保持著一定程度的“保持距離”關係。如果你見過有人做過大型ERP實施,我對ERP系統瞭解不多,但顯然,它們很難執行,因為我遇到的每一個做過ERP實施的人,都比預期多花了兩年時間,花費也比預期多得多。

如果你去和參與某個項目的10000人交談,系統整合商會把矛頭指向軟體供應商,軟體供應商又會把矛頭指向系統整合商。沒有人真正指責公司,因為公司才是付帳的人。所以每個人都會說:“哦,你真棒。不,我肯定一切都好。” 這就好比成功有一千個父親,而失敗卻只有一個孩子。問題的一部分在於,在這種關係中,唯一關心結果的一方是公司。

所以每個人都在互相指責,這需要一位優秀的CIO或CTO來應對,但你可以看到其中存在著各種不正當的動機。也許合作夥伴是按小時收費的;這可不是什麼好的激勵機制。軟體供應商已經完成了銷售,所以祝你好運,希望你能夠成功部署。

我認為,走向基於結果的定價模式需要軟體公司與其合作公司之間的關係發生改變。我認為目前在人工智慧領域,這種模式很流行,部分原因就在於此。沒有那家軟體公司想成為一家專業服務公司。所以,你不可能把定價機制調到最高,然後就打造出一家我認為你想打造的公司。但這需要承擔不同程度的責任。

因此,在與客戶的關係中,我們真正關注的是幾個不同方面。一是產品的易用性。我認為,要實現目標,就需要讓實現目標的過程儘可能簡單。我們在市場上獨樹一幟,既有面向技術團隊的產品,也有面向營運團隊的產品。你無需任何技術知識即可組建代理團隊。同樣,我們正在努力賦能儘可能多的客戶體驗專業人士。在合作方面,我們在所謂的代理開發方面提供大量支援。如果你需要幫助來拓展代理團隊,我們會安排專車前往。這很獨特

我不確定一切最終會如何發展,但我非常認同這個願景。當我與客戶交談時,我很高興他們能夠清楚地瞭解我們為他們提供的價值,因為他們只有在客服人員工作時才需要付費。我非常喜歡這種簡單的關係,並且非常認同。

03、為什麼專注於大客戶?

Alex Heath:

這麼說,你們有數百個客戶,其中50%的客戶年收入超過10億美元,20%的客戶年收入超過100億美元。對嗎?

Bret Taylor:

是的。

Alex Heath:

為什麼要專注於這樣的客戶,而不是像 Shopify 那樣採取大規模的策略?你們為什麼要向大公司靠攏?

Bret Taylor:

大公司有大問題。我喜歡第一性原理思維,如果你是一個大型消費品牌,在全球擁有1億消費者,那麼在大型語言模型出現之前,你不可能與所有消費者進行對話。如果你算一下,呼叫中心有個術語叫“每次聯絡成本”,它本質上衡量的是接聽電話或回覆聊天所需的全部人力和技術成本。這實際上取決於對話的複雜程度以及接聽電話人員的資質。也取決於是在岸還是離岸。

但假設接電話的費用在10到20美元之間。對於大多數消費品牌來說,他們每使用者的平均收入甚至低於這通電話的費用。所以你根本負擔不起通話費用。這就是為什麼如果你曾經嘗試給任何消費品牌打電話,你都會發現你根本打不通。

很多網站都專門用來尋找許多消費品牌的電話號碼。這並不是因為他們不在乎你,只是不經濟。如果每個想給他們打電話的人都打給他們,他們就會倒閉,這對你來說可能也不好。現在有了大型語言模型,情況就完全不同了。你把電話成本降低了兩個數量級,而不是一個數量級,突然之間,通話的經濟效益就發生了巨大的變化。

因此,我們之所以追求更大的企業品牌,是因為客戶體驗中這種階躍式的功能與擁有數千萬甚至數億客戶的公司息息相關。這些公司是世界上規模最大的公司。真正令人興奮的是,我認為很多人在考慮用於客戶體驗的人工智慧客服時,會想到聯絡中心自動化,而這才是其中很重要的一部分。

但如果你從我剛才說的角度來思考,你會發現,現在你與客戶的對話次數比以前多了一到兩個數量級,而成本卻保持不變。這真的非常了不起。想想所有競爭的公司,比如手機公司,都在爭奪一個固定的客戶群體,而這些客戶都在努力決定與那家公司合作。如果你能將客戶關注度提高100個基點,那就意義重大。如果你能將客戶流失率降低500個基點,那就能改變公司的終身價值方程

所以我認為人們正在考慮這個問題。我認為這實際上是降低電話成本的首要效應,這很棒;你可以省下這筆錢,並將其返還給股東。但我認為更成熟的公司會問:“我真的能獲得市場份額嗎?” 這真的非常令人興奮,而這正是我們正在努力為世界上一些最大的品牌實現的目標。

04、無需人工介入的聊天機器人

Alex Heath:

你們現在有沒有客服人員在無需人工參與的情況下為客戶做事?我指的是超越聊天機器人的客服人員,他們做的事情實際上與經濟掛鉤,或者說,那些你以為會有人參與但實際上並沒有人參與的事情。現在有這方面的例子嗎?

Bret Taylor:

我舉幾個例子。我們有一些零售商,你可以提交受損商品的照片,並立即裁定保修索賠,系統會連接到庫存系統並給您寄送新產品。你還可以通過我們平台上端到端的人工智慧代理為您的房屋進行再融資。

Alex Heath:

無需人工介入?

Bret Taylor:

無需人工介入。這些代理在處理各種任務方面非常出色,你可以使用基於 Sierra 平台建構的代理來採取行動——我們 100% 的客戶都在這樣做。某種程度上,人工智慧中存在一種叫做檢索增強生成(retrieval augmented generation)的技術,這是一種更貼切的說法,它就是在回答問題。事實證明,這在目前已經成為一種商品。將 ChatGPT 與知識庫整合起來並不難。如今大多數工程師可以在一個周末內完成,這真是令人難以置信。三年前這還是科幻小說;現在卻是一個周末就能完成的項目。歡迎來到科技世界。它令人驚嘆。

其實,把複雜的監管流程加上精密的護欄……這是一個很大的挑戰。我們服務的行業包括健康保險支付方、醫療服務提供者、銀行、財產和意外險公司。如果談到理賠處理這種高度監管的複雜對話,它絕對不是“檢索增強生成”(RAG)能解決的。這是帶有合規審查的複雜互動。那你怎麼用 AI 護欄來保證?又怎麼用確定性規則的護欄來保證?你還得解決一些很瑣碎但極難的問題,比如在 40 多種語言裡的轉錄精準性。

如果轉錄系統漏掉了一個“and” 或 “or”,其實無傷大雅;但如果漏掉的是你的帳號,那就大問題了。所以難點在這裡。我們做過道路救援的項目,結果發現一個細節:如果你在和 AI agent 對話時,旁邊突然有汽車喇叭聲,它經常會停止說話,因為它會誤以為你在打斷它。它根本分不清這是汽車鳴笛還是你在說話。

我們的平台就是為解決這些問題而設計的:有效的護欄、多語言的文字與語音對話、確定性護欄、AI 驅動的護欄(我們稱之為“監督模型”),這些都非常有效且有趣。還有一些看似簡單的能力,比如能區分“那只是電視的背景音,沒有人在說話”,或者“那只是汽車喇叭聲,不代表有人打斷我”。這些在三四年後可能會變得容易,但現在非常困難,也正因如此,我們的產品才有很大需求。

05、語音賽道:從上網站變成了打電話

Alex Heath:

我很高興你提到語音。我也很好奇,除了聊天之外,語音會如何進入這個領域?你覺得語音會不會比文字更重要?

我認為會的。語音已經在我們的平台裡佔比超過文字了,這其實挺驚人,因為我們去年 11 月才推出。我覺得原因有幾個。首先,從人的角度來看,如果你看未來電腦的電影,或者科幻小說對未來的想像,幾乎都是通過對話與電腦交流的。我認為語音是最符合人體工學的介面。人人天生都會說話,不需要學習。它的摩擦成本極低,幾乎人人都能使用。我們常說“數字鴻溝”,如果未來大部分的數字互動都可以通過說話完成,這將極大提升普惠性,尤其是在多語言和耐心的語音系統支援下。

如果你看電信行業、健康保險行業,很多客服依然依賴電話。不只是患者或消費者,服務提供方和支付方之間也還是靠電話。AI 做的事情,是第一次把這個最古老的模擬管道——公共電話交換網,真正變成了數位化。過去幾乎每家公司都有一個“數字自助服務團隊”,說白了就是希望你上網站辦事而不是打電話。這樣對你更快,對他們更省錢。公司還專門組建團隊去推動這個。現在情況卻變成了:也許你直接打電話吧,沒關係,因為同一個 AI agent 在接聽電話,也在網站上服務你。這聽起來有點瘋狂。

你可以把它類比為 TCP/IP : TCP 運行在 IP 協議上。我們其實是把網際網路“放進了電話”,讓電話第一次成為數位技術的一個通道。因此,從創業角度看,有句老話:要做“止痛藥”,而不是“維生素”。因為人們一定會買止痛藥,但維生素只是錦上添花。

這就是一個真正的“止痛藥”。電話管道是最昂貴、最繁瑣的管道,而且大家都討厭它。即使你遇到史上最好的客服代表,你通常也是在等待了十分鐘之後才和他講話。因為讓呼叫中心做到“客戶永遠不用等待”在經濟上根本不可持續。

所以電話現狀是一個所有人都討厭的局面:消費者討厭,公司討厭,沒有人會替它辯護。而現在這項技術可以直接解決這個問題。這就是我為什麼認為它會產生巨大影響。

但展望未來,局面其實還不確定。即便我身處 AI 領域的核心,也無法精準預測世界將走向那裡。但我覺得這是極其令人興奮的。如果你看看 WhatsApp 在巴西和印度的使用方式,就會想:也許這種會話式互動會在其他市場同樣無處不在。

我大概四年前去巴西時就被震驚了,有人直接在 WhatsApp 上辦理抵押貸款。我問他在幹嘛,他就直接上傳 PDF 檔案。突然間,你會發現,如果未來每家公司都用會話式 agent 來做客戶服務,那可能每家公司都會在 WhatsApp 上有一個業務入口,或者智能音箱可能會捲土重來

我會想到每天開車上班時用 CarPlay。我很喜歡這個產品的很多地方,但它其實什麼都做不了。想像一下,你在通勤途中,一邊駕駛,一邊通過個人 agent 整理郵件、對話交流,你的通勤時間一下子就變得超級高效。這就像在車裡和一個“無所不知的私人助理博士”聊天,挺酷的。我覺得這是令人興奮的方向。我們一直談論手機,因為它的經濟影響力巨大。而現在,我們正在讓電腦“變得可對話”,我認為這既是一種使用者介面的變革,也是一種技術層面的變革。而且,我從未覺得這種體驗是被強行推銷給我的。

前幾天我拿著手機打電話——就像這樣(對線上觀眾,我現在把手機貼在臉側)。在此之前,我一直覺得這是很正常的做法。但我的孩子說:“你居然把手機貼在臉上?”那種語氣,就好像我在舔手機一樣。小孩子們打電話的方式完全不一樣。我從沒覺得自己這種方式奇怪,直到那一刻。然後我心裡冒出一句:“天啊,我真老了。”

你會意識到,孩子們在完全不同的技術環境中長大,從來沒見過撥號電話。他們和技術的互動方式天然不同。如今的年輕人會在一個理所當然的世界里長大:當然電腦能理解我說話裡的細微差別和諷刺語氣,當然我有一個個人 AI agent,能替我做下一次旅行的研究。

我覺得我們甚至還沒想清楚這種代際差異帶來的二級、三級影響。就像我孩子覺得我把手機貼在臉邊很奇怪,這仍然讓我很費解。但我相信,我們正站在一個極其重大的趨勢起點。某種程度上我很樂觀,儘管我和許多人一樣,也讀過《焦慮的一代》(The Anxious Generation),我自己也會因為盯著口袋裡那塊發光的螢幕而有點上癮。你會想,如果快進四五年,軟體會不會“融化”進背景中?很多繁瑣的事——比如等待接通電話、找不到客服電話號碼——會不會被這類技術徹底解決?

那時可能會是這樣的:“隨時打給我們吧。” 系統會知道我所有的情況:如果我在地鐵上,不想讓別人聽到,就通過文字聊天;如果我手上拿著東西,就選擇語音。這一切都會自動可用。

所以我對這一趨勢很興奮。就像所有的技術演進一樣,我們現在可能還在馬斯洛需求層次的底層,很難想像到達“自我實現”的頂端是什麼樣子。但我相信我們會很快走到那一步。我們在 Sierra 的願景,是幫助世界上每一家公司應對這種轉變。

第一步是為客戶創造一種卓越的服務體驗,讓他們感到被尊重、被重視,而且是個性化的。

第二步是讓公司能夠應對未來的不確定性。比如,會話式商業意味著什麼?當人們在 OpenAI 上做消費研究而不是用搜尋引擎時,這意味著什麼?

我相信很多人已經這樣做過了。比如你拿到一份實驗室檢查結果,我會第一時間把它上傳到 ChatGPT,在和醫生交談之前先看看結果。我不知道醫生對此會作何感想,但我敢保證,他的其他病人 100% 也在這麼做。整個世界都在改變。所以我們在 Sierra 想的很多問題就是:如何幫助每一家公司在這種新世界裡獲得成功。

06、Agent真正的技術秘方,不在於預訓練

Alex Heath:

從技術層面來說,你們會自己開發模型嗎?你們真正的技術“秘方”是什麼?是模型,還是別的東西?

Bret Taylor:

我們做了很多微調,但我們不會自己預訓練模型我認為大多數應用型 AI 公司都不該做預訓練。模型是一種快速升值的資產,但投入巨大,對股東來說回報未必可觀,同時也極其複雜。比如我們平台上的某個 agent,要生成一條回覆,背後可能會觸發 20 多次推理呼叫。這能讓你體會到複雜度:系統裡有很多不同的模型,不是單一的供應商,也不是固定的參數規模(參數量只是衡量模型複雜度的指標之一)。

我覺得應用型 AI 公司未來的走向,就有點像當年大家在問:“資料應該怎麼儲存?” 對在座的技術人員來說,市面上有數以萬計的資料庫和儲存系統,從 Snowflake、Databricks 到傳統事務型資料庫。今天,一個現代的技術人已經會根據具體場景來選擇最合適的工具。

應用型 AI 的發展方向也是這樣,不是通用人工智慧(AGI),而是把模型當作真正的基礎設施。有時你需要最快的,有時你需要最便宜的,有時你需要最優質的。這個價格、性能、延遲的選擇矩陣裡,總能找到對應業務需求的選項。

我認為它最終會變得像資料庫市場一樣。真正的實踐者是建構這些 agent 和應用的開發者,而不是那些懂得如何預訓練模型的研究員。我的直覺是,隨著上下文窗口不斷增大、模型對規則的遵循能力增強,連微調的重要性都會逐漸下降。未來,基於模型建構應用的門檻,可能就像今天“你懂怎麼用資料庫嗎?”而不是“你懂怎麼寫資料庫嗎?”。這兩種技能完全不同,而應用型 AI 正在走向這種格局。

07、GPT-5絕對是質的飛躍

Alex Heath:

我們在 GPT-5 發佈時看到,模型確實還在變好,但性能提升不像以前那樣“跨越式”了。也許隨著領域加速會有所不同?

Bret Taylor:

我不完全同意你的說法,不過我打斷你了,你先把問題說完。

Alex Heath:

你當然不該同意,你還是 OpenAI 的董事呢(笑)。不過我的意思是,你是否認同這樣一個觀點:模型本身正在逐漸商品化?你之前也把它們稱為“基礎設施”。如果這是真的,二階效應會是什麼?是不是意味著模型最終會變成“即插即用”,

當然會有一些差異化特性,但不像過去那樣帶來劇烈的性能飛躍?

Bret Taylor:

我剛才不同意,其實不是因為我“護 OpenAI”,雖然我確實是(笑),而是因為我覺得這很依賴具體任務。比如,如果有人用過 GPT-4.0 或 4.1 來寫程式碼,然後換成 GPT-5,你會看到性能上非常明顯的躍升。

所以從編碼這個任務的角度看,它絕對是一個跨越式的改進。對於正在建構編碼 agent 的人來說,你剛才的說法並不成立,GPT-5 確實是質的飛躍。今年我還用 ChatGPT(4)幫我計畫了一次假期,體驗挺好。如果換成 GPT-5,結果可能就是“嗯,好吧,好像更好一點”,但我本來就過了個很棒的假期,所以也許我的期望沒那麼高。也可能結果會好很多。

我覺得我們正在進入這樣一個階段:對很多任務來說,模型的智能已經“夠用”了。所以新模型出來時,如果你衡量的標準是“幫我規劃假期”,你會覺得提升不大。但如果是做藥物研發、發現新的療法,或者要自主編寫複雜軟體,或處理複雜的非同步 agent 任務,那你對“跨越式改進”的感受就完全不同。

所以我的直覺是——僅代表我個人,人們對“模型到底提升了多少”的感知,會越來越取決於他們要解決的問題的複雜度

Bret Taylor:

如果你想想建構通用人工智慧(AGI)意味著什麼,其實我們還需要更多進步。OpenAI 的一位研究員 [Sebastien Bubeck] 在 X 上發了一條很有意思的帖子,他給模型一篇數學論文,模型居然提出了一種相對新穎的解法,涉及一種我完全不懂的數學分支。這已經超出了我能評價的範圍,但它真的很有趣,很有創造性,甚至有點像 AlphaGo 那種“啊哈時刻”——居然能推匯出一種全新的數學思路。

毫無疑問,如果我們要走到能自主推進 AI 研究、發現新藥療法、解決一些懸而未決的數學難題的階段,還需要大量工作。我們還沒到那一步。

但我猜你的評論可能是出於另一種動機:在很多任務上,這些模型已經足夠用了。回到你的問題,這意味著什麼?我認為 OpenAI 是一個使命驅動型公司。我們的使命是確保通用人工智慧造福全人類,我們要朝著有益的 AGI 努力,但我們還沒達到。我們需要持續推進研發。某些方面它們已經“超智能”了,但更多方面還遠遠不夠。這正是我們努力的方向。

這是不是意味著對 Sierra 要解決的任務,或者在你個人生活裡要做的事,我們需要那種超強大的模型?未必。我覺得最終會形成一個多模型的生態,每個模型都有它最合適的用武之地。但讓我興奮的是,就在舊金山這片土地上,我們還沒走到終點。我們要創造 AGI,這本身就足夠讓人激動。

儘管有人覺得模型的進步速度在放緩,但我不太認同。從一些真正的研究突破來看,比如數學奧賽的成績,這是之前的模型完全無法達到的全新高度,我認為這非常令人振奮。

08、三年前我心中的AGI已經實現了

Alex Heath:

既然你提到了 AGI,我越來越覺得沒人能真正說清楚 AGI 的定義。但作為 OpenAI 的董事長,你對 AGI 的理解就顯得尤為重要。我很想知道你認為 AGI 的含義是什麼?過去一年裡你的看法有變化嗎?你有沒有一個明確的判斷:當我們達到某個標準時,AGI 就算實現了?

Bret Taylor:

先回答最後一個問題:有變化。三年前我心目中的 AGI,現在其實已經實現了。事實上,我覺得全世界絕大多數人在三年前設想的 AGI,現在都已經出現了。比如圖靈測試。說實話我不記得論文裡的原始定義是什麼,但在電腦科學課上,它被教作:與 AI 對話時,它的回答和人類幾乎無法區分。這個關口我們早就跨過了。圖靈測試曾經在 AI 領域非常重要,但我們已經超越它好多年了。坦率地講,那是這位史上最聰明的電腦科學家提出的一個糟糕主意。

我們不斷“移動球門線”,因為技術一次次超出了我們的預期。很多我們直覺認為的“AGI”,早就被突破了四五次。我現在的理解(以後可能還會變)是:在數位技術與思想的領域,這些模型是否在大多數領域已經達到或超越了人類智能?我特別強調“數字與思想領域”,因為比如發明一種新數學,這是很多人認為屬於 AGI 或超智能的範疇;但與物理世界互動則是另一回事,那與智能本身無關。比如你可以發明一種新療法,但臨床試驗完全是另一套流程。所以我在意的,是衡量“智能”這一部分。

AGI 中另一個字母 G 代表“通用性”。我和很多研究人員討論過,有些人認為如果一個模型在數學上表現極佳,它也會在很多其他任務上也會表現出色,因為數學是推理的基礎。但也有人懷疑,它能不能遷移到生物學等完全不同的領域?

我更傾向於認為,如果某項能力(比如數學奧賽水平)不是專門訓練的,而是模型整體能力的副產品,那它就具備良好的泛化性。但我們還需要觀察,看看它是否真的能遷移到科學的其他分支。不過就進展速度和研究成果來看,我越來越樂觀。我甚至期待第一項真正由 AGI 主導的科學突破。我覺得可能就在未來幾年,雖然說不準,但感覺很快就會發生。當然,這個問題更該去問 OpenAI 的研究員。不過從一些早期跡象來看,它真的越來越可能。

09、超級智能是“換口號”

Alex Heath:

為什麼像你之前的老闆 Mark Zuckerberg 這樣的人,現在在談論“超級智能”?這裡矽谷和舊金山到處都在說這個詞。是不是因為大家覺得,“圖靈測試過了,那我們干脆升級個名號”?

Bret Taylor:

(笑)是的,可以說是一種“換品牌”。

Alex Heath:

換個名號?所以區別到底是什麼?老實說,我不是很明白。

Bret Taylor:

“超級智能”,我覺得字面上就是比人類更聰明。所以如果要細分的話,假如你造出了一個在各方面都和你我一樣聰明、一樣好用的通用智能,那是不是顯得有點“平庸”?(無意冒犯你啊,Alex。)我覺得要是我們能做到這一點,本身就很了不起了。對我來說,你已經夠聰明了。

所以我認為“超級智能”代表的是一個更高的門檻,真正意義上超凡的智能。從研究和安全形度看,討論超級智能是有意義的:一旦模型超越了人類的推理能力,我們該如何監控?如何確保它的安全?這時候必須用技術來監控技術。如果它的能力已經超過了人類,那只有靠另一層技術來監督。這在非 AI 的領域也有先例,比如飛機和汽車裡有很多監控系統,用來捕捉人類無法感知或處理過快的情況。這就是一個非常重要的研究方向。

所以我覺得談論它是有價值的。至於公關層面的用語,我沒什麼意見,也不太關心。但在安全層面,這是一個核心問題如果你無法理解它,怎麼確認它和人類的價值觀一致?更重要的是,這種“理解”必須來自人類,還是可以來自我們專門設計的“監督 AI”?這其中有很多技術與哲學層面的問題,需要我們在發展過程中去回答。

10、AI泡沫就像當年的網際網路泡沫

我最近和 Sam(Sam Altman)一起吃過一頓飯。那頓飯後來被報導得很熱,因為Sam 說他覺得我們現在正處於一個 AI 泡沫裡。他的原話是:“一定會有人虧掉一大筆錢,我們不知道是誰。同時,也會有人賺到一大筆錢。”

Alex Heath:

這聽上去像經典的行銷圈段子。

Bret Taylor:

嗯?

Alex Heath:

“我的行銷預算裡,只有 50% 有效。”

Bret Taylor:

那 50%?

Alex Heath:

我也不知道是那 50%。

Bret Taylor:

(笑)對。你問我同不同意?當然同意。我之前打過比方,Alex,如果你聽過的話請見諒:我覺得現在的情況和當年的網際網路泡沫有很多相似之處。很多人只記得 Pets.com、Webvan 這樣的失敗案例。但如果從 30 年的視角來看,網際網路其實孕育了全球最大的一批公司,比如亞馬遜和Google。再看看微軟,它如今市值的很大一部分來自雲業務等新興領域。要是你從全球 GDP 的角度去衡量網際網路的影響,其實當年 1999 年那些“過度樂觀”的人,也並不算錯。

即便是 Webvan 這樣的案例,後來隨著網際網路基礎設施和智慧型手機普及,出現了 Instacart、DoorDash 這樣的成熟公司。換句話說,很多點子本身並不差,只是時機太早了。

如果你在亞馬遜 IPO 時就買了股票,現在的回報相當不錯;但如果你買的是 Webvan,那感受就完全不同了。兩種結果同時存在。而今天的大模型和現代 AI 技術,光是放在軟體工程和客戶服務這兩個場景裡,就足以對經濟產生巨大影響。

你看,世界上從來沒有過“軟體工程師足夠多”的局面。但隨著程式碼智能體的出現,這可能會改變。因為我們正在把一種稀缺資源(軟體開發能力)變得更加充裕。那軟體開發的市場規模到底是多少?我不知道,甚至沒法衡量,因為今天幾乎每家公司都在某種意義上是軟體公司。

所以我覺得,結果幾乎是必然的:一定會有巨大的贏家。經濟機會在那裡,自然會吸引大量投資,而有些公司會失敗,有些會成功。就像當年鋪設光纖的公司,很多最後破產了,但光纖網路依然被後來的企業、私募基金或其他買家利用起來。

所以我認為兩件事可以同時成立:AI 一定會改變經濟格局,它會像網際網路一樣創造巨大的經濟價值;但同時我們確實也處在一個泡沫期,會有人賠掉大量資金。這兩者在歷史上都有充分的先例。

11、AI的泡沫遠比麻省理工報導的嚴重

Alex Heath:

你會擔心泡沫恰好發生在你所在的 AI 企業級市場嗎?麻省理工不是剛有個報告嗎,說很多企業在 AI 上的投入並沒產生回報。我知道你們的定價模式是基於效果的,但看起來不少企業砸了錢,卻沒得到想要的結果。如果這種情況反轉,會怎樣?

Bret Taylor:

我會把“擔不擔心”跟那份研究報告分開說。我確實擔心,但不是因為那份研究報告,我不太同意它的結論。所以我會先說說我的擔心,再回到報告,因為報告本身其實比我的擔憂更樂觀一些

你知道,有個關於我重寫 Google Maps 的故事,外界傳得挺多。大體是真的,只是像所有好故事一樣被添油加醋了些。大家喜歡講這個故事,因為它聽起來很厲害:“一個人周末寫了一堆程式碼。”可現在你用過 Codex 或 Claude Code,你就會想:“哦,我完全可以讓 AI 智能體在周末幫我寫完。”

所以曾經讓人驚嘆的事,甚至是我個人身份的一部分,很快就會變成 AI 智能體的日常操作。也許現在還不行——我寫的程式碼還是挺不錯的(笑)。但兩三年後?完全沒問題。所以過去會被說“哇,好厲害”,未來會變成“居然以前是人幹的?”

從商業角度看,那未來的軟體市場會是什麼樣?這是個非常好的問題。因為當你順著這個線索往下想,就會發現很多東西可能會到達瓶頸。比如自動駕駛,大家當年非常興奮,但事實證明需要的時間遠比預期長。所以即便是聰明人,也會在這些事上判斷過於樂觀

可一旦 AI 智能體真的能做軟體開發,那就是把最稀缺、薪酬最高的工作之一交給了 AI。這會帶來什麼結果?很多人問我:“那我還要不要學電腦科學?”我的答案是“要”,但老實講,沒有人真的知道未來會怎樣。

Alex Heath:

我們會不會進入這樣一個世界:軟體生成(大多數軟體人都知道,生成其實不是軟體裡最難的部分),會在很大程度上變成一種商品化的東西?也許會。很多人是這麼認為的。那麼這對軟體市場意味著什麼?我的假設其實是,它不會帶來太大改變。當你買一個 ERP 系統時,你真正買的並不是那些 0 和 1。你買的是這樣的事實:很多公司把他們的帳本放在上面,你可以每個季度順利結帳,它很可靠,伺服器會有補丁更新,確保你的雲 ERP 系統不會出現安全漏洞,它還有各種合規認證和其他並不令人興奮,但卻是企業軟體中既無聊又重要的部分。

如果你是一家大型 CPG(消費品包裝)公司,能自己寫一個 ERP 系統,這是個好主意嗎?我並不完全相信。 我一直喜歡說,軟體就像草坪,你必須打理它。所以如果你自己寫了,就等於買下了它,對吧?你必須擁有、維護、處理它的一切。比如有新的會計準則出來了,那你就得自己去更新。所以我認為軟體生成會改變我們寫軟體的方式,但會不會徹底顛覆企業軟體市場的存在格局?我並不完全相信。也許我錯了。

12、企業要的不是自己寫軟體,而是解決方案

Bret Taylor:

這其實很新。我們正進入一個全新的世界,因為我們把稀缺的東西變得充足。我最近常常想到一部電影,也推薦大家去看,就是《隱藏人物》(Hidden Figures)。這是一部關於登月的偉大電影,但特別關注的是那些做數學計算的女性們,她們當時的職位叫“電腦”。我是一個電腦。我看這部電影之前並不知道“電腦”原來是一個工作崗位,我還和我的孩子們一起看了。

有趣的是,其中一位女性看到 NASA 引進了一台 IBM 電腦,佔滿了一個客廳,她非常機靈地去學習如何用打孔卡程式設計,本質上是為了保住工作。我們現在其實也都在經歷這樣的時刻。就像“我是電腦”。我剛才講 Google Maps 的故事,其實也就是一個計算器的故事。

但二階、三階效應還比較模糊。我相信企業軟體市場會從“軟體”轉向“智能體”,但我相信公司想買的還是“問題的解決方案”,而不是自己去寫軟體。所以我認為這個市場會繼續存在。

至於那項研究,我不太清楚資料基礎,但我覺得問題在於它把“企業自己寫軟體”與“購買現成的 AI 解決方案”混為一談了。這其實是兩種完全不同的 AI 採用方式。我們和客戶做的基本上是 100% 成功率——從概念驗證到平台上線。而我認為原因在於,我們賣的不是 AI,而是客戶體驗。你一打開就能用。

在舊金山有一家很棒的公司叫 Harvey,我其實不知道總部在那兒,但它真的很不錯。我和很多律師事務所聊過,他們部署 Harvey 做法律分析,全都很成功。但這不是一個“AI 項目”。Harvey 的確用了 AI,這是它能存在的唯一原因。但客戶買的不是“AI”,而是更好的反壟斷審查流程,這就是他們想要的東西。

13、現在的AI市場:多是表演性項目

要麼等,有麼自己做

Bret Taylor:

我覺得我們現在還處在 AI 的早期階段。你還沒辦法在市場上為你業務的每個問題都找到一個完美的供應商。所以結果就是:要麼等,要麼自己做。我不知道那個是對的。但當你試圖自己做時,複雜度簡直是“冰川級”的。於是現在市場上有很多我稱之為“AI 觀光”的東西,即,大家做一些表演性的 AI 項目,但真正把它推進到最後一公里是非常難的。我認為最終的解決方案會是應用型 AI 公司。比如說,如果你想打造更好的客戶體驗,那就買 Sierra;如果你想要法律智能體,那就買 Harvey。

我認為我們需要把所有的應用場景都過一遍,從供應鏈最佳化到會計,再到你會計部門的審計員,這些都會是 AI 智能體。但我相信每一個垂直領域都會有一家公司來做,而這才是打包和購買 AI 軟體的正確方式。我覺得那項研究反映的,其實就是市場不夠成熟——很多領域還沒有現成的解決方案。但今天現場有一些風投朋友,希望幾年後多虧你們,這些公司會逐漸出現。而我相信,這些新的智能體公司會成為企業業務解決方案的下一個前沿,就像當年的 SaaS 一樣。

Alex Heath:

好的,Bret,我們就到這裡。非常感謝。

Bret Taylor:

謝謝邀請我來。 (51CTO技術堆疊)