Agent創企可能成為下一代「SaaS」公司。
OpenAI的董事會主席,居然勸大家別再做大模型了?
智東西8月2日消息,近日,海外知名科技部落格Lenny's Podcast放出了與OpenAI董事會主席、Agent創企Sierra創始人Bret Taylor的一則高資訊量對談。在這場長達90分鐘,實錄字數近2萬字的對談中,Bret Taylor深度分享了他對AI產業未來發展格局與高價值創業方向的見解。
在正式閱讀訪談內容之前,我們有必要先瞭解下Bret Taylor傳奇的職業生涯。
2003年,他在史丹佛大學碩士畢業後,成為Google最年輕的產品經理,並打造出上線首日即獲得千萬流量的Google地圖,徹底重塑了本地生活行業。
2007年離開Google後,Bret Taylor創辦了社群媒體公司FriendFeed,並發明了資訊流(Newsfeed)、按贊按鈕等現代社群媒體中的核心元素。他最後以近5,000萬美金的價格將FriendFeed賣身Facebook,而自己則加入Facebook擔任CTO一職。
2012年,Bret Taylor離開Facebook,創立協作文件企業Quip,最終將Quip以7.5億美元的天價賣身Salesforce,而他本人則加入Salesforece,最終擔任聯席CEO一職。
2023年初,當生成式AI技術剛興起時,Bret Taylor又果斷離開Salesforce,創辦Agent創辦人Sierra,同年,他也加入OpenAI,並擔任董事會主席。
可以說,Bret Taylor過去20多年的職業生涯,每一步都精確踏在風口上,而他橫跨CEO、CTO、COO、CPO、產品經理、工程師、董事會成員等所有不同層級、不同崗位的成功經歷,對AI時代的所有創業者都依舊有借鑑意義。
這場訪談的核心訊息如下:
1.AI市場將出現三大類股-模型、工具與應用。模型市場的新創企業已沒有活路,除非能像馬斯克一樣籌集數十億美元的資金。工具市場面臨前沿模型公司的衝擊,價值將在應用層集中釋放。
2.Google地圖從失敗產品Google黃頁發展而來,這表明在新技術出現時,與其直接將過去的體驗數位化,不如創造全新體驗,回答新客戶「我為什麼要用它」的問題。
3.Agent就是新時代的應用,會是AI產品的主要型態之一。由於其高度自動化、結果可衡量的特點,Agent讓企業能直接看到AI帶來的生產力提升,進而促進購買。其模式與SaaS公司類似,利潤率較高。
4、AI不應按Token計費,而是應按結果計費。在結果導向的計費模式中,供需雙方目標統一:企業希望靠AI產品拿到滿意的工作成果,而AI公司打造出能交付好結果的產品才能賺錢。
5.隨著AI取代人類程式設計,寫程式碼的成本不斷降低,而Python等為了讓人類程式設計更加輕鬆的語言,其實並不適合AI的特點。我們亟需為AI重構一套既適合建構複雜系統又方便靈活調整的程式系統。
6.由於產品能力不足,現有AI程式設計工具往往會在生產場景中幫忙。此類問題大部分都是由於模型缺乏足夠上下文,可透過MCP解決此問題。
7.做AI應用,不能只等底層模型自己進步。模型的進步終將發生,但如果想提前兌現AI的潛力,就得靠應用中的工程設計,這也是應用型AI公司存在的根本原因。
8.AI產品市場化有三種模式-開發者主導、產品驅動和傳統直銷。前兩種模式雖受創業者歡迎,但難以將規模做大,或適用範圍有限,許多AI公司選錯策略,應考慮進行更多直銷。
9.學習電腦不等於寫程式碼,程式設計可能會被AI取代,但理解原理,掌握系統性思維,在AI時代仍舊是軟體工程的基礎。
10.創業家需要對自己的身份保持靈活,願意不斷變化,並且能夠準確判斷:我現在做什麼工作,才能產生最大的影響力。
11.鼓勵孩子們將AI作為生活的一部分。 ChatGPT可以促進教育平權,但也會導致擁有強主觀能動性與弱主觀能動性的學生的兩級分化。
以下是Bret Taylor深度訪談的完整編譯(為提高可讀性,智東西調整了部分問答的順序,並在不違背原意的前提下進行了一定的增刪修改):
主持人:我們先來聊聊AI的商業策略。現在許多創業者最關心的問題之一是:我該做什麼?基礎模型公司會不會把我做的事情直接吞掉?你一方面在創業做AI,一方面又是OpenAI的董事會成員。你認為AI市場會如何演化?創業者該把精力放在那些地方,又該避免那些方向?
Bret Taylor:我認為AI市場可以分成三個主要類股,它們最終都會是相當有份量的市場。我講講我的整體判斷。
第一類是「前沿模型市場」或說「基礎模型市場」。
我認為這個市場最終只會被少數幾家超級規模公司和大型實驗室掌控,就像現在的雲端基礎設施服務市場一樣。原因很簡單,打造一個前沿模型是資金密集的事情。你必須擁有龐大的資本支出能力,才能訓練出這些模型。
所有試圖做這件事的新創公司,要嘛已經被收購,要嘛即將被收購,像是Inflection、Adept、Character AI等。我認為這一市場目前並沒有一個適合新創公司的可行商業模式,原因是模型訓練所需的資本投入實在太大,而且新創公司沒有足夠的融資空間,無法撐到達到「逃逸速度」。同時,基礎模型本身作為資產,它的價值衰減非常快,所以你必須擁有規模優勢,才能從中獲得合理回報。
我認為,幾乎沒有創業者應該去打造基礎模型。
主持人:除非你是馬斯克。
Bret Taylor:是的,馬斯克他確實不一樣,他有能力籌集數十億美元的資本。我猜你的聽眾大多沒有這個能力。而他是這個時代最厲害的創業家之一,他就是不同,大家不要拿自己去跟他比。
市場的另一部分是「工具層市場」。
很多人都在「淘金熱」中賣鐵鍬,這裡麵包括數據標註服務、數據平台、評估工具,還有一些專用模型,比如ElevenLabs的語音模型就非常優秀,被很多公司使用。這個市場的核心問題在於:想在AI時代取得成功,需要那些工具和服務?
但這個市場也有風險,它距離「太陽」太近了。就像雲端服務市場裡,各種雲端平台供應商(AWS、Azure等)自己也都在往上遊走,提供各種工具。這種靠近基礎設施層的公司,很容易被平台商直接取代。
當然,也有真正有價值的公司,像是Snowflake、Databricks、Confluent等。但也有不少公司因為基礎建設平台自己推出類似功能而被淘汰。
對這類公司來說,最大的風險是:基礎模型公司某天在開發者大會上,可能突然推出了創辦人提供的工具,那該怎麼辦?
可能會有很多人需要你的工具,但問題是,如果基礎模型公司推出了和你類似的工具,為什麼人們還要選擇你?工具層這個市場的潛力很大,但也比較危險。
第三部分是「應用型AI市場」。
我認為這部分將由那些建構Agent的公司主導。 Agent就是新時代的應用,這會是AI產品的主要形態之一。我的公司Sierra幫助企業建立能接電話、接客服聊天的Agent,用於提升客戶體驗和服務效率。
還有像Harvey這樣的公司,為法律和準法律領域建構Agent,例如反壟斷審查、合約審查等等。也有做內容行銷的公司,也有專營供應鏈分析的公司。
我覺得這類公司更像是「軟體即服務(SaaS)」的模式,它們的利潤率可能會更高,因為銷售的產品是業務成果,而不是模型的副產品。
當然,它們也得向基礎模型公司「交稅」,為使用底層模型而付費,這也是為什麼這些模型提供商最終會發展成極其大規模的公司,但它們的利潤率可能會略低一些。
我認為應用的市場將變得不那麼技術化。如果你思考最純粹的軟體即服務,人們不會去問你用了什麼資料庫,而是關心你的功能和特性。
我認為Agent的未來也是如此,隨著時間推移,產品會比技術本身更重要。就像我之前用的比喻,1998年Salesforce成立時,光是在雲端運行資料庫就是一項技術成就。
而如今,沒有人會問你這個問題,因為你只要在AWS或Azure上啟動一個資料庫就行了,毫無難度。
我覺得今天,在模型之上組織一個Agent流程聽起來很複雜、很高級、很困難,但我確信三到四年內,隨著技術進步,這一切都會變得容易。
逐漸地,當人們談論一家Agent公司時,它看起來有點像SaaS公司。你會更少地談論如何處理模型,就像現代SaaS產品中很少有人會問你用了什麼資料庫一樣,而是會更多地詢問你的工作流程和你帶來了什麼商業成果。你是為銷售團隊創造潛在客戶?還是在降低採購成本?不管你提供什麼價值,這個方向都會逐漸發展下去。
我對此非常興奮。我並不認為新創公司應該去建立基礎模型。你當然可以嘗試,如果你對未來有願景,那就去實現它,但我認為這是一個已經趨於集中、競爭激烈的市場。而我對另外兩個市場非常感興趣,尤其是隨著建造Agent變得越來越容易,我們將會看到大量「長尾」Agent公司湧現。
我最近瀏覽了一個網站,列出了市值排名前50的軟體公司。毫無疑問,前五大公司是像微軟、亞馬遜、Google這樣的巨頭,但接下來的50家全都是SaaS公司。其中有些公司令人興奮,有些則非常無聊,但這正是軟體市場的發展軌跡。
我認為我們會在Agent市場看到類似的趨勢。它不會只是客戶服務或軟體工程等幾個巨大市場,還會涵蓋許多目前人們投入大量時間和資源的領域,而這些領域完全可以被一個Agent解決。但這需要創業者真正深入理解某個業務問題。我認為AI市場的巨大價值,將在這一領域釋放。
主持人:這太有啟發了。這讓我想起我曾在播客上採訪Mark Benioff,你們曾是Salesforce的聯合CEO。他對Agent極度痴迷,全程都在談論Agent Force。顯然你們看到了某些關鍵趨勢,覺得必須全心投入Agent,這是未來的方向。那麼,你認為人們到底忽略了什麼?為什麼這會是軟體運作方式發生重大變革的關鍵?
Bret Taylor:去和經濟學家,像是Larry Summers(他和我一起在OpenAI董事會)交談,他們會從經濟角度看科技的價值所在:科技推動了經濟的生產力成長。
回顧歷史,生產力的大幅躍升出現在上世紀90年代。很多我交流過的人都認為,那次飛躍是第一波資訊化浪潮──企業開始使用ERP系統,把會計等內容搬進了電腦和資料庫,甚至是主機系統。
我們說的還不是PC時代,而是更早期的企業資訊化。那種變化才是真正顛覆性的。想像一下,一個跨國企業的帳本在電腦化之前需要多少人力才能完成。而資訊化徹底改變了整個部門。
我舉個例子來說明這個生產力提升。我父親剛退休,是機械工程師。他說自己在70年代末期進入工程行業時,公司大多數人都是繪圖員。也就是說,你有一個設計方案,但需要為每個樓層、每個角度繪製視圖,然後提供給承包商。
而現在,他所在公司已經沒有繪圖員這個職位了。設計圖直接在AutoCAD上完成,現在甚至用Revit建模,直接出3D圖紙,繪圖流程已經完全消失了。這項工作根本不需要再做了。設計和繪圖的分工也不存在了,只剩下設計本身。
這就是真正的生產力提升。機械工程公司的職責是做設計,繪圖只是為了交付給施工方的中間產出,它本身並不會增加實際價值,只是供應鏈的一部分。
從PC時代開始回顧軟體產業發展史,我們確實獲得了生產力提升,但遠不如最初那次飛躍顯著。我並不清楚原因,但這很有意思。科技帶來的生產力提升,並沒有如許多人預期的那樣全面實現。
我認為Agent將再次拉動這條曲線,就像電腦早期一樣。因為軟體正從幫助個人提高效率,邁向自主完成完整任務。因此,就像機械工程公司裡不再需要繪圖員那樣,未來也不會再需要人工去做某些工作了。這意味著這些人可以轉向產出更高的作。
一小部分人就能完成更多事情,推動經濟的整體生產力提升。企業軟體銷售會經歷與顧客之間關於「價值」的討論。你需要設計一套略顯複雜的邏輯,例如:假設你在銷售一個銷售軟體,如果每位銷售人員的績效提升5%,那麼你們公司就應該因此多賺多少錢,所以你應該付我們一百萬美元。這樣的討論往往很難精確歸因。
這也是為什麼銷售生產力軟體會如此困難,而我是透過切身經驗學到的。很難評估讓每個人的效率提升10%到底價值幾何。你真的讓他們效率提高了10%,還是其他因素在起作用?你其實並不清楚。
但現在,當一個Agent真正完成了一項任務,不僅確實以非常現實的方式推動了生產力提升,而且這種提升是可衡量的。這些因素結合在一起,讓我覺得這是我們看待軟體的方式上的跨越式變化,因為它可以自主完成工作,這種自主性本身就更直接體現了它對效率的推動作用,並且是可以量化的。因此人們對它的價值判斷也會不同,這也是我相信軟體應該基於結果來定價的原因。
我覺得它對軟體產業的變革意義堪比雲端運算,甚至從技術角度來看可能更甚。從商業模式的轉變角度來看,肯定是一次有「前後時代」之分的重大變革。我不知道還有多少人還在銷售永久授權的本地部署軟體,但現在應該已經非常少了。
我認為我們將經歷類似的轉變,整個市場將轉向Agent,轉向基於結果的定價方式。不是因為那是唯一的選擇,而是市場會自然地推動大家走向那條路,因為這顯然是建構和銷售軟體的正確方式。
主持人:前陣子我和另一位來賓討論了AI公司的定價策略,他非常認同你的觀點——如果可以,就應該按結果定價。提出的邏輯和你剛才講的一樣。你能不能簡單解釋一下「基於結果定價」是什麼意思?然後再以Sierra為例說明它是怎麼運作的?
Bret Taylor:我先從Sierra的例子講起,然後再泛化一下。我們在Sierra幫助公司建立以客戶為導向的AI Agent,主要用於客戶服務,也更廣泛地服務客戶體驗。
如果你在使用SiriusXM收音機時遇到問題,你打電話或在線聊天時接待你的就是我們的AI Agent Harmony。如果你用的是ADT的家庭保全系統,警報器出了問題,你也可以跟他們的Agent溝通。還有Sonos音響等很多消費品牌都在用我們的產品。
經營電話客服中心時,每接一個電話都有切實的成本,大部分是人力成本。一通普通電話的成本可能在10到20美元之間,雖然其中有一部分是軟體或通訊費用,但主要還是接聽者的薪資。
如果Agent能夠接管這個電話並成功解決問題,這在行業中被稱為“呼叫分流”或“問題封閉”,本質上意味著你節省了大約15美元,因為無需人工介入。
在我們的產業裡,只要Agent能解決客戶的問題,客戶滿意,且無需人工干預,我們就以事先約定好的價格收費。我們稱之為「基於問題解決的計費」。
當然也有其他結果導向的模式,例如我們的一些銷售類Agent是按銷售佣金來計費的。我們確實把Agent視為顧客體驗的一部分,像是品牌的禮賓服務。我們希望我們的商業模式與客戶的業務模式高度一致。
正如你所說的,Agent需要是自主運作的,結果必須是可衡量的。雖然這並非總是能做到,但在大多數情況下是可行的。
這套模式特別好的一點在於,任何一個財務長或採購負責人,在面對主要供應商時,看著那長長的帳單往往會感到困惑,很難判斷自己到底有沒有從合約中獲得期望的價值。
按用量計費的方式,尤其是在基礎設施領域比較流行的那種,就是朝這個方向邁進的一步。但我並不認為「按Token數」就是衡量AI價值的好方法。我常用一個類比:現在大多數程式設計Agent是按Token或使用量計費的,就像那個著名的蘋果工程師的故事——他有個差勁的經理要求他每天報告寫了多少行程式碼,這種衡量方式對所有工程師來說都是荒謬的。
他後來在日報上報了一個負數,因為那天他重構了程式碼,刪了很多行,這是他對這位上司的反擊。我覺得Token計費就跟那種邏輯類似。你用了很多Token,好像看起來不錯,但真正的問題是:你有沒有產出一個高品質的Pull Request?
這正是關鍵所在。我認為基於結果定價和基於用量定價之間有本質區別,尤其是在AI領域,兩者甚至都未必相關聯。你可以接一個很長的電話卻沒解決客戶問題,客戶可能還會在網路上留下負評、再次打電話,那所有的投入都白費了,甚至造成了負面價值。我非常相信這種模式。
這種模式也統一了供給與需求雙方的目標。每家科技公司都希望自己被視為合作夥伴,而非供應商。而在上述場景中,我們確實是每個客戶的合作夥伴,因為我們在追求同一個目標。
我覺得軟體產業就應該朝這個方向發展。這當然對公司的組織形態有很高要求,你必須真正能幫助客戶實現他們的目標,不能只是把軟體扔過去了事,因為如果沒實現結果,你根本不會拿到錢。
採用這種模式後,公司就會變得極度以客戶為中心。我覺得這會讓軟體產業變得更好,從第一原理的角度看就是對的,對採購方也是合理的,對整個世界而言也是正確的方向。
主持人:我們剛剛聊到了一些關於生產力提升的話題。現在媒體上對AI是否真的能提升效率抱持著許多懷疑,像是「AI到底在做什麼」、「真的讓人更有效率了嗎」。最近有一項研究顯示,AI甚至讓工程師效率變低了。除了我們剛才談到的客戶體驗之外,在你們公司,或你們合作的其他公司中,還有看到明確的生產力提升嗎?
Bret Taylor:我對AI提升生產力非常看好,但我確實認為目前很多工具和產品還比較不成熟。舉個例子,現在幾乎每家軟體公司都會使用類似Cursor這樣的工具來輔助開發者。多數人現在把Cursor當成自動補全的工具來用。
它還有很多Agent功能,OpenAI的Codex、Anthropic的Claude等都有類似功能,許多程式設計Agent方案正在湧現。
但其中一個問題是,由於技術還不成熟,Agent產生的程式碼經常會有錯誤,而檢查他人或Agent產生的程式碼,實際上比修改自己寫的程式碼還要難。
如果產生的程式碼經常出錯,你需要花費大量的認知精力和時間去修復。事實上,如果它為你的客戶帶來了各種問題,你可能表面上是開發了許多新功能,但其實卻把系統弄得更混亂,效果適得其反。
目前有幾種有趣的技術路線。首先是很多AI新創公司正在開發程式碼審查工具。我認為「Agent的自我反思是非常關鍵的一點,用AI去監督AI其實非常有效。
你可以這樣想:如果你做了一個Agent,準確率90%,這其實並不算太好。但要開發另一個Agent去找出那10%的錯誤,聽起來卻是個可以解決的問題。
假設這個「審查Agent」準確率也有90%,那麼將兩者組合起來,整體準確率就可以達到99%,這其實是一個數學問題。
可以用一個系統來產生程式碼,再用另一個系統來審查它,本質上就是用計算力來換取認知能力。可以層層疊加認知、推理、判斷過程,進而產出更穩健的結果,這點讓我非常興奮。
另一個關鍵是「根因分析」。我們公司有一位工程師專門負責服務我們Cursor實例的MCP伺服器。我們的理念是:當Cursor產生了錯誤的程式碼時,我們不只是去修復它,而是要找到根本原因,確保下次它能產生正確的程式碼。
這本質上是一種「上下文工程」。我們要思考的是:Cursor缺少了什麼樣的脈絡訊息,才導致它無法產出正確的結果?
我認為,那些希望在軟體工程等部門實現生產力提升的人,如果想要現在就看到效果,就必須停止等待模型能力的升級,轉而進行根因分析,弄清楚每一行糟糕程式碼的根源,並提供正確的上下文,建立合適的系統,讓模型今天就能勝任這項工作。
這類工作可能會逐漸減少,對情境工程的依賴也會減輕。但現在,你必須把這件事當作一個系統來思考。我看到很多人仍在等待模型自己變得更好。我想說,那終究會發生,但如果你想現在獲得成果,你就得付出努力。這正是應用型AI公司存在的原因。
雖然工作並不簡單,但它是可以做到的。對於那些使用像Sierra這樣的平台的客戶來說,沒錯,AI Agent不完美,但我們正在打造一個系統,讓客戶可以持續改進,形成正向循環。
如果你想把自動化解決率從65%提升到75%,我們有無數工具可以幫助AI達成這個目標。辨識優化機會,搞清楚用戶不滿的原因,思考我們還能為Agent增加那些新功能來提升解決率——你可以讓AI幫你大海撈針式地找出關鍵問題,這才是優化這些系統的正確方式。
主持人:我以前從來沒聽過透過增加上下文來改進Cursor的做法,具體是怎麼實現的?你搭了MCP伺服器,所有內容都要經過它,還是加了Cursor的規則?這個方法到底是什麼?
Bret Taylor:這已經有點超出我的理解範圍了,但基本上就是用MCP,這就是你給Cursor提供上下文的方式。我認為,如果模型本身能力沒問題,卻做了錯誤決策,那麼問題就在於脈絡不足。
要找出你的產品和程式碼庫與這些編碼Agent可用上下文之間的交叉點,然後從根本上修正問題,這就是核心原則。
主持人:你提到仍然把自己定位為工程師,聽說你還會靠寫程式放鬆。現在不少大學生在問:還值得學程式設計嗎?未來幾年這個領域會不會發生巨變?
Bret Taylor:我還是覺得「學電腦科學」和「學寫程式」是兩回事。學習電腦科學依舊非常有價值,因為它不只是寫程式碼。理解大O記號、複雜度理論、演算法,知道為什麼兩個複雜度相同的演算法在實務上效能不同,為什麼快取未命中很重要——這些知識的意義遠遠超出敲程式碼本身。
寫程式碼這件事,我認為會從“人往終端或VS Code裡敲字元”變成“人操作一台代碼生成機”,我認為這會成為軟體工程的未來。不過,要用好這台機器,需要係統思維,而電腦科學正是培養系統思維最好的學科之一。
最終,AI會承擔大量軟體開發工作,但人的任務是操作這台機器去打造產品、解決問題。要有良好的系統性思維,必須理解技術與商業問題的交集,設計能真正解決客戶問題的系統。系統思維永遠是做產品最困難的部分。
舉個簡單例子:當Facebook設計NewsFeed時,設計師用Photoshop做的原型永遠完美——照片漂亮、文字優雅、長度剛好、評論友善。一旦上線,真實數據進來,NewsFeed立刻慘不忍睹:照片品質差、文字長短不一、留言裡還有人罵你。
這時你才明白:用Photoshop設計NewsFeed是最簡單的,真正困難的是設計一個系統,讓它在你無法掌控輸入的情況下,依舊輸出令人愉悅的內容和視覺體驗。我們後來強制設計師必須用真實、凌亂的數據做原型,逼他們把過程做得更貼近現實。
AI產生程式碼、生成設計以後,你仍然需要在腦中建立這套系統,理解什麼難、什麼容易、什麼可能、什麼不可能。 AI也能幫你做這件事。
我認為,隨著AI Agents的出現,以及AI某些領域的能力接近「超人」水平,我們所使用的工具會出現深刻的變化。
人類不應再依賴特定的行事方式,不應再糾結於「我現在擅長的事情,未來可能就沒用了」這種問題。就像NASA早期用人類充當計算器一樣,未來的人們可能會驚訝:“原來你們以前是一行行手寫程式碼的?”
別因為「以後不用手寫程式碼」就不去學這些學科,就像有人會說「我以後用不到數學就不學數學」。學數學的價值在於培養人的思考方式,同樣的,電腦科學的基礎知識,仍將是未來建構軟體的基礎。
尤其是與比你聰明的系統協作時,它產生的程式碼你未必能一行行讀完。你需要具備足夠的能力,約束它、引導它產出想要的結果,這需要大量技巧。
主持人:這讓我想起你最近在一檔播客裡提到的一個觀點——你認為應該出現一種新的程式語言,這種程式語言更適合大模型而不是人類。能展開說說嗎?
Bret Taylor:我不確定它該叫“語言”,我傾向於叫“程式系統”,因為“語言”這個詞可能太窄。如果把過去40年甚至更久的電腦史簡化版一下,大概的過程就是:先造硬體,再用打孔卡告訴機器幹什麼;接著出現操作系統、分時系統,於是有了C、Fortran等高級語言;再往上抽象,就很少有人寫彙編、寫C語言了,更多人用Python、TypeScript。
每一次抽象層提高,都讓我們用更少的力氣去做更大的事。今天再讓人用React寫一個可拖曳地圖,許多工程師都能很快搞定,這在當年Google Maps時代是驚世駭俗的壯舉。當Salesforce成立時,把資料庫放到雲端都是一件很困難的事情,能做到這點就已經是一條技術護城河了。現在,技術的護城河不斷縮窄,但產品的護城河仍然存在。
如果我們假設寫程式碼的人力成本趨近於零,那麼我們過去幾十年來圍繞著「提高人類程式設計師效率」所打造的所有抽象層的工具、語言,都需要重新評估。
我常開玩笑說,Python大概是大模型產生最多的語言,因為它在訓練語料裡無所不在,而資料科學家又愛它。但從AI角度看,Python簡直糟糕:慢、難驗證、執行時錯誤多。它之所以存在,是為了讓人寫得舒服,像偽代碼。
未來如果我們只需要操作代碼生成機,我們根本不需要在乎語言對人類多“符合人體工學”,只在乎兩件事:機器生成的代碼能否被快速驗證“確實做了我想要的事”;如果不對,能否很容易地進行改掉。
這就引出對「程式系統」的新需求。例如Rust之所以有意思,是因為編譯器能靜態保證記憶體安全,編譯通過等於沒有記憶體洩漏。如果讓AI生成一百萬行C語言,你很難判斷有沒有洩漏;生成一百萬行Rust,只要編譯過就基本上安全。
我們需要更多這種設計。如果人無法完全信賴AI的程式碼,需要逐行閱讀、核驗程式碼,那這將大大限製程式設計的效率。如今,問題的關鍵在於如何提供人們這種自動化核驗的工具。
AI的自我核驗當然是一種方式,讓系統具備自我反思能力,確實是提升穩健性的有效手段。但我認為,如果不用再擔心寫程式是否繁瑣,就可以重新考慮一些傳統的技術手段,例如形式化驗證、單元測試等。
把這些技術疊加起來,我腦中會浮現出一個畫面,就像《駭客任務》裡的那個人,看著螢幕上流動的綠色程式碼,思考:我怎麼能建構出一個讓操作者能夠高效產出極其複雜、規模龐大的軟體系統,並且確信它是正確的系統?
從這個目標出發來做設計,那你可能會改變程式語言、系統架構,甚至所有相關的建構方式。最有趣的是,這過程中我們可以放寬許多限制,例如——「寫程式是免費的」。這真的很酷。
那麼在這種前提下,你會想做什麼?那種語言、編譯器、測試框架、自我反思機製或監督模型才最適合?我認為這不是單一的程式語言問題,而是整個程式系統的設計問題。
一旦我們建構出這種系統,它將真正賦能創造者、開發者們,讓他們得以建構出既複雜又穩健的系統。我對「vibe coding」感到非常興奮,但我不認為「快速生成原型」曾是軟體開發的核心瓶頸。
真正的挑戰,是如何建立日益複雜的系統,並具備靈活改動它們的能力。可以回顧下當年Netscape瀏覽器從1.0到2.0的重寫過程,很多人認為這就是它輸給Internet Explorer的原因之一。
寫出一個系統並不難,難的是維護它,並確保它的穩健性。我覺得我們正處於定義「下一代軟體開發體系」的初期階段,我非常期待它將如何演化。
主持人:當你這樣的人在談論要打造一種類似《駭客任務》的程式設計體驗,並認為這可能是未來的開發方式時,我真的覺得我們已經身處未來了。我迫不及待想看到它成真——這將是一次偉大的機會,也是一個非常有趣的項目。
主持人:現在很多AI新創公司在市場化上遇到困難。各種AI應用、產品層出不窮,你在AI產品,特別是Agent類產品的市場落地方面,有那些經驗值得大家借鏡?
Bret Taylor:我認為成功的市場落地路徑其實就那幾種,關鍵是要選對匹配你產品類別的方式。
第一種是開發者主導。
Stripe和Twilio就是這個典型,他們的市場策略是吸引某個工程師,通常在CTO負責的部門裡,這些人有選擇工具的決策權。這種方式適用於平台類產品。
如果你的產品是幫助某個業務部門的,那就不適用,因為這些業務線通常沒有專屬的工程師團隊,也沒有權限去隨便下載庫或接入服務。如果你的客戶是新創公司,這種方式特別管用,因為新創團隊的工程師常常有決策自由選擇他們喜歡的服務,來解決創辦人提出的問題。
第二種是產品驅動成長。
雖然每家公司的產品都很重要,但這裡的意思是用戶可以直接在官網註冊,通常可以試用,也可以用信用卡買幾個帳號。這適用於使用者和購買者是同一個人的情況。小型商業軟體幾乎都屬於這類,因為自營商甚麼都得自己處理。
例如早期的Shopify,還有很多類似產品,主要面對小型商家,這種方式非常適合。但如果使用者和購買者不是同一個人,這方式就不靈了。例如報銷軟體,用的是普通員工,買的是財務部,用信用卡購買就不合邏輯,因為實際使用者並沒有公司信用卡。
第三種是傳統直銷。
直銷曾經被認為過時了,但如果我想到最強的直銷公司,很多都來自Oracle體系,像是SAP、ServiceNow、Salesforce、Adobe等。他們都透過傳統銷售流程向大企業的業務線銷售產品。
由於產品驅動成長一度很火,很多公司也跟著走,確實也能催生出優秀產品。但如果產品驅動成長,導致你完全沒有和真正的軟體購買者打交道,那你是不會成長的。
我最近看到越來越多AI公司開始重新重視直銷方式。因為AI的許多機會,確實是使用者和購買者不同的情況,確實需要這種市場推進方式。
很多創業者的問題是,選擇了某種市場策略,卻沒有認真思考客戶是怎麼購買軟體的。怎麼評估軟體的價值?我認為人們需要從第一原理出發,並且更加深入思考。
坦白說,我覺得很多公司其實應該多採用直銷。儘管有些直銷公司的產品品質名聲不太好,但這只是個別情況。我很高興看到直銷正在市場中重新獲得重視。
主持人:我覺得這個訊息是很多創辦人需要聽到的,尤其是那些不具備商業背景的創辦人,他們對「銷售」本能抗拒,認為自己不擅長。但有時候你必須變得擅長這件事,這就是你能否成功的關鍵,不能只靠產品帶動成長。
主持人:你在職業生涯中獲得了許多難以置信的成就,我們稍後會談到這些。但我想先從反面案例開始,聊聊你犯下的重大錯誤。你在建立產品時犯下的最大錯誤是什麼?
Bret Taylor:這件事可能不算是最大的錯誤,但對我來說意義重大──這是我身為Google產品經理的第一次重大失誤,也成為我作為產品經理成長過程中的重要轉捩點。
我在2002年底或2003年初加入Google,是最早的助理產品經理之一,起初負責搜尋系統,將索引規模從10億擴展到100億。表現不錯後,我得到了Marissa Mayer(Google第一位產品經理)的信任,被安排負責一個全新產品專案。
對我來說,這是一個重要機會,也面臨許多人的審視,畢竟我是個剛起步的年輕產品經理。
交給我的任務是:做本地搜尋。當時黃頁仍佔主導,Google擅長搜尋網頁,卻不擅長找水管工或餐廳,因為這類資訊當時在網路上並不豐富。即使存在,你也需要更精準的結果──例如在舊金山找水管工,而不是曼哈頓。這既是技術問題,也是產品和內容問題。
我身為產品經理負責的第一版產品叫做Google Local)。現在回頭看,基本上是Yahoo黃頁翻版,只是把黃頁搜尋嫁接在Google搜尋之上。透過精心建構的查詢,你可以在搜尋結果頂部看到這些列表,我們還有一個獨立站點。
Google本地重要到甚至出現在Google首頁的導覽列裡,與網頁、圖片並列。Google首頁幾乎任何連結都能帶來巨大流量,但儘管這樣,Google本地表現並不好。在擁有Google首頁連結的情況下表現不佳,實在有點尷尬。
對產品經理來說,沒有比這種流量更好的機會了,但Google本地產品只是“還好”,並沒有差異化。回頭想,人們為什麼要用它而不是Yahoo黃頁?甚至為什麼要用這些產品而不是黃頁本身?它們只是把以前的黃頁數位化了。
我和Marissa、Larry(Google創辦人、前CEO)等人進行了一次艱難的產品評審,雖然沒有要被炒魷魚,但我的「光環」確實黯淡了一些。他們給了我一個機會做下一個版本,我的團隊花了大量時間思考如何做出更吸引人的東西,而不是簡單的數位化黃頁,也不是簡單複製其他產品。
最終,我們找到了一條思路,這產品就是Google地圖。我們原本的搜尋結果旁放了一個小地圖,但一直是產品裡最醜的部分,內部也常常吐槽。但如果顛倒層級,把地圖當作畫布會怎麼樣?
我們找到了Lars和Jens Rasmussen兩兄弟,他們正在做地圖產品。把他們招進公司後,我們開始探索這個方向,最終把地圖、本地搜尋、行車路線等當時各自獨立的產品類別整合成Google地圖,重新定義了行業,也改變了我的職業生涯。
身為產品領導者,這讓我徹底改變對產品的看法:你可以從功能和特性的角度思考問題,但也該思考「人們為什麼要用它」。Google地圖推出第一天就有約1000萬人使用,這在當時互聯網的規模下非常驚人。
2005年8月,我們整合了收購的Keyhole(後來的Google地球)提供的衛星影像,當天就有9,000萬人使用,每個人都想看看自己家的屋頂長什麼樣子。
Google地圖成功背後的經驗是:新技術出現時,與其直接將過去的體驗數位化,不如創造全新體驗,回答新客戶「我為什麼要用它」的問題。Google地圖真正原生地利用了平台優勢,這是紙質地圖做不到的,是重大突破。
衛星圖像雖不是Google地圖最重要的部分,卻是“錦上添花”,形成了病毒式傳播,甚至上了《周六夜現場》這檔爆款電視節目,那一刻我們感覺這款產品真的成了。這也說明產品設計時要區分“為什麼用它”和“長期價值”,這些經驗和教訓伴隨著我後續所有產品的設計過程。
主持人:這故事太棒了,一是讓人知道即使像你這樣成功的人也曾在GoogleCEO面前犯下大錯,二是產品方面的經驗,在現有的產品上稍作改進,往往很難成功,要找全新體驗、差異化、更有吸引力的東西。
主持人:我們換個角度,聊聊你的成功。你幾乎把產品經理、工程師、CPO、COO、CTO、CEO等角色都做了個遍,極少有人能在所有這些層級和角色裡都取得成功。你認為那些心態、習慣或工作方式,是你刻意培養,並認為最有助於你成功的?
Bret Taylor:這確實是我引以為傲的一點,我為自己戴過不同「帽子」感到高興。有趣的是,當我和只在其中一份工作中認識的同事見面時,他們往往用那段經驗定義我。
Facebook的人把我當工程師,Google的人當我是產品經理,Salesforce的人則覺得我是“穿西裝的老闆”,甚至懷疑我根本不會寫代碼,儘管我周末仍會寫點代碼作為消遣。
我一直堅持一個原則:對自己的身份保持靈活。我通常自稱工程師,但更廣義地說,我認為自己是個建構者(Builder)。我喜歡打造產品,而公司是實現這一點最有效的方式之一。我也相信科技與資本主義結合能帶來巨大成果。
因此,想做出真正有意義的東西,成為優秀的創辦人,就不能固守某種身份,而是隨時變成公司最需要的角色。
每位創辦人都會告訴你,銷售是他們工作的重要部分:要向投資人推銷公司,向候選人推銷職位,向客戶推銷產品。你也需要良好的設計品味,不只是產品層面,也包括行銷和獲客等。如果你做的是科技公司,技術必須優先,這也是這個產業能夠不斷顛覆的原因。
我尤其感謝Sheryl Sandberg(Facebook、Meta前營運長),她改變了我面對新工作的方式。
當時我才剛成為Facebook的CTO,這個職位一開始只是帶著一個小團隊,我的角色比較像是資深技術架構師。後來祖克柏重組了公司,我突然負責平台、行動、產品、設計、工程,直接管理的人從幾人擴展到上千人,是我帶過最大的團隊。
雖然我在Google也做過管理,但規模小很多。這次上任Facebook CTO,我其實做得一般。有一次我在修改一份發給合作夥伴的PPT,一邊改一邊抱怨品質太差。
Sheryl把我拉進會議室,給我上了一堂管理課:你要把團隊帶到你的高標準上。如果有人達不到,那計畫裡是否也包括請他們離開?這是非常直接的回饋,像是在給我上管理學第一課一樣。
她是那種回饋很直、甚至可能讓人不舒服的人,但你知道她在乎你,所以會認真聽。那晚回家越想越不舒服,有點防禦心:她說得對嗎?我真的搞砸了嗎?
第二天醒來,我想通了:她是對的。我意識到我在潛意識裡把工作範圍侷限在我喜歡做的事上,花時間做我熱愛的產品和技術,想著“我是老闆,可以做自己想做的事”,而不是問“我負責的團隊今天最需要什麼?”
當我換個方式看待工作,我的行為也隨之改變。讓我驚訝的是,我竟然喜歡上了這種方式。我以為我只喜歡做工程和產品,但當我讓一個組織更成功,那種成就感遠遠超乎預期。
例如,平台遇到合作夥伴問題,我花時間處理合作,看到平台更健康,合作夥伴也更成功,我為此感到自豪。我因此變得更好。我意識到,真正讓我熱愛的,可能不是寫程式碼或設計產品,而是「產生影響力」。
那次對話讓我養成一個習慣:每天醒來,我都會問自己,「我今天做什麼,才能產生最大的影響力?」就像一個外部顧問團隊在提醒我:聚焦這些事,才能最大化目標。
有時是招聘,有時是產品,有時是工程,有時是銷售。我變得更自省,也更願意做原本不喜歡的事,因為當我看到我產生的影響時,我就喜歡它們了。
我把這一切都歸功於Sheryl。她讓我意識到回饋的力量,也讓我在給別人回饋時常常想到她──這些時刻甚至能改變職涯的軌跡。
主持人:我最大的收穫是這個問題:「我今天做什麼,才能產生最大的影響力?」這是一個非常強大的思考工具,值得時時刻刻記在心裡。很多時候你一開始可能不願意去做銷售或招聘,但如果那是最有影響力的事,你去做了,也許會發現自己其實挺擅長,而且也喜歡。
Bret Taylor:我想再補充一點。對創辦人和產品經理來說,有一個常見的陷阱是講錯故事,例如把「人們不喜歡我們的產品是因為X」當成事實,告訴公司裡的所有人,然後據此調整策略,如果判斷錯了,可能會導致公司方向徹底跑偏。
當你失去一筆交易時,銷售往往會歸咎於“價格太貴”,但真正的原因可能是客戶根本沒看到你的價值——問題在於產品缺乏差異化。結果,你圍繞著定價做文章,卻忽略了更深層的產品問題。
就像分手時人們不會直說“我不喜歡你了”,而是習慣性地說“不是你的問題,是我的問題”,因為我們總是想維護關係的和諧。類似地,使用者或客戶在研究中給予的回饋也未必準確,你必須深入分析、抓住核心。
可惜,許多新創公司的創辦人容易陷入「單議題選民」陷阱:工程師只信工程能解決一切,產品設計師只信一次redesign,而BD背景的人只信大合作。現實中,沒有那一種方法能一招搞定所有問題。
真正優秀的創始人,會清楚地認識到自己是有偏好的,人天然會更傾向用自己的強項去解決問題,但你需要保持警覺,時刻注意自己是不是因為習慣而選擇了這一方向,而不是遵循真理。
創辦人需要一個能夠坦誠對話的共同創辦人和領導團隊,共同驗證思路,確保方向正確。儘管「今天我能做的最有影響力的事是什麼?」是一個極好的思考框架,但要準確回答它,卻比你想像的要難得多。
主持人:你從過去的失敗中學到了什麼?
Bret Taylor:我們本來是要聊聊我的失敗的,有點離題了(笑)。 FriendFeed是我的第一家公司。高峰期我們只有12名員工,卻是我共事過最優秀的一群人。我和Jim Norris、Paul Buchheit(Gmail之父)、Sanjeev Singh(Gmail首位工程師)一起創辦,核心成員來自Google和Gmail。
我們做了一個社交網絡,發明了Newsfeed(資訊流)和「讚」按鈕,這些功能之後都很流行。當時我們發現平台上有很多評論都是「Wow」、「Nice」這樣表示「我看到了」的內容,而我們想讓評論區裡有真正的討論。讚按鈕就是這問題的解決方案。
不過,我們只在土耳其、義大利和伊朗流行了起來,後來伊朗封了我們,只剩下土耳其、義大利和矽谷。直到今天,有人說“我愛FriendFeed”,我就說“那太好了”。
但它不是一個成功的商業模式。我們是「關注型」社群網絡,用戶關注特定用戶,獲取訊息,更像Twitter而非Facebook,分享的是新聞、興趣、科研等內容。那年夏天,歐巴馬和歐普拉等人都進駐了Twitter,我們被徹底碾壓。
我們團隊幾乎都是工程師,埋頭打磨產品。而Twitter專注拉名人入駐,這是「關注」場景下顯而易見的策略:如果要打造一個基於關注的社交網絡,那就得拉一些值得關注的人加入。雖然我們功能更多、上線更快、幾乎零宕機,但我們卻輸了,這項失敗和產品本身沒有任何關係。
這也說明了Google出身的創業家一個通病:在Google太順了,產品經理往往忽略分送、設計,甚至不思考商業模式,因為從廣告已經賺得盆滿缽滿。相較之下,PayPal黑幫這樣的人在創業上學得更多,我們被現實打臉了。
我可以說出FriendFeed產品方面的許多問題,但我認為那不是失敗的關鍵。我後來逐漸補齊了短板,但如何準確判斷該做什麼是很困難的。沒經驗時很難有直覺。
做FriendFeed時,我不是找不到名人加入,而是根本沒去找有經驗的人諮詢相關問題。科技圈資訊很多,難的是選擇聽誰的。我們當時太專注產品,沒請外部人指出問題,也沒請教業界專家。這讓我成為董事會和高品質建議的堅定信徒。
主持人:如何判斷誰的意見值得聽?
Bret Taylor:這確實需要判斷力。有一點很重要:一個人表達意見時的自信程度,和意見的品質往往不正相關。現在播客這麼多,有時我對非常熟悉的話題,發現最有自信的說法其實錯得離譜,卻極具說服力。所以得靠判斷力。
一個辦法是:不僅問“我該怎麼做”,還問“我該去問誰”。你會發現有些人總是被反覆推薦,那就是強訊號。
另外,問建議時不要只問“做什麼”,還要問“為什麼”。像個兩歲小孩一樣不停地問“為什麼”,直到你理解對方給出建議的框架。
其實,大部分建議往往來自極少數經歷,人們會說“永遠別做X”或“永遠做Y”,但其實只是某次經歷讓他們後悔或慶幸。多問問不同人的意見,據此整理出你的第一原理,應用時要分情況,而不是簡單照抄。
說到底,判斷力來自自省和複盤。如果你做了一個糟糕的決定,花時間反思為什麼,並持續提升自己的判斷力——這才是優秀創業家或產品經理的核心能力。
其次,當聽取建議時,一定要弄清楚建議的來源和背後的原因,這樣你才能形成自己獨立的觀點;同時要意識到,任何人的建議基本上都不具備統計顯著性。
主持人:我特別喜歡問像你這樣站在AI前沿的人,你是怎麼教你孩子的。我知道你有孩子,我覺得等他們長大後,世界會非常不一樣。你會鼓勵他們學些什麼東西,是你覺得和過去幾代不一樣的,可以幫助他們在AI無所不在的世界裡取得成功?
Bret Taylor:我不確定我的教育方式有沒有變化,但我確實一直在鼓勵他們把AI當作生活的一部分。我在回想,其實我1997年考AP微積分考試的時候,那時開始可以使用圖形計算器。我一直在想,在允許使用計算機之前和之後,微積分考試內容有沒有改變?我猜是有的。
因為一旦允許在考試中使用計算器,就必須確保考試題目不會因為是否使用計算器而給學生帶來不公平的優勢,這就迫使出題人重新思考題目設計,用來考察的是微積分知識本身,而不是計算能力或圖形計算器能完成的事情。
我認為,現在大部分的教育體系並沒有假設每個人口袋裡都有一個超級智慧。如果你請學生寫一篇關於某本書的作文,其實他們完全可以用ChatGPT這類產品「編」出一篇文章。如果他們夠擅長提示字工程,甚至老師可能都看不出來是AI寫的。
那該怎麼辦?我們該如何以不同的方式教育孩子?對老師來說,現在真的很難,因為教育還沒完成像當年「加入計算器」的那種轉型。現在我們用來評估學生的許多方法,都已經被ChatGPT這類工具打破了,正處於一個很尷尬的階段。
但我認為依然可以教孩子如何思考,也可以教他們如何學習。我們的教育系統終究可以趕上科技發展的腳步。事實上,我覺得這些AI模型可能是人類史上最有效的教育工具之一。如果一個老師的教學方式不是你喜歡的風格,現在你可以回家請ChatGPT用另一種方式教你。我的孩子在考試前會用ChatGPT做自測,可以選擇語音模式或聊天模式,比用抽認卡效果更好。
我女兒帶回了一本莎士比亞的書,有一頁她看不懂,她拍了張照片,ChatGPT解釋得比我好得多。我覺得,今天這個世界上每個孩子都擁有一個專屬的個人化導師,能以他們最擅長的方式教學──無論是視覺、聽覺或文字閱讀。我們現在有一個平台,不僅能教學,還能出題、測驗。我覺得AI是一個「行動力放大器」。對於那些主觀能動性的孩子、渴望學習的孩子來說,他們等於擁有了所有曾經教導他們的好老師的能力集合。而他們可以隨時呼叫這種能力。
我家孩子中,老大學會了程式設計,她正在做一個網站,每次她問我問題,我都讓她自己去問ChatGPT,並不是因為我想當個討人喜歡的爸爸,而是我覺得她必須學會使用這個工具,因為它真的太強大了。所以我真心希望她們能學會如何建設性地把它融入生活。
話雖如此,我對現在的公立學校老師非常有同理心。這太難了,因為科技的變化速度遠快於教育體系的適應速度,尤其是在學生評估這一塊,現在的確對老師是個巨大挑戰。我也擔心,因為這些技術放大了主觀能動性,反過來,如果孩子沒有主觀能動性,情況可能也會很糟糕。
當然,我知道圖形計算器不等於ChatGPT,但我們曾經設法成功地讓作業、課堂教學和考試與現有的科技工具相適應,我相信我們這次也能做到。從更正面的角度看,我自己就是上公立學校的,有時候你會遇到一些很差勁的老師,而現在孩子們有了另一種出路。不再只有富人家的孩子才能請得起家教,現在每個孩子都可以獲得輔導。
如果你是一個在數學方面很有天賦的孩子,但你所在的學校沒有開設高級統計課程,那麼現在可以自學了。我覺得這能大大推動教育的普惠,特別是對那些主觀能動性的孩子來說,這真的令人興奮。我真的希望,現在某個11歲的孩子,10年後能創辦一家了不起的公司,而ChatGPT會是他最主要的導師,幫助他走到那一步。我覺得這太酷了。
主持人:我現在有一個兩歲的孩子,我感覺人生像進入了一個又一個的階段,比如說什麼時候給他手機、什麼時候讓他用Snapchat之類的東西——這些年孩子們都在用什麼。現在還多了一個新問題:什麼時候該開第一個ChatGPT帳號給他們?
Bret Taylor:我個人的看法是,ChatGPT不同於前面提到的。我不認為手機對在校學生或兒童有多大好處,我是主張儘量晚一點給孩子手機的。但ChatGPT更像是Google搜尋。口袋裡有個讓人上癮、推送不停的裝置是一回事,用AI來學習是另一回事。我覺得這兩者完全不同。
我真心認為AI本質上就是一種「公共產品」。以前還沒有ChatGPT的時候,幾乎沒有家長會問「我孩子什麼時候能用Google搜尋?」因為那是不同類型的工具,我也是這樣看待這類新技術的。 (智東西)