6月11日,OpenAI首席產品官Kevin Weil接受播客Azeem Azhar訪談,本次對話中,Kevin Weil就AI從“回答者”向“執行者”的範式轉移、AI Agent的產品化路徑與戰略支點、新型產品研發範式,以及OpenAI獨特的使用者信任建構,系統性地闡述了其團隊在產品層面的前沿思考與完整戰略。
Kevin Weil指出:“我們正在經歷一個轉變,ChatGPT正在從一個回答問題的工具,演變為一個能在現實世界中為你執行任務的產品。”
就在本月,OpenAI發佈了一系列連接器,允許ChatGPT接入Google Docs、SharePoint、Gmail等主流生產力工具,這一新功能授予了這位“數字員工”訪問公司知識庫的權限,AI更深度融入每個人的日常工作流。
每當顛覆性技術浪潮來臨,人們的初始反應往往是保守的。Kevin Weil講述了一個有趣的現象:“最早的電視廣告,不過是讓人站在鏡頭前,照本宣科地朗讀廣播廣告詞。” 人們習慣於用新的媒介,去重複上一代技術浪潮中早已駕輕就熟的事情。今天,許多組織對AI的應用也陷入了類似的思維定式:“我現有這些工作流程,要如何將AI技術‘點綴’其上,讓它變得更好、更快?”
這種“疊加式”的應用固然能在短期內帶來效率提升,但Weil強調,這遠非AI的真正潛力所在。真正的力量源於利用新技術,從第一性原理出發,徹底重塑我們正在做的工作。他指出:“移動網際網路的意義遠不止是把電腦放進口袋,而是讓你能隨時使用GPS、接收通知,帶來了與技術互動的全新方式。” 同樣,AI的革命性價值,在於它能夠催生出全新的工作與生活範式,而非僅僅最佳化存量。
Weil觀察到,這種思維模式的轉變在不同代際的使用者群體中表現出顯著差異,他分享道:“Sam Altman曾經談到過一些代際差異,我非常同意他的看法。現在很多人還只是將AI簡單地應用在自己現有的工作流上。”
對於在沒有AI的環境中成長起來的“我們這些老人”,思維慣性是難以避免的。我們總是在努力回憶和思考自己固有的流程,並琢磨如何去改造它們。然而,對於“AI原住民”而言,情況截然不同。
“對更年輕的使用者而言,AI已經成為他們生活方式的核心,彷彿一項永遠線上的能力。” 對他們來說,與一個可以量身定製、回答任何問題的超強AI對話,是理所當然的存在。他們很自然地意識到,口袋裡有這樣一個超級助理,它不僅能回答任何問題,還能教會你想學的任何東西。
這種差異的核心在於,年輕一代沒有固化的流程需要去“改造”,他們直接用AI從零開始建立自己的方法論。Weil表示:“AI只是你生活運作方式的核心組成部分。從某些方面來說,他們已經走在了前面,而我們其他人則在奮力追趕。”
面對公眾對AI普遍存在的疑慮,Weil認為,在產品層面消解這種恐懼,建立使用者信任,是推動AI健康發展的首要任務,而OpenAI的策略可以歸結為兩個核心支點:親身體驗與使用者掌控。
“當人們問:‘我該如何面對AI?我該怎麼看待它?’我的回答永遠是:‘去用它。’” 他相信,無論選擇ChatGPT還是其他產品,親身實踐是打破媒體渲染的“恐怖敘事”、建立客觀認知最有效的方式。只有當使用者真正開始使用,他們才會發現AI並非洪水猛獸,而是一個強大的助手,能將他們從繁瑣的重複性勞動中解放出來。他強調:“如果你相信AI將成為我們生活的重要組成部分,那這趟列車你肯定不想錯過。”
他分享的個人經歷,他的兒子不久前經歷了一場小手術,術後的活檢報告充滿了普通人難以理解的醫學術語,在無法立即聯絡到主治醫師的72小時裡,他將報告拍照上傳至ChatGPT,並用最簡單的語言提問:“我應該擔心嗎?你能用像對五歲小孩說話的方式給我解釋一下嗎?”ChatGPT給出了明確而撫慰人心的回答:“不,這完全沒問題,一切都好,沒什麼可擔心的。” Weil感慨道,想像一下,這項技術在全球那些醫療資源匱乏的地區能產生多大的影響。它的力量真的非常強大,我認為這是ChatGPT有些被低估的一面。”
隨著AI能力的進化,特別是當它從一個被動的“回答者”轉向主動的“執行者”時,僅有情感信任是遠遠不夠的,更需要建立機制上的信任。Weil強調的第二個核心支點:使用者掌控權。
“當我們正在經歷一個轉變,即ChatGPT從一個回答問題的工具,演變為一個能在現實世界中為你執行任務的產品時,你必須能夠控制它採取的每一個行動”。使用者不希望AI在自己感覺失控的情況下,自作主張地完成一系列任務。因此,在AI Agent化的初期,每一步行動的決策權都必須牢牢掌握在使用者手中。隨著時間的推移,當模型性能越來越好,使用者對它的信任度逐步建立,才可以授予其更大的自主權。Weil認為:“這種共同成長和演進的過程,是我們建立使用者信任最重要的方式之一。”
這種對使用者體驗和控制權的追求,也深刻地影響了OpenAI獨特的產品策略。許多使用者都曾對ChatGPT左上角那個令人困惑的、包含多個模型選項的下拉菜單感到不解。Weil坦誠地回應了背後的策略——“迭代部署”。
他解釋道:“我們相信,實現AI改變世界的最佳方式是與社會‘共同進化’。” 這意味著要將尚不完美的模型盡快交到使用者手中,讓使用者幫助OpenAI發現其能力、弱點和未曾預料到的用途,從而形成一個快速學習、迭代和改進的閉環。如果堅持將所有新功能都整合到一個完美的模型中再發佈,開發速度將大大減慢。因此,OpenAI選擇犧牲一時的清晰易用性,以換取更快的進化速度。
這種策略的結果就是,使用者會看到一個模型的集合,其中一些是實驗性的,在某些新能力上表現卓越,但在其他方面可能稍遜一籌;另一些則是更穩定、更全面的主力模型,如GPT-4。Weil透露,未來的GPT-5正是為了實現這一目標:將過去實驗中驗證過的諸多能力整合到一個單一、更強大的模型中,從而減輕使用者的認知負荷。然而,他也清醒地認識到,這並非終點。“即便我們推出了GPT-5,我們之後還會有大量超越它的新功能需要建構和實驗。我預計,你會一直看到這樣的情況:市場上會有新的實驗性模型,同時有你信賴的主力模型。”
這種看似“混亂”的迭代部署,其本質是一個高效的“學習循環”。通過同時放出“好幾匹賽馬”(不同的實驗模型),OpenAI能夠快速收集關於不同能力表現的資料,從而為下一代主力模型的開髮指明方向。
OpenAI正在實踐一種顛覆傳統網際網路產品開發模式的新範式。它不再由產品經理的需求文件主導,而是由前沿研究的發現驅動,並以“Eval”(評估體系)作為連接研究與產品的核心度量衡。
Weil將這一過程描述為一個緊密的閉環:
研究發現:基礎研究團隊探索並實現了某種新的模型能力,例如“Deep Research”功能背後的迭代式搜尋與推理能力。
問題定義:產品團隊介入,將這種抽象能力與真實的使用者痛點相結合,將其定義為一個需要解決的具體問題。
量化評估:產品與研究團隊共同建立專屬的“Eval”,將使用者問題的解決程度轉化為可量化、可追蹤的基準指標。
閉環最佳化:研究團隊利用Eval的反饋,針對性地對模型進行後期訓練與最佳化,直至其在該項特定任務上的表現達到產品化標準。
在這個新範式中,“Eval”取代了傳統的需求文件,成為事實上的“產品規格說明書”。Weil指出,建立高品質Eval的能力,特別是針對創意寫作、多步驟任務等主觀、複雜領域的Eval,正成為產品經理的一項核心技能。
然而,建立有效的Eval本身就是一項巨大的挑戰。Weil解釋說,一年前,Eval大多是“非黑即白”的,比如衡量數學能力,因為答案有對錯之分。但現在,隨著模型開始處理更複雜的任務,Eval也必須隨之進化。他提出了兩個難題:如何評估創意寫作的優劣?對於沒有唯一正確答案的領域,如何建立公正、可復現的評分標準?當一個AI Agent嘗試幫你預訂航班或自動化一個複雜流程時,並沒有單一的“正確”執行路徑。如何評估整個過程的質量和效率?
為瞭解決這些問題,團隊不僅要設計Eval,還必須為其配備一個能夠快速、自動評分的系統,以便在模型訓練中實現高效反饋。Weil預計:“為你正在建構的產品建立專屬Eval的能力,將逐漸成為產品經理一項愈發重要的核心技能。”
此外,“系統提示”成為另一個強大的調節槓桿。儘管長期目標是降低使用者對提示工程的依賴,但在當前,精心設計的系統提示是開發團隊在不重新訓練整個模型的前提下,快速修正和微調模型行為的最高效工具。
這個由“研究發現、Eval量化、閉環最佳化”構成的高效引擎,其產出物便是能力日益強大的AI系統,而AI Agent正是其最前沿的體現。
Kevin Weil將AI Agent定義為“能夠獨立完成工作的實體”,它超越了一問一答的模式,能在真實世界中為使用者主動執行任務。在OpenAI的產品矩陣中,選擇“程式設計”作為Agent化的首個主要突破口。
Weil興奮地表示,“我正在處理郵件、在Slack上溝通,做著我白天的本職工作,而一個程式設計Agent正在為我解決真實世界裡的任務。” 更酷的是,這種工作模式具備巨大的平行處理潛力。“如果你有一個Codex Agent為你工作,為什麼不能同時讓10個Codex Agent為你處理10個不同的任務呢?”
做為首個主要突破口,其背後有多重縝密的考量,Weil系統地闡述了為什麼“程式設計”成為AI Agent率先攻克的垂直領域:
內部戰略價值:提升編碼效率能直接加速OpenAI自身的研發迭代,是推動其實現AGI使命的“元能力”。
通用能力的試金石:程式設計涉及高度複雜的邏輯推理,是檢驗和提升模型通用智能水平的理想場景。
結果的可評估性:程式碼的正確性與有效性相對客觀,易於建立清晰的Eval進行衡量與最佳化。
理想的市場條件:開發者是典型的早期採用者,市場接受度高;同時,該領域監管較少,便於快速部署和創新。
以Codex為例,它能夠自主理解程式碼庫、定位問題、編寫程式碼並提交合併請求,這不僅極大地賦能了專業開發者,更預示著一個更為宏大的願景——“讓十億人能夠編寫程式碼”。Weil認為,通過將程式設計這一通用技能大眾化,AI將釋放出巨大的社會創造力。
起初,某個能力被認為是AI無法攻克的。然後,一個模型實現了從0到5%的突破。很快,兩個月後有人達到30%,四個月後達到60%,不出半年,這項能力就被徹底掌握,成為所有模型的基礎功能。Weil說:“一項新技能從‘證明其可能性’到‘哦,AI當然能做這個’的轉變過程異常迅速。我認為,我們對這種驚人的發展速度仍未完全適應。”大平台能力指數級增長,那初創公司還有生存空間嗎?
“Kevin每發一條推文,就有50家初創公司倒閉。” 這個流傳於矽谷的玩笑,精準地捕捉到了AI時代創業者們的集體焦慮。當平台的基礎模型能力日益強大,不斷將原本屬於應用層的功能“內建”時,第三方開發者該何去何從?
面對初創公司的普遍焦慮,Weil提出了一個清晰的生態位法則,其核心思想是:平台的責任是不斷吸納並商品化那些非差異化的底層基礎設施,從而為開發者讓渡出更有價值的創新空間。
他以微軟在Windows 95中內建TCP/IP協議棧為例,說明平台的進化本質上是降低了生態系統內所有參與者的開發成本。基於此,Weil為AI時代的創業者提供了一個明確的“試金石”:
“如果你正在探索模型能力的最前沿,你的產品目前只是勉強可用,但你迫切期待下一代模型的發佈,因為它將讓你的產品大放異彩——那麼,你很可能走在正確的道路上。反之,如果你在為當前模型的弱點修修補補,並畏懼新模型的發佈,那麼你就處在非常危險的境地。”
Weil認為,AI將觸及所有行業、所有垂直領域,為無數的重塑和重構提供了廣闊的舞台。
當被問及與設計師Jony Ive的合作時,Weil透露,Jony Ive的團隊將首先專注於消費級硬體產品,並將在未來對OpenAI的整體設計產生深遠影響。OpenAI與Jony Ive的合作,預示著其對未來互動範式的思考已超越現有硬體。Weil指出,智慧型手機作為當前的主要互動裝置,其形態在功耗、尺寸和互動模式上,已難以承載“環境智能”的未來。一個能時刻伴隨、無縫融入環境的“超級助理”,需要一個全新的硬體載體。
訪談最後,當唄問到“我們什麼時候會交付AGI?”,Weil認為,AGI的到來不會是一個可以被精確標記到“某年某月某日”的突變事件。它是一個漸進的過程,是一個AI能力基線不斷提升的過程。
“正如我們之前討論的,智能是多維度的。今天,在很多領域,AI的能力已遠超人類;但在另一些領域,它的表現又差得可笑。” Weil解釋道,“然而,每當新模型發佈,AI能力的基線就會提升,它在越來越多的任務上達到超人水平。當它在幾乎所有重要方面都達到超人水平時,我們或許就會稱之為AGI。”
我們不會在某天一覺醒來,發現世界已然不同。相反,我們正身處其中,與這項技術共同成長,每一天,都在向那個目標更近一步。 (數字開物)