奧特曼警告AI會讓數十億人類工作無意義，否認打造美國版微信，Sora會考慮收費，自曝自己的臉被玩廢了，Agent將持續一周工作

2025/10/11

•

國慶假期期間，OpenAI 可謂賺足了全球的注意力。

先是各種Sora2 的生成視訊刷屏，然後是三天前掌舵者Sam Altman 在DevDay2025 主題演講中高密度發布了許多利多AI開發者的功能和工具，可以說熱鬧空前。

但這些都不足以用來形容此時此刻OpenAI 的未來藍圖。

在DevDay 期間，這位OpenAI 的掌舵者接受邀請錄製了一期播客，主持人跟他進行了一場非常全面的深度腦暴。

訪談中，Altman 分享了自己對ChatGPT、Sora 的核心優勢和商業模式的考量。他坦承，其實自己一開始也不清楚ChatGPT 的核心優勢是什麼，但如今沒想到「記憶功能」卻成了最大的競爭優勢之一。

而談到Sora的商業模式，他指出現在還為時過早。主要看Sora的使用場景，如果是訊息流，那自然會考慮引入廣告，但如果只是分享聊天，群發，那就是另一種商業模式。

而對於AI開發者最看好的Agentbuilder 工具，Altman 坦言以後真的可以實現Agent 的無程式碼革命。

而Codex 這一類的AI程式設計智能體以後甚至可以連續運作一周，期間都不需要人類監督和回饋。

對於大洋彼岸很火紅的名詞：「workslop」（工作糊料，即看起來挺體面，但實際上很糟糕的交付結果），Altman 認為經濟會自我糾偏，因為人類本身自己也會產出工作糊料。

OpenAI的版圖還有那些？是要打造美國版微信嗎？Altman 一口否認了，他認為微信模式在美國走不通，但的確計畫會在ChatGPT 整合一些新功能。

「如果我們突然把一個『社交型體驗』塞進去，會讓人覺得很怪。」

“用戶對ChatGPT 的心理預期和他們使用娛樂應用時的狀態完全不同，這兩種體驗放在一起會產生不協調。”

OpenAI 籌劃之中的藏貨還有多少？

訪談中，至少可以探秘出以下幾種：

一、ChatGPT 接下來會整合許多有互動能力的功能；

二、Sora 之後會在半年內探索商業付費模式；

三、新的AI硬體方面，AI語音互動將會是一大值得期待的亮點；

四、Agent方面，OpenAI 已經在籌劃在法律、金融領域版本的Codex。

五、而接下來的GPT-6 建構的設想，他表示最近發布的新基準「GDPval」會考慮在內，會在後訓練中做出相應調整，但大方向不變。

對於AGI，Altman 認為實現它的時刻，不在於某個分數，而是 AI 真正開始為人類創造新知識時。

臨近最後，Altman 也討論了未來的工作情況。他指出，在不久的將來，當今經濟中發生的40% 的任務將由人工智慧完成。 AI 會讓數十億人的工作變得不再是真實的工作。

料還很多，建議大家自行收藏細讀。

最看好ChatGPT內建應用

主持人：Sam，非常感謝你來到這裡。現在是2025 年的DevDay，可以先為我們介紹這次發布的內容，以及你個人最期待的部分嗎？

Sam：其實我對所有內容都很興奮。不過要我挑一個，我想說－ChatGPT 內建應用程式（Apps in ChatGPT）。這其實是我很早就想做的事。剛才我和幾位開發者聊了聊他們用Agent Builder（或Agent Kit）做的項目，真的有不少我自己都想立刻使用的。如果只能選一個，那就是Apps in ChatGPT。

主持人：我也喜歡Agent Builder，不過Apps in ChatGPT 的確很酷。我們可以從這裡聊聊。順便說一句，恭喜你們現在ChatGPT 已經有8 億周活用戶了。

Sam：謝謝，這數字確實令人震驚。 ChatGPT 正在成為一個新的「分發平台」。

主持人：那開發者或創業家要如何利用這次發布的App SDK，在ChatGPT 之上建立產品？

Sam：我認為這還需要一段探索期，去觀察大家最後會怎麼用這些App。例如，人們會直接叫出App 的名字嗎？還是希望ChatGPT 能自動記住他們常用的App 並主動推薦？這些新的分發機制需要開發者自己摸索。但每次我們把東西交給世界時，總是會被實際使用方式所驚喜到。

主持人：我聽說你們今天也會發布文檔，幫助開發者提高被推薦的幾率？

Sam：是的，不過要說明的是，這些都是全新的產品，變化會很快，我們也會邊學邊改。但沒錯，檔案今天就會放出。

Agent Builder 與GPT Builder 的演進

主持人：回到第一次DevDay，兩年前你們發布了GPT Builder，當時引起了不小的轟動。我記得自己是最早做出公開GPT 的開發者之一。這次的Agent Builder，比起當年，有那些突破？

Sam：最大的不同是模型能力的躍升。這22、23 個月的進步實在太驚人了。除此之外，我們也學到了很多關於人們如何想要建構agent 的經驗，包括他們希望能在ChatGPT 以外的服務上建構。讓我印象最深刻的是，現在你能用一個視覺化介面，上傳幾個檔案、連接資料來源、定義目標，幾分鐘內就能部署出一個能做複雜任務的agent。

昨天綵排時我看完整個流程，真是有點震撼——像Codex、Agent Kit 這樣的工具，讓「建構軟體」的速度有了地殼級的變化。我現在還沒完全理解這會帶來多大的影響。

AI Agent 的低程式碼革命

主持人：如果我理解沒錯，現在透過Agent Builder 已經可以實現零程式碼建構agent？

Sam：完全可以。當然，如果你懂一點編程，會做得更細緻更好；但一般的知識型工作者，現在也能自己做agent。

主持人：那這基本上就是「AI Agent 的無代碼革命」了。

Sam：沒錯。你會寫一點程式碼能做更多，但入門門檻已經非常低。我在想這會對下一波創業家、企業會有什麼影響。昨天我看了Romain 的現場演示，真是震撼——這些東西在一年前可能要花很久才能做出來，現在幾乎能「現場生成」。感覺創意的產生速度都跟不上實現的速度了。我還不能完全判斷這意味著什麼，但顯然，軟體的生產速度將大幅提升，而從實驗到改進的周期會越來越短。我們能更快驗證想法、篩選出好點子——只是我還不知道這會改變那些更大的東西。

「零人公司」的賭局

主持人：我聽說你和朋友之間有個賭局，賭什麼時候會出現第一個由agent 經營的十億美元公司？ Agent Builder 能帶我們到那個階段嗎？

Sam Altman：還沒那麼快。我們以前的賭博是「第一個一人公司」何時出現；現在大家開始猜「零人公司」要多久。我們還沒正式開盤，但確實很多人在討論。我覺得至少要幾年。不過，光是能認真地討論「零人公司」這個概念，就已經很不可思議了。

讓Agent 一周不出錯地工作，需要什麼

主持人：很多人都說這是“Agent 元年”，但目前的agent 還需要大量人工監督。你覺得什麼時候才能出現能連續工作一周都不需要回饋的agent？

Sam：我覺得Codex 離那不遠了——這話聽起來都像科幻。或許2025 年內還達不到，但我們今天已經看到它能完成「一天級任務」。進步速度快得驚人。我很少會覺得“AI 進步太快”，但在觀察Codex 任務持續時長的提升時，確實有這種感覺。我猜，能持續工作一周的agent，不會太遠。

主持人：要實現那一步，還缺乏什麼技術？

Sam：更聰明的模型、更長的脈絡、更好的記憶系統。

世界變了，但核心優勢的類型沒變

主持人：現在有了這一切工具，如果讓20 歲、剛從史丹佛輟學的你穿越到今天，你會選擇做什麼？又會避免做什麼？

Sam：我前幾天其實剛想過這個問題。我真有點羨慕現在的年輕一代。他們面前的機會空間巨大到難以想像。我已經很多年沒能空出一大段時間去思考“我想做什麼專案”，但我知道，如果我現在20 歲，我一定會有一堆想做的酷東西。今天跟這麼多開發者聊天，看到他們在建造的那些新東西——真的很令人振奮。

主持人：有沒有什麼建議，能幫助開發者在建構這些產品時，找到屬於自己的「獨特優勢」？例如分發管道、資料壁壘，或某種特定工作流程？

Sam：這是個很難抽象回答的問題。我認為最好的獨特優勢，往往是獨屬於你自己、你必須親自摸索出來的東西。我們在OpenAI 身上也花了極大的努力去找出那種差異化優勢。但總體來說，這不是一個「通用解」。真正重要的優勢，往往只在你所在的時機、市場定位、技術方向才成立。而這種探索，本身就構成了創業帶來的獨特價值。

如果要說一條普遍適用的經驗，我會說──邊做邊找，策略是從戰術長出來的。我很喜歡一句商業名言：「讓戰術演變成戰略。」你可以從一些「眼下有效的小事」開始做，而在不斷嘗試的過程中，往往會自然衍生出一個更長遠的戰略方向。

舉個例子，如果你在ChatGPT 推出時問我：「你們未來的核心優勢會是什麼？」我可能會回答：「不知道。」我可以猜一堆，但不會有信心。結果現在看來，「記憶功能」成了我們最大的競爭優勢之一——它讓使用者願意長期留在ChatGPT。而當初我們完全沒想到這一點。所以很多時候，你只是不斷建立功能，然後在某個瞬間突然意識到：“哦，這東西居然能成為我們的長期壁壘。”

主持人：那有沒有一些線索，提示我們現在該往那些「優勢方向」去構建，例如為GPT-6 時代提前佈局？

Sam：那就得你自己去摸索了（笑）。我很樂意那天和你一起腦力激盪一下，因為那會挺有趣的。但老實說，OpenAI 已經佔據了我全部的腦容量，我都沒辦法再認真去想怎麼做新創業計畫了——這點有點遺憾。雖然世界改變了，但企業的核心優勢類型其實沒怎麼變：網路效應、品牌與行銷、用戶數據、市場網路效應……這些仍是競爭力的基礎。不過，建立這些優勢的新“戰術”，會隨著時代變化而更新。

GPT-5 vs Claude：GDPval 檢定結果

主持人：OpenAI 最近發布了一個名為GDPval 的新基準，用來衡量模型在各種知識型工作中執行「經濟上有價值任務」的能力。讓我驚訝的是，GPT-5 的表現排在Claude Opus 之後，而你們依然選擇公開這個結果。你本人對此意外嗎？

Sam：首先，如果我們因為排名第二就不發布，那就真糟糕。我們會在某些領域最好，也會在別的地方被超越。要建立一個能持續進步的文化，關鍵在於坦然承認別人暫時做得更好。我認為Anthropic 在理解企業級使用場景、以及讓模型輸出更優雅的結構化結果方面，做得非常出色。所以我並不驚訝，只是被激勵得想更快追上。

主持人：這次的評測結果，會改變你們建構GPT-6 的方式嗎？

Sam：可能會在後訓練階段帶來一些調整，但整體策略不會因此改變。

我們何時真正實現AGI？

主持人：你最近提過，你對AGI 的定義是「在大多數經濟上有價值的任務中超越人類」。那GDPval 的那個分數會讓你說：「我們已經實現了AGI」？

Sam：我一直在思考這個問題。首先——就像很多人一樣，我對AGI 有多個定義。離它越近，這個概念反而越模糊。不過，對我來說最重要的一點，也是最讓我意外的是──我們終於開始看到模型能進行「原創發現」。例如，它能擴展人類的知識邊界。

現在在X（Twitter）上，你會看到越來越多科學家發文說：模型提出了一個新的假設、發現了一個小規律、或想出一個新的研究思路。這些都還非常微小，我不想誇大，但也不能忽略它的意義──我們正處於AI 發現能力的起點。而我們有理由相信，在未來幾個月乃至幾年內，這方面會迎來加速。這，可能是我最在乎的「AGI 時刻」。它不是某個分數，而是當AI 真正開始為人類創造新知識時。

AI 將要解決的科學突破

主持人：有沒有什麼具體的科學突破，是你特別期待AI 能去解決或推動的？

Sam：當然，治癒疾病、發現新的物理定律──那種事情會非常令人振奮。但其實，眼下正在發生的一些“小事”，例如數學領域的進展，也讓我感覺意義非凡。當GPT-4 發佈時，我記得很多人還在爭論「圖靈測試」的定義——但大眾心中的「圖靈測試」一直像是一個遙不可及的目標。然而突然之間，它就被跨越了。而社會的反應基本上是──毫無波瀾。大家驚呼兩周，然後立刻抱怨：「這玩意怎麼不夠快？」、「怎麼不夠聰明？」、「能不能再好一點？」 這其實挺能說明人性的：那個長期以來代表AI 極限的「考驗」被我們一瞬間甩在身後，而人類幾乎瞬間適應了。我覺得接下來也會出現類似的情況──我們會非常快速地習慣AI 進行科學發現。這有點像Waymo（無人駕駛）：第一次上車確實怪異，但那種感覺只持續三分鐘，然後就變得理所當然了。

從工作糊料到同意自己形像在Sora上對外公開

主持人：我想插。最近史丹佛有個研究，提出一個新詞－「工作糊料（workslop）」。簡單解釋一下，就是「看起來很體面、其實低品質」的產出。他們調查了一千多位辦公室職員，41% 的人說最近一個月遇到這種來自同事的「AI 糊料」。平均每次清理需要1 小時56 分鐘，每位員工每月因此損失約186 美元。所以問題是：AI 讓一部分人效率提升10 倍，那我們在教育或新進訓練中缺了什麼？為什麼很多人不知道什麼時候該用AI，什麼時候不該用？

Sam：首先得說，很多人類自己也在製造「工作糊料」。這不是AI 獨有的現象——例如那些只製造工作量的郵件，或是毫無意義的會議。其實從很久以前開始，就存在兩類人：一種人用工具提升效率；另一種人用工具為組織製造阻力。 AI 也會一樣──不會例外。但經濟會自我糾偏。那些能用工具提高產出的人和公司，會更有能力塑造未來；反之，那些拖慢效率的，會被邊緣化。當然，每個新工具都有學習曲線，但這次我認為會非常快。

主持人：那OpenAI 是否在教育或訓練上，做些什麼來幫助人們更好地建立「AI 直覺」？

Sam：有的，我們確實在做。但人們總會以他們自己的方式使用工具。我學到的一點是——你可以做出極好的教育內容、培訓課程，但人們一旦發現他們能讓模型“用海盜口音說話”，他們就會去玩這個。不過我們確實在努力，製作大量幫助人們把AI 整合進日常工作流程的內容。在某些場景下，例如Codex，企業的採用非常快速——從試用到深度融合，只需要幾天或幾周。

主持人：說到“糊料”，你現在也是世界上第一個被Sora 做成病毒級meme 的CEO。網路上那些把你「換臉成GPU 盜賊」的視頻，會讓你感到害怕嗎？

Sam：其實比我預想的沒那麼怪。很奇怪的是──看一個影片會覺得不適，但連刷一百個反而沒那麼怪。我記得那時我正在環球出差，有個團隊成員發訊息問我：“我們能不能把你的cameo（出鏡形象）開放訪問？”我當時八秒內就回覆“可以”，其實那應該是個值得深思的問題。但我想，既然我們在做這項新技術，我自己也不願意嘗試，那就太說不過去了。結果我決定開放。之後在飛機上我想，這可能會挺奇怪的。但上線後我醒來一看，整個社群媒體都是meme。我笑了。真的就是那種Waymo 式的體驗——前3 分鐘有點怪，然後就完全習慣了。唯一讓我擔心的，是今天早上有幾家公司發布了「去水印工具」。如果別人能把Sora 的水印去掉，用我的形象發視頻，這可能會影響我的個人品牌。那我為什麼還要開放自己的cameo 呢？

主持人：所以你的意思是，提前發布有防護的版本，其實是為了幫助社會提前適應？

Sam：沒錯。我們經常預見到某項技術遲早會被廣泛開放——幾個月或幾年後，任何人都能用開源模型生成視頻，甚至可以讓“你”做任何事。社會終會適應，但我們希望透過提前發布+ 加入防護，讓社會和技術能夠共同進化。文字時代我們已經這麼做了。影片更難，因為它帶來的情緒衝擊更強。但最終我們會學會適應。未來網路上會充斥著各種“假影片”，很多都沒有浮水印、也無法追溯來源。這種情況一定會發生。讓社會對它提前“免疫”，是有價值的。

主持人：那最終目標是做出「真假難辨」的AI 影片嗎？

Sam：最終目標還是AGI（通用人工智慧）。高品質影片只是其中的重要一步。它能推動空間推理、世界模型學習，甚至是機器人研究的進展。我認為「生成式影片」是好事。我不希望未來人機互動只侷限於文字。我很期待一個新形態的介面——你能在即時視訊串流中與系統互動，它會動態生成屬於你的介面與體驗。所以，是的，高品質影片是通往真正AGI 的寶貴一步。

考慮Sora影片生成付費

主持人：你們上周五發布了一篇部落格，說正在考慮為允許自己肖像cameo（客串）的視頻創作者推出分成機制。能透露下具體怎麼運作嗎？

Sam：就像很多新產品一樣－一旦上線，你總會發現使用者的使用方式和我們想像的不一樣。我們原本以為，Cameo 主要會由少數創作者製作一些很酷、精緻、有創意的影片內容，然後被更大範圍的觀眾觀看和分享。確實有一些這樣的案例，但我們也看到大量用戶在為自己、或幾個朋友製作視頻，在群聊中互相分享。我還不確定這是不是一時的新鮮感，但如果這種使用方式真的能持續下去，那它將徹底改變我們對計算量與用戶參與度之間關係的模型。

未來，我們可能會允許用戶為影片生成付費。例如你想一天做100 個表情包影片發給朋友，那就可以直接付費生成；如果影片裡出現某位名人，而那位名人也同意授權，那他們也可以按生成次數獲得分成。當然，現在這個產品才上線六天，所以我不敢太早下定論——也許這些用法只是階段性的熱度。但至少目前看，這確實是一個非常大的使用場景。

主持人：你們有沒有考慮過在Sora 應用程式裡加入廣告？

Sam Altman：目前還沒有，但那確實是一個值得探索的方向──雖然也挺讓人害怕的（笑）。和ChatGPT 不同，ChatGPT 的商業模式是訂閱制，但如果Sora 未來的主要使用場景是用戶刷視訊串流、看搞笑或美學內容，那麼廣告模型會更自然。但如果用戶主要是在私訊或群組聊天中分享影片（DM 模式），那可能就該採用不同的商業邏輯。樂觀一點的話，我希望在今年年底前（或保守點，明年第一季）我們能看清產品真正的使用形態，到那時就能決定合適的商業模式。我個人認為－以影片產生次數收費是合理的嘗試，其他想法還得看產品演化方向再定。

工作的未來：被AI 改寫的十億個職位

主持人：我常用「農民的比喻」來形容現在的改變。如果你在50 年前告訴農夫：未來會有個叫「網路」的東西，能創造出十億個新職位——比如程式設計師、行銷人員、內容創作者——他一定不會相信。現在我們進入“智慧時代”，很多人認為也會有大量新崗位誕生。但不同的是：網路時代是從零創造新職位，而智慧時代則可能先影響現有的知識型崗位，然後才逐步催生新的機會。這點你會擔心嗎？

Sam：非常擔心。你提到了一個讓我又稍微放心、更焦慮的問題。那位農民，不但不會相信未來的事情，他可能還會覺得我們今天的工作——比如你採訪我、我做科技公司——根本不算「真正的工作」。在他看來，「真正的工作」是種地、養娃、維持生命。我們這些現代人，只是在玩“虛擬的遊戲”，讓自己感覺重要。也許再過幾十年，未來的人回頭看我們現在的工作，也會說：“那不算真正的工作，只是比遊戲稍微認真一點。”

所以我完全能想像——「工作」這個概念會發生深刻的變化。人們依然會找到意義，但「有意義的事」未必還像現在這樣和「勞動」綁定。我認為社會契約也會隨之重構，尤其是如果這場轉型來的很快的話。短期確實會有陣痛，但我依然相信──人類的創造慾和行動欲是不會消失的。我們總是會找到值得做的新事情。

AGI 之後：人類會去那裡？

主持人：那在AGI 之後，你覺得人類會把注意力轉向什麼？太空？腦機介面？

Sam：我希望是一切方向都能同時展開。太空探索當然很酷，但也許你、我，或其他人會被別的事情吸引。我希望未來的世界是一塊廣闊無邊的可能性畫布，每個人都能在上面創造出屬於自己的新事物。

全球AI 安全框架

主持人：如果你明天可以訂定一項全球政策，會是什麼？

Sam：要把這個問題縮小到一個具體點其實挺難的。但我腦海裡反覆浮現的，是關於AI 監管的那場大辯論：到底這是好事還是壞事？會不會反而讓大公司獲益太多？我能理解各方的觀點。不過我確實認為，當我們進入「超強模型」的階段時，應該要有一個全球性的框架來降低災難性風險──至少針對最前線的那部分，要有一套機制去思考、評估最嚴重的安全問題。如果能有一個全球政策來處理這些問題，那會是一件好事。

主持人：可以大概描述一下這個框架的輪廓嗎？

Sam：我覺得可以先從一個完善的測驗體系開始。

否認打造美國版微信

主持人：還有一點我想談的是微信。在中國，它幾乎是一款「萬用應用程式」——可以購物、刷社群媒體、聊天，幾乎所有功能都集中在裡面。現在看起來，ChatGPT 也有購物、網頁搜尋、Sora 等等新功能。你是不是在嘗試打造一個「美國版微信」？

Sam：不是。有很多原因讓我認為那種模式在美國市場行不通。我們不是要做「萬能App」，而是想打造一個真正出色的AI 超級助手。

主持人：那為什麼要把功能分開發布？例如Sora 為什麼是單獨的App，而不是直接整合進ChatGPT？

Sam：因為ChatGPT 對很多人來說，已經成了他們最個人化的帳戶。如果我們突然把一個「社交型體驗」塞進去，會讓人覺得很怪。當然，有一些功能例如訊息協作是合理的，因為使用者確實會互相分享內容、一起創作。但使用者對ChatGPT 的心理預期和使用娛樂應用程式時的狀態完全不同，這兩種體驗放在一起會產生不協調。不過我們確實會把很多功能整合進ChatGPT，只是會分階段來做。

關於Agent 建構：看法法律、金融版本的Codex

主持人：你覺得有那些特別重要或有潛力的智能體（Agent）是你最期待看到的？

Sam：我會參考Codex 的影響力去思考其他產業。例如，能不能有一個「法律版Codex」、一個「金融建範本Codex」？現在已經有很棒的新創公司在嘗試這些方向。但如果科技持續成熟，能讓這些產業的AI 體驗像Codex 之於程式設計那樣強大，那將是我最興奮的事。我甚至能想像未來，一個人就能透過與一組智能體的對話來創建一家公司。目前的Agent Builder、Agent Kit 還沒到那個水平，但我能看到從現在到那一步的路徑。

我們低估了語音設備

主持人：你在主題演講中提到，語音可能是AI 或Agent 的「最終互動介面」，能展開講講嗎？

Sam：我不會說它是最終介面，因為在很多場景下語音並不合適。例如你在地鐵上，對著手機講話就挺尷尬的。但在很多時候，語音又是最自然的介面。廣義來說，「語言」才是核心互動方式，有時是語音，有時是打字。我們曾經低估了語音設備。大家喜歡拿智慧音箱開玩笑，但其實很多人真的在用，也很喜歡它們——只是它們的AI 水平還不夠好，生態也不完善。如果未來你能直接「對設備說話，它就精準執行並不再打擾你」，那才是我真正想用的計算機。

新的I/O 硬體設備：留足創造空間

主持人：那你們在做的I/O 設備呢？是否也會以語音為主要互動？

Sam：那還需要一些時間。要在高品質、高規模的前提下打造一種全新的電腦使用方式，我們需要留出足夠的創造空間。我們現在確實有一些很令人興奮的想法，但還沒準備好公開討論。短期內也不會公佈，但我們會努力讓它「值得等待」。

主持人：好的，這就是我所有的問題了。

Sam：謝謝，能聊得這麼深入我也很高興。（51CTO技術棧）