奧特曼警告AI會讓數十億人類工作無意義,否認打造美國版微信,Sora會考慮收費,自曝自己的臉被玩廢了,Agent將持續一周工作

國慶假期期間,OpenAI 可謂賺足了全球的注意力。

先是各種Sora2 的生成視訊刷屏,然後是三天前掌舵者Sam Altman 在DevDay2025 主題演講中高密度發布了許多利多AI開發者的功能和工具,可以說熱鬧空前。

但這些都不足以用來形容此時此刻OpenAI 的未來藍圖。

在DevDay 期間,這位OpenAI 的掌舵者接受邀請錄製了一期播客,主持人跟他進行了一場非常全面的深度腦暴。

訪談中,Altman 分享了自己對ChatGPT、Sora 的核心優勢和商業模式的考量。他坦承,其實自己一開始也不清楚ChatGPT 的核心優勢是什麼,但如今沒想到「記憶功能」卻成了最大的競爭優勢之一。

而談到Sora的商業模式,他指出現在還為時過早。主要看Sora的使用場景,如果是訊息流,那自然會考慮引入廣告,但如果只是分享聊天,群發,那就是另一種商業模式。

而對於AI開發者最看好的Agentbuilder 工具,Altman 坦言以後真的可以實現Agent 的無程式碼革命。

而Codex 這一類的AI程式設計智能體以後甚至可以連續運作一周,期間都不需要人類監督和回饋。

對於大洋彼岸很火紅的名詞:「workslop」(工作糊料,即看起來挺體面,但實際上很糟糕的交付結果),Altman 認為經濟會自我糾偏,因為人類本身自己也會產出工作糊料。

OpenAI的版圖還有那些?是要打造美國版微信嗎?Altman 一口否認了,他認為微信模式在美國走不通,但的確計畫會在ChatGPT 整合一些新功能。

「如果我們突然把一個『社交型體驗』塞進去,會讓人覺得很怪。 」

“用戶對ChatGPT 的心理預期和他們使用娛樂應用時的狀態完全不同,這兩種體驗放在一起會產生不協調。”

OpenAI 籌劃之中的藏貨還有多少?

訪談中,至少可以探秘出以下幾種:

一、ChatGPT 接下來會整合許多有互動能力的功能;

二、Sora 之後會在半年內探索商業付費模式;

三、新的AI硬體方面,AI語音互動將會是一大值得期待的亮點;

四、Agent方面,OpenAI 已經在籌劃在法律、金融領域版本的Codex。

五、而接下來的GPT-6 建構的設想,他表示最近發布的新基準「GDPval」會考慮在內,會在後訓練中做出相應調整,但大方向不變。

對於AGI,Altman 認為實現它的時刻,不在於某個分數,而是 AI 真正開始為人類創造新知識時。

臨近最後,Altman 也討論了未來的工作情況。他指出,在不久的將來,當今經濟中發生的40% 的任務將由人工智慧完成。 AI 會讓數十億人的工作變得不再是真實的工作。

料還很多,建議大家自行收藏細讀。

最看好ChatGPT內建應用

主持人:Sam,非常感謝你來到這裡。現在是2025 年的DevDay,可以先為我們介紹這次發布的內容,以及你個人最期待的部分嗎?

Sam:其實我對所有內容都很興奮。不過要我挑一個,我想說-ChatGPT 內建應用程式(Apps in ChatGPT)。這其實是我很早就想做的事。剛才我和幾位開發者聊了聊他們用Agent Builder(或Agent Kit)做的項目,真的有不少我自己都想立刻使用的。如果只能選一個,那就是Apps in ChatGPT。

主持人:我也喜歡Agent Builder,不過Apps in ChatGPT 的確很酷。我們可以從這裡聊聊。順便說一句,恭喜你們現在ChatGPT 已經有8 億周活用戶了。

Sam:謝謝,這數字確實令人震驚。 ChatGPT 正在成為一個新的「分發平台」。

主持人:那開發者或創業家要如何利用這次發布的App SDK,在ChatGPT 之上建立產品?

Sam:我認為這還需要一段探索期,去觀察大家最後會怎麼用這些App。例如,人們會直接叫出App 的名字嗎?還是希望ChatGPT 能自動記住他們常用的App 並主動推薦?這些新的分發機制需要開發者自己摸索。但每次我們把東西交給世界時,總是會被實際使用方式所驚喜到。

主持人:我聽說你們今天也會發布文檔,幫助開發者提高被推薦的幾率?

Sam:是的,不過要說明的是,這些都是全新的產品,變化會很快,我們也會邊學邊改。但沒錯,檔案今天就會放出。

Agent Builder 與GPT Builder 的演進

主持人:回到第一次DevDay,兩年前你們發布了GPT Builder,當時引起了不小的轟動。我記得自己是最早做出公開GPT 的開發者之一。這次的Agent Builder,比起當年,有那些突破?

Sam:最大的不同是模型能力的躍升。這22、23 個月的進步實在太驚人了。除此之外,我們也學到了很多關於人們如何想要建構agent 的經驗,包括他們希望能在ChatGPT 以外的服務上建構。讓我印象最深刻的是,現在你能用一個視覺化介面,上傳幾個檔案、連接資料來源、定義目標,幾分鐘內就能部署出一個能做複雜任務的agent。

昨天綵排時我看完整個流程,真是有點震撼——像Codex、Agent Kit 這樣的工具,讓「建構軟體」的速度有了地殼級的變化。我現在還沒完全理解這會帶來多大的影響。

AI Agent 的低程式碼革命

主持人:如果我理解沒錯,現在透過Agent Builder 已經可以實現零程式碼建構agent?

Sam:完全可以。當然,如果你懂一點編程,會做得更細緻更好;但一般的知識型工作者,現在也能自己做agent。

主持人:那這基本上就是「AI Agent 的無代碼革命」了。

Sam:沒錯。你會寫一點程式碼能做更多,但入門門檻已經非常低。我在想這會對下一波創業家、企業會有什麼影響。昨天我看了Romain 的現場演示,真是震撼——這些東西在一年前可能要花很久才能做出來,現在幾乎能「現場生成」。感覺創意的產生速度都跟不上實現的速度了。我還不能完全判斷這意味著什麼,但顯然,軟體的生產速度將大幅提升,而從實驗到改進的周期會越來越短。我們能更快驗證想法、篩選出好點子——只是我還不知道這會改變那些更大的東西。

「零人公司」的賭局

主持人:我聽說你和朋友之間有個賭局,賭什麼時候會出現第一個由agent 經營的十億美元公司? Agent Builder 能帶我們到那個階段嗎?

Sam Altman:還沒那麼快。我們以前的賭博是「第一個一人公司」何時出現;現在大家開始猜「零人公司」要多久。我們還沒正式開盤,但確實很多人在討論。我覺得至少要幾年。不過,光是能認真地討論「零人公司」這個概念,就已經很不可思議了。

讓Agent 一周不出錯地工作,需要什麼

主持人:很多人都說這是“Agent 元年”,但目前的agent 還需要大量人工監督。你覺得什麼時候才能出現能連續工作一周都不需要回饋的agent?

Sam:我覺得Codex 離那不遠了——這話聽起來都像科幻。或許2025 年內還達不到,但我們今天已經看到它能完成「一天級任務」。進步速度快得驚人。我很少會覺得“AI 進步太快”,但在觀察Codex 任務持續時長的提升時,確實有這種感覺。我猜,能持續工作一周的agent,不會太遠。

主持人:要實現那一步,還缺乏什麼技術?

Sam:更聰明的模型、更長的脈絡、更好的記憶系統。

世界變了,但核心優勢的類型沒變

主持人:現在有了這一切工具,如果讓20 歲、剛從史丹佛輟學的你穿越到今天,你會選擇做什麼?又會避免做什麼?

Sam:我前幾天其實剛想過這個問題。我真有點羨慕現在的年輕一代。他們面前的機會空間巨大到難以想像。我已經很多年沒能空出一大段時間去思考“我想做什麼專案”,但我知道,如果我現在20 歲,我一定會有一堆想做的酷東西。今天跟這麼多開發者聊天,看到他們在建造的那些新東西——真的很令人振奮。

主持人:有沒有什麼建議,能幫助開發者在建構這些產品時,找到屬於自己的「獨特優勢」?例如分發管道、資料壁壘,或某種特定工作流程?

Sam:這是個很難抽象回答的問題。我認為最好的獨特優勢,往往是獨屬於你自己、你必須親自摸索出來的東西。我們在OpenAI 身上也花了極大的努力去找出那種差異化優勢。但總體來說,這不是一個「通用解」。真正重要的優勢,往往只在你所在的時機、市場定位、技術方向才成立。而這種探索,本身就構成了創業帶來的獨特價值。

如果要說一條普遍適用的經驗,我會說──邊做邊找,策略是從戰術長出來的。我很喜歡一句商業名言:「讓戰術演變成戰略。」你可以從一些「眼下有效的小事」開始做,而在不斷嘗試的過程中,往往會自然衍生出一個更長遠的戰略方向。

舉個例子,如果你在ChatGPT 推出時問我:「你們未來的核心優勢會是什麼?」我可能會回答:「不知道。」我可以猜一堆,但不會有信心。結果現在看來,「記憶功能」成了我們最大的競爭優勢之一——它讓使用者願意長期留在ChatGPT。而當初我們完全沒想到這一點。所以很多時候,你只是不斷建立功能,然後在某個瞬間突然意識到:“哦,這東西居然能成為我們的長期壁壘。”

主持人:那有沒有一些線索,提示我們現在該往那些「優勢方向」去構建,例如為GPT-6 時代提前佈局?

Sam:那就得你自己去摸索了(笑)。我很樂意那天和你一起腦力激盪一下,因為那會挺有趣的。但老實說,OpenAI 已經佔據了我全部的腦容量,我都沒辦法再認真去想怎麼做新創業計畫了——這點有點遺憾。雖然世界改變了,但企業的核心優勢類型其實沒怎麼變:網路效應、品牌與行銷、用戶數據、市場網路效應……這些仍是競爭力的基礎。不過,建立這些優勢的新“戰術”,會隨著時代變化而更新。

GPT-5 vs Claude:GDPval 檢定結果

主持人:OpenAI 最近發布了一個名為GDPval 的新基準,用來衡量模型在各種知識型工作中執行「經濟上有價值任務」的能力。讓我驚訝的是,GPT-5 的表現排在Claude Opus 之後,而你們依然選擇公開這個結果。你本人對此意外嗎?

Sam:首先,如果我們因為排名第二就不發布,那就真糟糕。我們會在某些領域最好,也會在別的地方被超越。要建立一個能持續進步的文化,關鍵在於坦然承認別人暫時做得更好。我認為Anthropic 在理解企業級使用場景、以及讓模型輸出更優雅的結構化結果方面,做得非常出色。所以我並不驚訝,只是被激勵得想更快追上。

主持人:這次的評測結果,會改變你們建構GPT-6 的方式嗎?

Sam:可能會在後訓練階段帶來一些調整,但整體策略不會因此改變。

我們何時真正實現AGI?

主持人:你最近提過,你對AGI 的定義是「在大多數經濟上有價值的任務中超越人類」。那GDPval 的那個分數會讓你說:「我們已經實現了AGI」?

Sam:我一直在思考這個問題。首先——就像很多人一樣,我對AGI 有多個定義。離它越近,這個概念反而越模糊。不過,對我來說最重要的一點,也是最讓我意外的是──我們終於開始看到模型能進行「原創發現」。例如,它能擴展人類的知識邊界。

現在在X(Twitter)上,你會看到越來越多科學家發文說:模型提出了一個新的假設、發現了一個小規律、或想出一個新的研究思路。這些都還非常微小,我不想誇大,但也不能忽略它的意義──我們正處於AI 發現能力的起點。而我們有理由相信,在未來幾個月乃至幾年內,這方面會迎來加速。這,可能是我最在乎的「AGI 時刻」。它不是某個分數,而是當AI 真正開始為人類創造新知識時

AI 將要解決的科學突破

主持人:有沒有什麼具體的科學突破,是你特別期待AI 能去解決或推動的?

Sam:當然,治癒疾病、發現新的物理定律──那種事情會非常令人振奮。但其實,眼下正在發生的一些“小事”,例如數學領域的進展,也讓我感覺意義非凡。當GPT-4 發佈時,我記得很多人還在爭論「圖靈測試」的定義——但大眾心中的「圖靈測試」一直像是一個遙不可及的目標。然而突然之間,它就被跨越了。而社會的反應基本上是──毫無波瀾。大家驚呼兩周,然後立刻抱怨:「這玩意怎麼不夠快?」、「怎麼不夠聰明?」、「能不能再好一點?」 這其實挺能說明人性的:那個長期以來代表AI 極限的「考驗」被我們一瞬間甩在身後,而人類幾乎瞬間適應了。我覺得接下來也會出現類似的情況──我們會非常快速地習慣AI 進行科學發現。這有點像Waymo(無人駕駛):第一次上車確實怪異,但那種感覺只持續三分鐘,然後就變得理所當然了。

從工作糊料到同意自己形像在Sora上對外公開

主持人:我想插。最近史丹佛有個研究,提出一個新詞-「工作糊料(workslop)」。簡單解釋一下,就是「看起來很體面、其實低品質」的產出。他們調查了一千多位辦公室職員,41% 的人說最近一個月遇到這種來自同事的「AI 糊料」。平均每次清理需要1 小時56 分鐘,每位員工每月因此損失約186 美元。所以問題是:AI 讓一部分人效率提升10 倍,那我們在教育或新進訓練中缺了什麼?為什麼很多人不知道什麼時候該用AI,什麼時候不該用?

Sam:首先得說,很多人類自己也在製造「工作糊料」。這不是AI 獨有的現象——例如那些只製造工作量的郵件,或是毫無意義的會議。其實從很久以前開始,就存在兩類人:一種人用工具提升效率;另一種人用工具為組織製造阻力。 AI 也會一樣──不會例外。但經濟會自我糾偏。那些能用工具提高產出的人和公司,會更有能力塑造未來;反之,那些拖慢效率的,會被邊緣化。當然,每個新工具都有學習曲線,但這次我認為會非常快。

主持人:那OpenAI 是否在教育或訓練上,做些什麼來幫助人們更好地建立「AI 直覺」?

Sam:有的,我們確實在做。但人們總會以他們自己的方式使用工具。我學到的一點是——你可以做出極好的教育內容、培訓課程,但人們一旦發現他們能讓模型“用海盜口音說話”,他們就會去玩這個。不過我們確實在努力,製作大量幫助人們把AI 整合進日常工作流程的內容。在某些場景下,例如Codex,企業的採用非常快速——從試用到深度融合,只需要幾天或幾周。

主持人:說到“糊料”,你現在也是世界上第一個被Sora 做成病毒級meme 的CEO。網路上那些把你「換臉成GPU 盜賊」的視頻,會讓你感到害怕嗎?

Sam:其實比我預想的沒那麼怪。很奇怪的是──看一個影片會覺得不適,但連刷一百個反而沒那麼怪。我記得那時我正在環球出差,有個團隊成員發訊息問我:“我們能不能把你的cameo(出鏡形象)開放訪問?”我當時八秒內就回覆“可以”,其實那應該是個值得深思的問題。但我想,既然我們在做這項新技術,我自己也不願意嘗試,那就太說不過去了。結果我決定開放。之後在飛機上我想,這可能會挺奇怪的。但上線後我醒來一看,整個社群媒體都是meme。我笑了。真的就是那種Waymo 式的體驗——前3 分鐘有點怪,然後就完全習慣了。唯一讓我擔心的,是今天早上有幾家公司發布了「去水印工具」。如果別人能把Sora 的水印去掉,用我的形象發視頻,這可能會影響我的個人品牌。那我為什麼還要開放自己的cameo 呢?

主持人:所以你的意思是,提前發布有防護的版本,其實是為了幫助社會提前適應?

Sam:沒錯。我們經常預見到某項技術遲早會被廣泛開放——幾個月或幾年後,任何人都能用開源模型生成視頻,甚至可以讓“你”做任何事。社會終會適應,但我們希望透過提前發布+ 加入防護,讓社會和技術能夠共同進化。文字時代我們已經這麼做了。影片更難,因為它帶來的情緒衝擊更強。但最終我們會學會適應。未來網路上會充斥著各種“假影片”,很多都沒有浮水印、也無法追溯來源。這種情況一定會發生。讓社會對它提前“免疫”,是有價值的。

主持人:那最終目標是做出「真假難辨」的AI 影片嗎?

Sam:最終目標還是AGI(通用人工智慧)。高品質影片只是其中的重要一步。它能推動空間推理、世界模型學習,甚至是機器人研究的進展。我認為「生成式影片」是好事。我不希望未來人機互動只侷限於文字。我很期待一個新形態的介面——你能在即時視訊串流中與系統互動,它會動態生成屬於你的介面與體驗。所以,是的,高品質影片是通往真正AGI 的寶貴一步。

考慮Sora影片生成付費

主持人:你們上周五發布了一篇部落格,說正在考慮為允許自己肖像cameo(客串)的視頻創作者推出分成機制。能透露下具體怎麼運作嗎?

Sam:就像很多新產品一樣-一旦上線,你總會發現使用者的使用方式和我們想像的不一樣。我們原本以為,Cameo 主要會由少數創作者製作一些很酷、精緻、有創意的影片內容,然後被更大範圍的觀眾觀看和分享。確實有一些這樣的案例,但我們也看到大量用戶在為自己、或幾個朋友製作視頻,在群聊中互相分享。我還不確定這是不是一時的新鮮感,但如果這種使用方式真的能持續下去,那它將徹底改變我們對計算量與用戶參與度之間關係的模型

未來,我們可能會允許用戶為影片生成付費。例如你想一天做100 個表情包影片發給朋友,那就可以直接付費生成;如果影片裡出現某位名人,而那位名人也同意授權,那他們也可以按生成次數獲得分成。當然,現在這個產品才上線六天,所以我不敢太早下定論——也許這些用法只是階段性的熱度。但至少目前看,這確實是一個非常大的使用場景。

主持人:你們有沒有考慮過在Sora 應用程式裡加入廣告?

Sam Altman:目前還沒有,但那確實是一個值得探索的方向──雖然也挺讓人害怕的(笑)。和ChatGPT 不同,ChatGPT 的商業模式是訂閱制,但如果Sora 未來的主要使用場景是用戶刷視訊串流、看搞笑或美學內容,那麼廣告模型會更自然。但如果用戶主要是在私訊或群組聊天中分享影片(DM 模式),那可能就該採用不同的商業邏輯。樂觀一點的話,我希望在今年年底前(或保守點,明年第一季)我們能看清產品真正的使用形態,到那時就能決定合適的商業模式。我個人認為-以影片產生次數收費是合理的嘗試,其他想法還得看產品演化方向再定。

工作的未來:被AI 改寫的十億個職位

主持人:我常用「農民的比喻」來形容現在的改變。如果你在50 年前告訴農夫:未來會有個叫「網路」的東西,能創造出十億個新職位——比如程式設計師、行銷人員、內容創作者——他一定不會相信。現在我們進入“智慧時代”,很多人認為也會有大量新崗位誕生。但不同的是:網路時代是從零創造新職位,而智慧時代則可能先影響現有的知識型崗位,然後才逐步催生新的機會。這點你會擔心嗎?

Sam:非常擔心。你提到了一個讓我又稍微放心、更焦慮的問題。那位農民,不但不會相信未來的事情,他可能還會覺得我們今天的工作——比如你採訪我、我做科技公司——根本不算「真正的工作」。在他看來,「真正的工作」是種地、養娃、維持生命。我們這些現代人,只是在玩“虛擬的遊戲”,讓自己感覺重要。也許再過幾十年,未來的人回頭看我們現在的工作,也會說:“那不算真正的工作,只是比遊戲稍微認真一點。”

所以我完全能想像——「工作」這個概念會發生深刻的變化。人們依然會找到意義,但「有意義的事」未必還像現在這樣和「勞動」綁定。我認為社會契約也會隨之重構,尤其是如果這場轉型來的很快的話。短期確實會有陣痛,但我依然相信──人類的創造慾和行動欲是不會消失的。我們總是會找到值得做的新事情。

AGI 之後:人類會去那裡?

主持人:那在AGI 之後,你覺得人類會把注意力轉向什麼?太空?腦機介面?

Sam:我希望是一切方向都能同時展開。太空探索當然很酷,但也許你、我,或其他人會被別的事情吸引。我希望未來的世界是一塊廣闊無邊的可能性畫布,每個人都能在上面創造出屬於自己的新事物。

全球AI 安全框架

主持人:如果你明天可以訂定一項全球政策,會是什麼?

Sam:要把這個問題縮小到一個具體點其實挺難的。但我腦海裡反覆浮現的,是關於AI 監管的那場大辯論:到底這是好事還是壞事?會不會反而讓大公司獲益太多?我能理解各方的觀點。不過我確實認為,當我們進入「超強模型」的階段時,應該要有一個全球性的框架來降低災難性風險──至少針對最前線的那部分,要有一套機制去思考、評估最嚴重的安全問題。如果能有一個全球政策來處理這些問題,那會是一件好事。

主持人:可以大概描述一下這個框架的輪廓嗎?

Sam:我覺得可以先從一個完善的測驗體系開始。

否認打造美國版微信

主持人:還有一點我想談的是微信。在中國,它幾乎是一款「萬用應用程式」——可以購物、刷社群媒體、聊天,幾乎所有功能都集中在裡面。現在看起來,ChatGPT 也有購物、網頁搜尋、Sora 等等新功能。你是不是在嘗試打造一個「美國版微信」?

Sam:不是。有很多原因讓我認為那種模式在美國市場行不通。我們不是要做「萬能App」,而是想打造一個真正出色的AI 超級助手。

主持人:那為什麼要把功能分開發布?例如Sora 為什麼是單獨的App,而不是直接整合進ChatGPT?

Sam:因為ChatGPT 對很多人來說,已經成了他們最個人化的帳戶。如果我們突然把一個「社交型體驗」塞進去,會讓人覺得很怪。當然,有一些功能例如訊息協作是合理的,因為使用者確實會互相分享內容、一起創作。但使用者對ChatGPT 的心理預期和使用娛樂應用程式時的狀態完全不同,這兩種體驗放在一起會產生不協調。不過我們確實會把很多功能整合進ChatGPT,只是會分階段來做。

關於Agent 建構:看法法律、金融版本的Codex

主持人:你覺得有那些特別重要或有潛力的智能體(Agent)是你最期待看到的?

Sam:我會參考Codex 的影響力去思考其他產業。例如,能不能有一個「法律版Codex」、一個「金融建範本Codex」?現在已經有很棒的新創公司在嘗試這些方向。但如果科技持續成熟,能讓這些產業的AI 體驗像Codex 之於程式設計那樣強大,那將是我最興奮的事。我甚至能想像未來,一個人就能透過與一組智能體的對話來創建一家公司。目前的Agent Builder、Agent Kit 還沒到那個水平,但我能看到從現在到那一步的路徑

我們低估了語音設備

主持人:你在主題演講中提到,語音可能是AI 或Agent 的「最終互動介面」,能展開講講嗎?

Sam:我不會說它是最終介面,因為在很多場景下語音並不合適。例如你在地鐵上,對著手機講話就挺尷尬的。但在很多時候,語音又是最自然的介面。廣義來說,「語言」才是核心互動方式,有時是語音,有時是打字。我們曾經低估了語音設備。大家喜歡拿智慧音箱開玩笑,但其實很多人真的在用,也很喜歡它們——只是它們的AI 水平還不夠好,生態也不完善。如果未來你能直接「對設備說話,它就精準執行並不再打擾你」,那才是我真正想用的計算機。

新的I/O 硬體設備:留足創造空間

主持人:那你們在做的I/O 設備呢?是否也會以語音為主要互動?

Sam:那還需要一些時間。要在高品質、高規模的前提下打造一種全新的電腦使用方式,我們需要留出足夠的創造空間。我們現在確實有一些很令人興奮的想法,但還沒準備好公開討論。短期內也不會公佈,但我們會努力讓它「值得等待」。

主持人:好的,這就是我所有的問題了。

Sam:謝謝,能聊得這麼深入我也很高興。 (51CTO技術棧)