奧特曼回應一切:ChatGPT不是美國版微信,Sora是為假視訊時代「打預防針」|附萬字採訪

我們已經可以認真討論「零人公司」這件事了。

2025 年 DevDay 現場,OpenAI CEO Sam Altman 在接受博主 Rowan Cheung 的採訪時拋出了這個觀點。語氣輕鬆,但份量不輕。

資料支撐著他的底氣:ChatGPT 使用者周活躍使用者突破 8 億,周活躍開發者突破 400 萬,最近發佈的 AgentKit 讓普通人幾分鐘就能搭建複雜 Agent,AI 也開始在數學和科學領域做出「小小的發現」。

這些成就背後藏著一個更深的問題:當 AI 能完成越來越多的工作,「工作」本身還意味著什麼?在 Altman 看來,50 年前的農民無法想像坐在辦公桌前敲鍵盤也能叫工作, 就像我們現在也無法想像未來人類會把時間花在那些事情上。

不同的是,這次轉變的速度可能快到讓人措手不及。

整場訪談中,Altman 展現出一種難得的坦誠。他承認 OpenAI 在某些測試上輸給了競爭對手, 承認提前發佈 Sora 是為了讓社會接受假視訊的衝擊, 承認「AI slop」(AI 垃圾) 確實是個問題——但話鋒一轉,他補充道:人類自己也一直在製造爛活兒。

採訪最後,Altman 耐人尋味地表示,他很羨慕現在 20 歲的創業者,因為有了 AI,機會空間「實在太廣了」。

採訪省流版:

關於產品發佈和未來方向

核心重點是智能體(Agent):他個人對 Agent 的方向最感興趣,並認為將 Apps 與 ChatGPT 結合會非常強大。

Agent Builder 是革命性的:他認為從 GPT Builder 到 Agent Builder 的最大飛躍是模型本身能力的巨大提升。現在的 Agent Builder 實現了「無程式碼革命」,讓普通知識工作者也能輕鬆建構複雜的智能體系統,這是軟體開發領域地震式的變化。

語音互動潛力巨大:他不認為語音是唯一的最終互動方式,但在許多場景下是一種非常自然、被低估的互動方式。當前智能音箱體驗不佳是因其背後的 AI 不夠強大,而非語音互動本身的問題。

關於 AI 的發展和影響

開發速度將極大提升:AI 工具將使軟體開發周期一降再降,讓創業者可以極快地測試和迭代想法。

自主智能體即將到來:他認為,像 Code Interpreter 這樣能獨立完成「一周工作量」的智能體,可能很快就能實現,並非遙不可及的目標。技術突破的關鍵在於更聰明的模型、更長的上下文處理能力和更好的記憶系統。

AGI 的核心是發現新知識:對他而言,AGI 最重要的衡量標準已不是通過某個測試,而是 AI 開始具備「發現新知識」並擴展人類知識邊界的能力。他對此感到非常樂觀。

社會將快速適應 AI:他以「圖靈測試」被超越後社會迅速適應為例,認為人類也會很快習慣 AI 做出科學發現,以及適應由 AI 生成的、真假難辨的視訊內容。

關於創業和商業模式

創業者的獨特優勢是在實踐中發現的:他建議創業者從「有用、能跑得通」的事情做起,在過程中逐步發現並形成自己的長期優勢(護城河),就像 ChatGPT 的「記憶」功能一樣,是事後才發現其巨大價值的。

OpenAI 不想做「超級應用」:他們的目標是建構一個強大的「AI 超級系統」,而不是像微信那樣的「超級 App」。因此,功能(如 Sora 視訊生成)可能會作為獨立應用存在,以適應不同的使用者場景和心態。

Sora 等新產品的商業模式仍在探索中:他提到,可能會嘗試讓使用者付費生成視訊,並與授權肖像的名人進行「收入分成」,但最終的商業模式(按次計費、訂閱或廣告)將取決於產品的演化和使用者的主流使用方式。

關於社會和未來

「AI 製造垃圾工作」是偽命題:他認為低效工作(slop)是人類固有的問題,而非 AI 獨有。經濟體系會自我糾正,最終獎勵那些高效使用工具的人。

未來工作的形態會徹底改變:以「農民」作類比,他認為未來由 AI 創造的新工作在我們看來可能「不像真正的工作」,但人類依然會找到新的目標和意義。他擔憂的是轉型的短期陣痛。

需要全球性的 AI 安全框架:他認為,隨著模型越來越強大,世界需要一個全球性的框架來降低潛在的災難性風險,這個框架應從一個完善的「測試機制」入手。

另外,今天凌晨,Sam Altman 接受 a16z 的訪談視訊也正式公開,我們也整理了其中幾個值得關注的觀點。

OpenAI 的核心願景:

最終目標是建構通用人工智慧(AGI)並使其對人類有益。

實現這一目標的主要方式是為使用者提供「個人 AI 訂閱服務」,這個 AI 將深度瞭解使用者,並在各種裝置和服務中提供幫助。

產品與 AGI 的關係(共同進化理論):

像 ChatGPT 和 Sora 這樣的產品,不僅是消費級應用,更是實現 AGI 的關鍵步驟。

它們不僅能推動核心研究(如 Sora 幫助建構「世界模型」),更重要的是能讓社會與技術「共同進化」,幫助公眾逐步理解和適應即將到來的技術變革,避免技術成熟後突然衝擊社會。

對未來的關鍵預測(AI 科學家):

Sam Altman 個人最興奮的未來方向是「AI 科學家」。他認為,衡量 AI 的真正標準不是圖靈測試,而是當 AI 能獨立進行科學研究並做出新發現時。

他預測,在兩年內,AI 模型將能夠承擔更大規模的科研任務,並做出重要的科學發現,這將是推動人類社會進步的巨大變革。

商業與戰略:

激進地投資基礎設施:由於對未來的研究路線圖和模型經濟價值極度自信,OpenAI 正在進行大規模的基礎設施投資,並與整個行業的眾多公司(如 AMD、Oracle、NVIDIA)展開廣泛合作。

對廣告模式持謹慎開放態度:他認為廣告並非完全不可行,但使用者信任是絕不能破壞的底線。任何為商業利益而犧牲推薦質量的廣告模式(如付費推薦產品)都是不可接受的,因為這會摧毀使用者與 ChatGPT 建立的信任關係。

支援開源:他認為開源是件好事,並對自家開源模型的受歡迎程度感到高興。提供高品質的開源模型也是一種重要的戰略,可以為全球開發者和學術界提供可靠的選擇。

關於版權和資料訓練的看法:

他大膽預測,社會最終會認定,用於模型訓練的資料屬於「合理使用(fair use)」。

但他認為,直接用 AI 生成受版權保護的內容,則會出現新的規則和商業模式。

他觀察到一個新趨勢:許多版權方已經從擔憂「AI 用了我的角色」轉變為擔憂「AI 用我的角色用得不夠多」,他們希望在保證角色形象不受損害的前提下,通過 AI 互動來提升 IP 價值和粉絲粘性。

Rowan Cheung:現在是 2025 DevDay,你能不能總結一下今天公佈了那些內容?你個人又對那部分最感興趣?

Sam Altman:我對所有內容都很興奮。嗯,我很關注 ChatGPT,這其實是我一直想做的事情——和人們聊聊他們在用它做什麼。

智能體(agent)這個問題也讓我很感興趣,很多關於 agent 的內容我真的很想親自用用。但如果非要說一個重點,我覺得 Apps 和 ChatGPT 的結合會非常棒。我很喜歡 Agent 這個方向。

Rowan Cheung:如果讓我作為一個開發者去嘗試一些酷炫的東西,那我可能會從那裡開始。另外我們現在有八億使用者了,恭喜啊,這真的很了不起。顯然,ChatGPT 已經成為下一個重要的分發平台。

現在開發者可以通過 Apps SDK 建構基於 ChatGPT 的應用,我覺得這是一個巨大的機會。

Sam Altman:我覺得我們還需要一些迭代,來摸索出人們真正想怎麼用這些東西。比如:使用者到底更傾向於通過呼叫某個應用來完成任務,還是希望 ChatGPT 本身就知道他們想幹什麼並主動推薦?

我認為,開發者最終會找到一種新的分發機制,非常適合他們。但說到底,這些產品推向世界後,總是會帶來一些意想不到的驚喜。

Rowan Cheung:我記得你們也發佈了一些文件,教大家怎麼更好地被推薦,是嗎?

Sam Altman:是的,不過也要加一句常規提醒:這是全新的產品,變化很快,我們會邊走邊學。但沒錯,這些文件我們今天就會發佈。

幾分鐘部署智能體,軟體開發真的在「地震」

Rowan Cheung:我很想讀一讀那些文件。嗯,我們來聊聊 Agent Builder(智能體建構器)吧,回到第一次 DevDay 的話題。

兩年前,你們發佈了 GPT Builder,那真的很棒。我記得我好像是最早建構公開 GPT 的人之一。那麼,從那時候到現在,你們做了那些重大改進,才有了今天的 Agent Builder?

Sam Altman:最主要的變化就是模型本身變得更強大了。我們等下會談到很多方面,但我回頭想想那次首次 Dev Day,模型能力的差距真的非常大。雖然也就二十幾個月,但我們已經走了很長一段路。

除此之外,我們還學到了很多使用者想如何建構這種智能體工具。他們也希望能把這些智能體部署到 ChatGPT 之外的其他平台上。

我覺得最驚喜的是,現在建構一個複雜系統變得非常簡單。比如你現在可以直接用一個可視化工具,把幾個檔案上傳,配置一些資料來源,告訴它你要實現什麼目標,然後就可以部署了。整個流程只需要幾分鐘。

昨天我們還在內部演示,我第一次完整看了一遍整個流程。像 Code Interpreter(程式碼直譯器)、Agent 工具包這些東西,加上整個建構體驗,讓我覺得軟體開發經歷了一場地震式的變化。我自己都還沒完全弄明白這會帶來多大的影響。

Rowan Cheung:如果我理解沒錯的話,在 Agent Builder 裡,基本上可以零程式碼建構智能體對吧?

Sam Altman:對,完全可以。

Rowan Cheung:當然,懂點程式設計會更有幫助,能做更複雜的功能,但普通的知識工作者也可以上手建構。

Sam Altman:沒錯,人人都可以建構智能體。

Rowan Cheung:這聽起來幾乎就像是一次「無程式碼革命」,只是這次是針對智能體的。

Sam Altman:完全同意。就像你說的,懂一點或很多程式碼確實能做出更強大的東西,但最重要的是,現在的入門門檻已經非常低了,幾乎人人都能開始嘗試。

Rowan Cheung:你覺得這些變化會對下一波創業者或者開發者產生什麼影響?

Sam Altman:這正是我最近一直在努力思考的事情。我在後台看演示時就在想——這些東西在一年前做起來要花費很長時間。而現在,你幾乎可以即時做出來。說真的,我現在已經快跟不上點子生成的速度了。

我還不確定這會如何演變,但很明顯,全世界將會有越來越多的軟體被寫出來。測試和迭代的速度會不斷加快,開發周期會一降再降。

只是……我現在真的很難完全想明白這意味著什麼。我覺得最明顯的變化是:一切都會發生得更快,你可以快速嘗試很多想法,更快地找到更好的方向。但除此之外,還會帶來什麼變化,我也說不好。

「一人公司」離我們只差幾個 prompt

Rowan Cheung:我聽說你和朋友之間還有一個打賭——猜測第一個靠 AI 智能體賺到十億美元的公司會什麼時候出現。你覺得 Agent Builder 會讓這個目標更接近嗎?

Sam Altman:可能還沒到那個時候。嗯,之前我們打賭的點是:第一個「一個人公司」靠 AI 賺到十億美元會何時誕生。雖然我們沒正式立個規則,但大家一直在猜什麼時候會出現第一個這種公司。

Rowan Cheung:那「零人公司」呢?是幾個月,還是幾年?

Sam Altman:我猜,可能還需要幾年。但關鍵是——我們現在已經可以認真地去討論這樣的一天了。你可以直接在 ChatGPT 裡寫個提示詞,然後它就能幫你搞定一切。

Rowan Cheung:這已經非常瘋狂了,我完全同意。不過 2025 年原本被很多人認為是「智能體元年」。我們確實看到了一些還不錯的智能體產品,但它們仍然需要大量人工監督和反饋。你覺得什麼時候我們才能擁有那種一整周都不需要人干預的智能體?

Sam Altman:我覺得,像 Code Interpreter(程式碼直譯器)這樣的工具,距離完成「一周的工作量」其實已經不遠了。雖然聽起來有點瘋狂,但我覺得這並不是一個遙不可及的 2025 年目標。

今天我還和一些人聊起這事,他們也很驚訝地說:「它現在真的已經能完成一天的任務了?怎麼發展得這麼快?」老實說,我通常不會覺得 AI 的進步有多誇張,但在 ChatGPT Code Interpreter 能完成的任務長度這個方面,我真的感受到一種爆炸式的進展。所以我猜,一周等級的任務,可能真的很快就能實現。

Rowan Cheung:那要實現這種 Agent,還需要那些技術上的突破?

Sam Altman:更聰明的模型、更長的上下文處理能力、更好的記憶系統。

Rowan Cheung:好的。你們現在有了 AgentKit、持續升級的模型、Codex,還有 API。看起來現在真的能建構太多東西了。那如果你回到過去,把一個剛從史丹佛退學的 20 歲年輕人帶到現在,並讓他擁有我們今天所有的工具,你覺得他該做什麼,不該做什麼?

Sam Altman:我前幾天其實還真在想這個問題。老實說,我挺羨慕現在這代 20 歲的創業者們的,因為他們能做的事情太多了,機會空間實在太廣了。過去幾年裡,我一直沒騰出真正完整的時間去深入想「我要做什麼」,但我知道現在有非常多值得建構的好產品。今天和現場很多人聊天,也被他們正在做的項目震撼到了。真的很棒。

Rowan Cheung:我自己也是從零開始,我覺得現場很多開發者可能也是這種狀態。現在能做的東西太多了,你有沒有什麼建議?比如說,在建構產品時,應該尋找怎樣的「獨特優勢」?是分發方式?資料?還是某種工作流模型?

Sam Altman:這個問題抽象地講我一直覺得挺難回答的。因為我認為最好的「獨特優勢」,往往是你自己為你要做的事情量身打造的。我們在 OpenAI 也花了很多精力去找到這一點。我覺得這沒有通用的「最佳答案」。

最好的回答應該是:你找到了一些,只對你當前產品、技術、市場定位在這個時間點上才成立的獨特東西。而這類東西,往往就構成了你能創造巨大價值的核心。

不過,有一點通用的建議我可以說:你是在做的過程中逐步發現優勢的。我很喜歡一句經典的商業名言——「讓戰術變成戰略。」

你可以先從一些「有用、能跑得通的事情」開始,往往在這個過程中,就會慢慢浮現出某些可以上升為戰略的東西。

如果你在我們剛開始做 ChatGPT 的時候問我:「你們未來會有什麼持久的優勢?」我可能會說「我也不知道」,或者給你一堆猜測,但不會有特別自信的答案。

但現在回頭看,像「記憶」功能,其實就成為了一個非常強的競爭優勢,也是使用者持續使用 ChatGPT 的重要原因之一——可當時我們壓根沒想到這點。

所以你在建構功能時,有時會意外地發現:「哇,這個點其實可以成為我們長期的護城河。」這就是你一邊走、一邊找、慢慢形成的過程。

Rowan Cheung:有沒有什麼跡象能告訴我們,現在在建構產品時應該朝著那種「長期優勢」去努力?比如說該怎麼為 GPT-6 時代佈局?或者說,現在到底該怎麼思考產品建構這件事?

Sam Altman:這個嘛,最終還是得你自己去摸索出來。當然如果有時間我很樂意參與頭腦風暴,這事兒本身就挺有趣的。

但說實話,OpenAI 現在幾乎佔據了我全部的腦力空間,我已經沒有什麼機會去認真思考怎麼創業了,這點其實還挺遺憾的。

我覺得 AI 雖然改變了世界上很多事情,但它並沒有改變一個公司獲得優勢的底層機制。

比如說,網路效應、品牌和市場優勢、使用者資料、平台或市場的雙邊效應等等,這些因素過去行得通,現在依然有效。如果你去列一個近幾年成功企業的清單,那些驅動力大機率現在也還適用。只不過,現在可能會有一些新的策略、新的打法罷了。

Rowan Cheung:最近發佈了一個叫 GDPval 的基準測試,用來衡量模型在現實經濟中、尤其是典型知識工作崗位上執行任務的能力。讓我有點意外的是,GPT-4.5 的表現排在第二,第一名是一個封閉服務模型。你們還沒發佈 GPT-5,但你對這個結果感到驚訝嗎?

Sam Altman:一點也不驚訝。首先,如果我們只能在排名第一的時候才發佈產品,那就太糟糕了。我們不可能在所有事情上都做到最好,這很正常。想要長期變得更好,文化裡必須包含一個元素:坦然承認在某些基準測試上別人更強。

有時候別人就是做得比你好。說實話,那家公司確實在理解企業級使用場景上做得很出色,而且輸出格式也非常漂亮。我並不驚訝,反而覺得這激勵我們繼續提升。

Rowan Cheung:這個基準測試有沒有影響你們在建構 GPT-6 時的方向?

Sam Altman:它會影響我們後續訓練(post-training)的一些方式,但整體上我們對 GPT-6 的核心策略是不會改變的。

Rowan Cheung:你之前說過,你對 AGI(通用人工智慧)的定義是:當它在大多數具有經濟價值的任務上超過人類。那麼,如果某個模型在 GDP-V 的得分達到某個程度,你會認為 AGI 實現了嗎?

Sam Altman:我最近也在認真思考這個問題。首先,像很多人一樣,我對 AGI 也有多個定義。離目標越近,這個概念反而越模糊。

但對我來說,最重要、也是讓我最驚喜的一點是:我們已經開始看到 AI 具備「發現新知識」的能力了。也就是說,AI 可以擴展人類目前的知識邊界。雖然現在這些例子還很小,但這才是我最在意的突破。

我真的不想把這件事說得太誇張,但你現在可以在 X 上看到很多例子,科學家們在各個領域都在說:「AI 做出了一個小小的發現」、「它提出了一種全新的方法」、「它解決了某個我們一直沒解開的難題」。而這些背後的原理,我們可能也還沒完全理解。

就是這種感覺。現在還只是剛剛開始而已,而我們對未來幾個月、幾年能在這個方向上持續推進感到非常樂觀。這件事意義非常重大。它可能是我最關心的、最接近 AGI(通用人工智慧)的那部分能力。

APPSO 註釋:在 a16z 的採訪視訊中,根據 Sam Altman 的觀點,OpenAI 的整體願景和核心使命非常簡單,那就是打造通用人工智慧(AGI)並讓它真正為人類服務。實現這一宏大目標的主要方式,是為每個人提供一種「個人 AI 訂閱服務」。這個個人 AI 將隨著時間推移深度瞭解使用者,變得越來越有幫助,並且使用者可以在 OpenAI 自家的產品、登錄其他第三方服務,甚至在專屬硬體裝置上隨時使用它。為了支撐這一切,公司必須建構龐大的基礎設施,這些設施目前主要服務於這個核心目標和相關的研究。

他強調,如此大規模的基礎設施投入遠超單個公司的能力,需要獲得行業大部分力量的支援與協作。因此,OpenAI 將與眾多公司展開廣泛合作,合作範圍覆蓋從底層的電力、電子供應到上層的模型分發系統等所有環節,並且可以預期在未來幾個月裡會宣佈更多新的合作關係。

Rowan Cheung:有沒有那個具體的科學突破,是你特別興奮、特別希望 AI 能幫我們實現或解開的?

Sam Altman:當然了,比如說治癒某些疾病,或者發現全新的物理規律,這些都是非常令人興奮的方向。即使是現在正在發生的一些「小事」,也同樣令人振奮。比如在數學領域的一些進展,也給人一種特別振奮的感覺——就像 GPT-4 剛發佈時帶來的那種衝擊感。

我知道大家對「圖靈測試」到底是什麼意思還存在很多爭議,但從大眾的角度來看,圖靈測試曾經是一個看起來遙不可及的目標。然後,突然之間,它被「通過了」。可整個社會幾乎沒有什麼反應。

人們可能討論了兩周,然後就開始說:「這玩意兒怎麼還這麼慢?」、「能不能再做得更好點?」我覺得這其實也說明了人類的偉大——我們非常善於適應。曾經被視為衡量 AI 智能的終極測試,突然之間就被超越了,而我們也很快就習慣了。

我現在有種類似的感覺:我們也會很快習慣 AI 做出科學發現這件事。

Rowan Cheung:感覺有點像電影《Her》裡人類適應 AI 的情節。

Sam Altman:是的,只有第一次覺得奇怪。

Rowan Cheung:沒錯,奇怪也就那三分鐘,之後你就習慣了。嗯,我確實感受到了這種趨勢。最近有一個新術語叫做「slop」,意思是那些看起來很精緻、但其實很低效的工作成果。它們通常需要反覆返工才能真正有用。

一項針對上千名測試使用者的調查顯示,有 41% 的人表示他們在過去一個月裡,曾從同事那裡遇到過這種「slop」工作流。每次「清理爛攤子」平均花費 1 小時 6 分鐘,每名員工每月因此造成的損失大約是 100 美元。

那麼,如果 AI 能夠讓部分人(比如在這個活動現場的很多人)效率提升 10 倍,我們該如何進行教育?如何幫助老師和普通人理解:什麼時候該用 AI,什麼時候不該用?

Sam Altman:首先,要說的是,人類自己其實也常常製造「slop」工作流,所以這並不是 AI 獨有的問題。比如那種「寫郵件只是為了製造更多工作」的人,你懂我意思吧。

就像會議也是一樣,明明是為了協作,結果反而變成拖累。所以「slop」不是新現象,它在 AI 出現之前就已經存在了。過去就有一類人會用工具提高效率,也有另一類人只是在製造混亂和負擔。

我覺得我們也沒必要對 AI 抱有不切實際的期待。經濟體系是自我糾正的——那些真正用工具提高效率的人和公司,最終會獲得更多影響未來的能力;而那些用 AI 拖累組織的人,會自然被邊緣化。

像所有新工具一樣,AI 的使用也有學習曲線,但我相信這個學習過程會相對快速。

Rowan Cheung:那 OpenAI 有沒有做什麼事情來幫助大家在教育和入門階段更好地掌握這種「使用直覺」?

Sam Altman:有的,我們確實在做這方面的工作。人們使用工具的方式就是他們自己的方式。有一件事我學到了,那就是:那怕你提供了再好的教學內容、培訓資源,最後人們還是會發現他們可以用它來——比如說,讓 ChatGPT 模仿海盜說話,然後他們就真的去這麼做了(笑)。

但我們確實在努力建立很多內容,幫助人們在真實工作場景中高效使用 AI。比如在 Codex 的推廣過程中,很多公司採用它的速度非常快,甚至在幾天或幾周內就完成了工作流程整合,效果非常好。

Rowan Cheung:回到 「slop」 這個話題,其實這是世界上第一個「以 AI 為中心」的工作年。

Sam Altman:是的,可以說是整個網際網路都在經歷這個轉變。

Rowan Cheung:你會不會覺得,這種變化也像你之前提到的——目標設得太高,比如 GPU 的使用、算力的投入,等等?

Sam Altman:其實這是我原本以為會很奇怪的事情,但結果出人意料地沒那麼怪。甚至有點反常識——你翻看上百個例子,反而比你只看一個還要自然一些。

我當時一邊看,一邊還在想這個問題。對了,我還剛完成了一次環球旅行……

在產品上線前,團隊裡有個人發消息問我:「我們能不能把你的那個駱駝形象開放訪問?」那一刻我幾乎沒想太多,8 秒內就回覆了同意。但後來想想,其實這事兒也許值得更認真考慮一下。只是當時我心裡也想——這是一項新技術。

我知道,如果我連嘗試都不願意,那確實是我的問題。所以我就決定:那就試試吧。後來我坐飛機的時候,終於有點時間思考,就開始想:

「這會不會是一次很奇怪的體驗?」

然後我自己回答自己:「嗯,可能確實會有點怪。」

結果產品上線之後,我看到一些苗頭了——因為 OpenAI 內部的人在測試期間,已經做了很多以我和其他人為主題的 meme。

那天我人在亞洲,半夜醒來發了條推文,就又睡回去了。六小時後醒來,我打開手機一看:全是 meme、meme、meme……

就這樣被刷屏了。

最初幾分鐘確實覺得有點奇怪,但也就三分鐘而已。之後我就釋然了,覺得:「好吧,這就是一個充滿生成視訊的應用。」這些內容挺搞笑的,我也能樂在其中,笑一笑就過去了,並沒有留下什麼奇怪的感覺。

Rowan Cheung:我唯一有點擔心的是那些「水印移除工具」。現在市面上有幾家公司發佈了這種功能,我看到有工具可以移除水印。

那如果我允許別人用我的形象,他們之後可能會把水印去掉再發到社交媒體上。這樣會不會對我的個人品牌有負面影響?這個權衡該怎麼做?

Sam Altman:首先,我們之所以願意發佈這種技術,是因為我們看到某些趨勢已經不可避免地在靠近——無論幾個月還是幾年後,它都會變得廣泛可用。屆時會有優秀的開源模型,任何人都可以用它製作一段你的視訊,讓你「做」任何他們想讓你做的事情,只要你在網際網路上有公開資料,就有可能被生成。

當然,社會最終會適應這種變化,但我們認為,提前發佈並設定好「防護欄」,是一種幫助社會逐步適應的好方法。我們以前在文字生成技術上也是這樣做的。視訊則會更難適應,因為視訊的衝擊力遠大於文字。

但我相信大家會學得很快——會很快意識到:網上將會出現大量沒有水印、來源難以追蹤的虛假視訊,它們是由某個開源模型生成的,這種事是不可避免的。

所以,提前讓社會「接種」這種現實的衝擊,可能是有價值的。

Rowan Cheung:所以,「無法分辨真偽的視訊」是目標嗎?

Sam Altman:我們最終的目標是 AGI(通用人工智慧)。在實現 AGI 的過程中,高品質的視訊生成會是非常重要的一環,原因有很多,特別是在我們從「世界模型」中學習的時候。

希望有一天我們能在機器人領域也取得真正的進展,那時視訊也會非常關鍵。

而且我並不希望未來人類與 AI 的互動介面只有文字。我非常期待那種可以通過即時視訊流與 AI 互動的未來,它能帶來一種全新的使用者體驗。

所以我覺得這是好事。但更重要的是,我認為這條路對於通向真正的 AGI 來說,是非常關鍵的一步。

Rowan Cheung:你們上周五發了一篇部落格,說你們正在探索「收入分成」機制,回饋那些允許用自己面孔生成內容的人。你可以多分享一些細節嗎?這機制會怎麼運作?

Sam Altman:可以。其實很多時候你發佈一個新產品,使用者的使用方式會超出你的預期。

我們原本以為會是少量創作者在用它製作一些很酷、很複雜的視訊,然後被更大的觀眾群體觀看和傳播。

確實有一部分人是按照我們預期的那樣在用這個產品,但實際上,更多人是為了自己和三兩個朋友製作視訊,然後發在動態裡,或者只是在群聊中分享一下,不是公開發佈在平台上。

我不確定這種用法是曇花一現的新鮮感,還是會持續下去。但如果它真的持續下去,那就會徹底改變我們對計算資源需求和使用者互動方式的預期模型。也許我們會考慮允許使用者付費生成視訊。

比如說,你一天想生成 100 個視訊發給朋友,那沒問題。如果你還想讓視訊裡出現某個名人,而那位名人願意授權,那麼他們也可以從中獲得一定的生成收入分成。所以我們會在這方面做些嘗試。

但我也得說,現在就對一個只有六十天的新產品下任何定論都還為時過早。也許這個方向最終根本不成立,也許這根本不是一個真正的「使用場景」,但至少到目前為止,它是一個挺大的趨勢。

Rowan Cheung:你們有沒有考慮過在這個產品裡加入廣告的可能性?

Sam Altman:目前還沒有,但我覺得這個方向確實有一些值得探索的地方。當然,它也有一些讓人感到非常可怕的潛在風險。

不像 ChatGPT,那邊我們已經跑得挺順,有清晰的訂閱制商業模式。而如果這個視訊產品最終的主流用法變成:大家看搞笑內容或高品質視覺內容——那可能就更適合走廣告驅動模式。

但如果大多數內容都是私密分享,比如私信裡的視訊,那就可能是完全不同的模式。

所以樂觀來看,也許到今年年底——或者這可能太樂觀了,可能要等到明年第一季度末,我們才能真正理解這個產品的最終形態,然後再根據它的走向設計相應的商業模式。

至少目前來看,我覺得按次計費、按生成數量收費,是一個合理的方式,值得我們去嘗試。但其他的商業化策略,還要看產品接下來如何演化。

APPSO 註釋:在 a16z 的採訪中,Sam Altman 也強調,他對在產品中引入廣告持謹慎的開放態度,並區分了他欣賞的廣告(如 Instagram 上幫助使用者發現新事物的模式)和不喜歡的廣告(如 Google 搜尋中干擾結果的模式)。

他強調,對於 ChatGPT 而言,使用者的信任是絕不能破壞的核心原則。人們相信 ChatGPT 是真心想提供幫助,如果為了廣告費而推薦並非最佳的產品,這種信任會瞬間崩塌,因此這種直接影響結果的付費推薦式廣告是絕對行不通的。

未來的工作,可能也「不像工作」

Rowan Cheung:這個話題真的很有意思,關於「工作」的問題。工作的形態正在改變。我喜歡用「農民」類比來解釋這件事。

比如你對 50 年前的農民說,有一個叫「網際網路」的神奇東西,會創造出數十億個新工作崗位,而且人們會坐在辦公桌前工作、開發市場……他大機率是不會相信的。

現在我們正處在一個類似的時代——你和很多人都說過,AI 會創造出很多全新的崗位。但現在很難看清這些新工作會是什麼。

這次和「網際網路時代」的不同之處在於:網際網路是從零開始創造了很多新職業,而這次 AI 的衝擊,是先影響現有數十億知識工作者的崗位,然後才可能出現新的工作機會。你怎麼看?

Sam Altman:你說得非常對,我覺得你點出了一個很關鍵的點——這讓我在某些方面沒那麼擔心,但也在另一些方面更擔心了。

關於那個農民,不只是他不會相信這種事真的會發生,他甚至可能會覺得你我現在做的這些根本不算「真正的工作」。

你想啊,農民每天種地,是在做大家真正需要的事——他們在生產糧食、維持生命,這才是「真正的工作」。

而在他們看來,我們這些未來人,生活太容易了,食物和財富都很豐富,我們做的事情更像是打發時間的「遊戲」,只是為了找點存在感。他們會說:「這算那門子工作?」

儘管對我們來說這份工作很真實,至少我自己感到很滿足,也很感激自己能做一份既重要又有意義的事。

但也完全有可能,如果我們現在能看見未來那些新工作,我們會說:「好吧,也許我們的工作比不上農民的真實感,但肯定比未來這些『自娛自樂的遊戲』更像工作。」

所以我真的相信——是的,人類將來依然會有目標、有動力,但我們對「工作的理解」會發生巨大變化。在未來人眼中,我們現在的工作,可能也會顯得「不那麼像工作」。

我也相信,社會契約會隨之改變,尤其是當這個轉變發生得非常快的時候。

所以我確實對這場轉型的短期階段感到有些擔憂。但說到底,我依然非常相信人類的動力與創造力,我們一定會找到值得去做的事情。

Rowan Cheung:比如探索太空,希望看到更好的 AI 系統等等——你覺得在 AGI 實現之後,人類最有可能會集中精力去做什麼?

Sam Altman:我其實更希望——我們能「全面開花」,什麼方向都去探索。

太空探索當然很酷,我自己也很感興趣。但也許你、你,還有你,各自會對別的方向感興趣。我希望那個時代的「可能性畫布」能變得無限寬廣,大家都能去做自己真正感到興奮的事。

Rowan Cheung:如果你明天可以制定一項全球性政策,你會選擇什麼?

Sam Altman:這真的很難只選一項。但我腦海裡一直浮現的,是關於 AI 監管的激烈爭論——到底它是好是壞?是否會讓大公司獲利太多?

我能理解這些爭議的各個方面。但我確實認為,隨著模型變得越來越強大,我們需要一個全球框架,來降低潛在的災難性風險。

尤其是在那些處於前沿的模型上,我們必須認真思考最嚴重的安全問題。如果能有一項全球政策來應對這個問題,那將是非常有意義的。

Rowan Cheung:你能簡單概括一下這個「全球框架」會是什麼樣的嗎?

Sam Altman:一開始我會從一個完善的測試機制入手,作為基礎。

Rowan Cheung:我還想聊聊「超級應用」這個話題。在中國,像微信這樣的「超級 App」已經涵蓋了幾乎所有功能:購物、支付、聊天……

而現在 ChatGPT 也開始支援購物、網頁搜尋、Sora 視訊生成等功能。你們是不是也打算打造一個「美國版的超級 App」?

Sam Altman:不是的。嗯,有很多原因讓我覺得這種模式在美國市場並不適用,至少不能用同樣的方式去複製。

我們的目標並不是做「超級 App」,而是要建構一個真正強大的 AI 超級系統。

Rowan Cheung:那為什麼你們要把這些功能分開發佈?比如 Sora 是一個獨立的應用,為什麼不直接整合到 ChatGPT 裡?

Sam Altman:因為對很多使用者來說,ChatGPT 是他們最私人的帳號之一。

如果把一個「社交體驗」也強行塞進去,感覺會很奇怪。你可以想像加入一些「消息」功能,因為很多人確實會分享內容、進行協作。但從使用者心態來看,他們對 ChatGPT 的認知,和對一個娛樂類 App 的認知是完全不同的,混在一起會有割裂感。

當然,我們也會把很多功能直接加到 ChatGPT 裡,但有些東西還是更適合獨立發佈。

Rowan Cheung:我們再聊聊智能體。你覺得現在人們可以建構那些真正重要、有用的 Agent?你最看好那一類?

Sam Altman:我覺得可以參考一下 Codex 的發展,然後把這種思路推廣到其他行業。

比如:能不能為法律、金融建模,或其他我們已經看到早期成功案例的領域,打造像 Codex 一樣的體驗?其實現在已經有一些很棒的初創公司在做這些方向了。

隨著技術的成熟,如果你能讓這些 Agent 在各自行業中,做到像 Codex 在程式設計領域那樣強大,那將是我最感興趣的方向之一。

我可以想像未來這樣的場景:一個人只需要和一堆 Agent 對話,就能啟動一個公司。現在的 Agent Builder 和 AgentKit 還沒完全達到這個水平,但我能看到我們正在往這個方向靠近。

Rowan Cheung:我記得你在主題演講裡提到,「語音」可能會成為 AI 智能體的最終介面。你能展開講講嗎?

Sam Altman:我不覺得語音是最終的互動方式。很多場景下,語音其實並不適用——比如在公共交通上,和裝置對話就很不方便,甚至有點尷尬。

但在很多情況下,語音確實是一種非常自然的互動方式,尤其是語言本身的交流。儘管有時候,打字仍然是更合適的方式。

我覺得我們其實低估了語音互動的潛力。大家現在總是拿智能音箱這個類別開玩笑,但我們忽略了,其實很多人真的在用這些裝置,而且很喜歡它們——儘管它們現在的體驗還很差,主要是因為以前的 AI 不夠好,生態基礎也沒跟上。

但你想想未來會怎樣:如果你能隨口對裝置說一句,它就能完全精準地幫你完成任務——那種感覺,可能就真的像擁有了一個「理想中的電腦」。

Rowan Cheung:我很期待能夠使用它。能不能透露一點關於你們在 I/O(裝置端)正在做的事情?是不是會有語音互動?

Sam Altman:我們還需要一段時間。這個方向確實需要大家多一點耐心。

要做出一種全新類型的裝置,而且要達到極高的品質標準、還能大規模生產,這等於是重新定義人與電腦的互動方式。我們需要一定的創作空間來把這個事情摸索清楚。

我們確實有一些非常令人興奮的想法,但目前還不準備公開談論,而且在短期內也不會說太多。但我們會努力做出一個真正值得使用、非常有意義的產品。

Rowan Cheung:好吧,那今天就聊到這。

Sam Altman:非常感謝。 (APPSO)