商業思維筆記君說:5月13日消息,OpenAI聯合創始人兼首席執行官山姆·奧特曼,於美國當地時間5月12日出席了全球知名投資機構紅杉資本舉辦的“2025 AI Ascent”大會。在本次專訪中,奧特曼分享了OpenAI的創業歷程、產品規劃與發展路徑,並深入探討了他對AI行業未來的洞察。奧特曼回顧了OpenAI從一個僅有14人的研究實驗室,成長為全球領先的人工智慧平台的歷程。他設想將ChatGPT演進為一種高度個性化的AI服務——它能夠記住使用者的完整生活背景,從對話記錄到電子郵件內容,同時能夠在多個應用和服務之間無縫銜接、自然協作。他指出,年輕一代使用者已經將人工智慧視為作業系統,而不僅僅是搜尋工具。這種趨勢預示著一個全新的未來:一個高效、統一的大模型,能夠在無需重新訓練的前提下,基於超大規模的上下文進行推理,全面理解使用者的歷史資訊,從根本上重塑人與技術的互動方式。以下為奧特曼最新專訪精華內容:一、OpenAI的“從0到1”:ChatGPT是如何誕生的?問:這是你們當年成立時的辦公室(如下圖)?奧特曼:沒錯,這正是我們最初的辦公地點,2016年我們就在這裡起步!問:2016年的你可曾預見OpenAI會有現在的光景嗎?奧特曼:完全沒想過。那時我們14個人擠在角落裡,圍著白板討論我們到底應該做什麼。說實在的,那時我們就是個純粹的研究實驗室,雖然有著非常強烈的信念和方向感,但沒有明確的行動計畫。別說商業化產品了,連“大語言模型”(LLM)的概念都還很遙遠。問:從公司初創到ChatGPT問世,歷經六年時間,你們是如何設定里程碑的?奧特曼:其實我們的第一個面向消費者的產品並不是ChatGPT,而是DALL·E(文字生成圖像系統),更早的則是API介面服務。我們曾嘗試過多個方向,包括遊戲AI、機械臂控制等。後來有團隊專注於無監督學習,這才誕生了GPT-1和GPT-2。但直到GPT-3,我們才感覺手頭真的有了點“東西”,雖然當時還不清楚該用它來做什麼。與此同時,我們也意識到,如果想繼續擴展模型規模,就必須籌集更多資金。像GPT-4這樣的模型,其開發成本達十億美元級,已不是靠科研資助能支撐的,除非是像粒子加速器那樣的國家級項目。因此,我們開始認真思考,如何將這一研究轉化為可持續的商業模式。我們隱約意識到,這項技術終將變得非常實用。雖然我們開源發佈了GPT-2的模型權重,但市場反應平平。然而,通過觀察許多創業公司,我發現一個模式:開放API介面往往能帶來意想不到的價值,這在很多YC孵化項目中被多次驗證。另一個關鍵體會是:技術越易用,其價值通常越大。當時運行這些大模型仍然非常困難,因此我們決定建構專用軟體以最佳化部署體驗。由於尚未明確產品形態,我們選擇在2020年6月開放GPT-3的API介面,想看看開發者們是否能基於它打造出有價值的應用。有趣的是,雖然全球市場反應較為冷淡,但矽谷創業圈敏銳地意識到這項技術的潛力,有人甚至認為它是通用人工智慧(AGI)的雛形。就我所知,真正基於GPT-3 API建構起可持續商業模式的公司並不多,主要集中在文案生成服務上,這是當時唯一能夠突破商業化門檻的應用場景。但我們注意到一個異常現象:儘管人機對話功能尚不成熟,使用者卻樂此不疲地與模型互動。要知道那時的聊天體驗並不理想,因為還沒有引入基於人類反饋的強化學習(RLHF),但大家依然愛不釋手。除了文案生成,人機對話幾乎是唯一具備“殺手級應用”潛力的功能,這最終促使我們決定開發ChatGPT。在ChatGPT 3.5發佈時,API已支援八大類商業應用場景,遠遠超出早期的單一功能。我們也愈發堅信——人們渴望與AI對話。雖然DALL·E的表現也不錯,但考慮到我們在微調技術方面的積累,我們最終決定投入資源,專門打造一款面向對話的AI產品。經過六年的打磨與探索,ChatGPT終於在2022年11月30日正式上線。如今,每周有超過5億使用者與之互動。二、從精簡團隊到高效協作,OpenAI是如何做到“越大越快”的?問:最近半年,你們似乎在持續不斷地發佈新產品?奧特曼:是的,確實如此。我們發佈了很多重量級更新,而且產品發佈節奏越來越快,連我們自己也覺得非常驚人。問:你是如何在一家如此規模龐大的公司中,仍然保持快速的產品迭代能力?奧特曼:我認為,很多公司都會陷入一個典型誤區:隨著公司規模的擴大,產出卻陷入停滯。他們只是為了擴張而擴張,卻沒有同步提升產品的研發與迭代效率,這就是所謂的“效率停滯”。我始終堅持幾個基本原則:讓每個人都高效運轉;保持團隊小而精;確保人均產出與公司規模相匹配。否則,你就會看到一個40人的會議,為了一個小功能而爭論不休。商業界有句老話:“優秀的管理者永遠很忙”,因為沒有人希望看到閒著的人到處攪局、影響效率。在我們公司,也像許多科技公司一樣,真正創造價值的是研究員、工程師和產品經理。你必須確保這些關鍵崗位上的人始終專注、高效地推進工作,產生實際影響。如果你打算擴張公司規模,那就意味著必須同時增加項目數量,否則就只會增加無謂的會議和內耗。因此,我們儘量保持精簡的團隊結構,但賦予每個人極大的責任感。要實現這一點,唯一的方式就是同時推進大量項目。現在,我們確實有機會打造下一代網際網路的核心平台。要實現“終身個性化AI助手”的願景,意味著必須跨越不同的服務場景,覆蓋主流與長尾應用,而這需要建構豐富的功能模組和配套能力。問:在過去這六個月裡,有沒有那個產品讓你特別自豪?奧特曼:我最自豪的是模型能力的持續躍升。當然,我們距離目標還有不少改進空間,但我們正在以非常快的速度迭代。目前的ChatGPT已經是一款非常優秀的產品,而它之所以如此強大,核心就在於底層模型的出色表現。一個模型能夠高品質地完成如此多樣的任務,這一點讓我感到由衷驚嘆。三、核心AI服務之外,機會無限問:你們既在開發小模型,也在推進大模型,幾乎什麼都在做。那麼我們這些從業者該怎麼做,才能不被OpenAI“碾壓”?奧特曼:你可以這樣理解我們在做的事情:我們希望成為使用者的核心AI訂閱服務提供商。這其中一部分功能將通過ChatGPT實現,其他還會涵蓋一些關鍵模組。但最核心的,還是打造更智能的模型,探索新的互動入口,比如專屬硬體終端裝置,甚至類似作業系統的基礎平台。至於API或SDK 的形態,我們現在還沒有完全想清楚,但一定會找到合理的路徑。可能會經歷幾輪嘗試,但最終我們會做成。我希望我們的平台能為全世界創造巨大的價值,成為其他開發者創新的基礎。問:OpenAI未來的發展目標是什麼?奧特曼:我們就是繼續打造更強大的模型,推出使用者喜歡的產品。除此之外,沒有什麼複雜的“終極藍圖”。我們更關注眼下要做什麼。現場有很多OpenAI的老同事可以作證,我們不是那種喜歡坐下來制定繁複計畫的團隊。我始終相信——如果你從一個“宏大終點”向回推規劃,很容易走偏。與其設計一個自上而下的總體戰略,不如一步步往前走,靠使用者反饋和現實成果驅動決策。我們知道接下來會需要龐大的AI基礎設施,要建“AI工廠”。與此同時,我們會不斷提升模型性能,打磨優秀的終端產品,從模型到介面再到硬體,每一部分都要做到最好。我們以靈活應變為榮。隨著外部世界不斷變化,我們也會及時調整戰術。目前我們還沒開始規劃明年要發佈的產品,但我們有信心打造出真正打動使用者的創新。我對我們目前的研究路線充滿信心,從未像現在這樣樂觀。問:接下來的研究路線圖是怎樣的?奧特曼:更智能化的模型,這是我們的中心目標。但每一步如何走,我們會邊走邊看,通常是走一步看兩步。問:所以你更相信“從現在出發,逐步演進”,而不是“自上而下反向規劃”?奧特曼:完全正確。我聽過很多人講他們有一個宏大的戰略藍圖:比如“最終要統治世界”,然後再往回推算每一步該做什麼……但我從來沒見過,這樣的路徑能真正帶來巨大成功。四、年長者用AI查資訊,年輕人用AI過人生問:你認為大公司在轉型為AI原生組織時,常犯那些錯誤?無論是在使用 AI 工具還是建構 AI 產品方面?為什麼初創公司明顯在創新上更具優勢?奧特曼:幾乎每一次技術革命都會出現類似現象,所以這並不令人驚訝。他們犯的錯誤與以往如出一轍:過度依賴傳統流程,固守舊有思維。當技術每隔一兩個季度就發生飛躍,而你還在依賴一年才開一次會的資訊安全委員會來決定是否引入新應用、如何處理資料,那麼這種轉型註定將異常艱難。這正是“創造性顛覆”的核心,也是初創企業往往能勝出的根本原因。行業就是在這種顛覆中不斷前進的。我對大公司的轉型速度感到失望,但並不意外。我的判斷是,未來一到兩年裡,它們仍會經歷掙扎期——試圖假裝AI不會顛覆一切,等真正危機降臨時才匆忙轉型,但往往已經為時過晚。屆時,初創公司早已利用靈活機制和新範式完成“彎道超車”。而這種落差不僅體現在組織層面,也反映在人身上。比如,你可以觀察一下一個20歲的年輕人與35歲使用者在使用 ChatGPT 時的差異,簡直天壤之別。這就像智慧型手機剛問世時,孩子們能迅速上手,而年長者可能要花三年時間才能掌握基本功能。今天的AI工具,也在重演類似的“代際斷層”,而企業的行為,往往只是個體趨勢的放大。問:你觀察到年輕人在使用 ChatGPT 上有那些獨特的創新方式?奧特曼:他們真的已經把 ChatGPT 當作一個作業系統來使用了。他們會結合檔案、工具鏈與提示詞,設定複雜的操作流程,甚至精心設計提示詞並記在腦子或文件裡,就像使用一門語言一樣。讓我印象最深的是,如今很多年輕人在做人生重大決策之前,都會先來問 ChatGPT 的意見。因為它已經擁有他們完整的背景資訊、過往的對話記錄與行為偏好,具備了“記憶”能力,這使人們與它的互動方式發生了根本變化。簡單來說:年長使用者把 ChatGPT 當作Google的替代品,20–30 歲的使用者視其為“人生顧問”,而大學生則已經把它當作作業系統來用了。問:OpenAI內部是如何使用 ChatGPT 的?奧特曼:ChatGPT在我們內部主要用於大規模輔助程式設計。具體比例難以精確衡量,用“程式碼行數”統計是沒有意義的。例如微軟會說:“我們有20%或30%的程式碼由 AI 編寫。”但我認為,用行數衡量是非常愚蠢的方式。真正關鍵的是,它是否能產出高品質、有意義的程式碼——那些真正解決問題的核心程式碼,而不是邊角料。這才是價值所在。問:你剛才提到你們的核心是打造面向消費者的訂閱服務,收入也主要來自消費端使用者。那為什麼還要繼續保留 API?奧特曼:我的希望是,最終實現一個統一融合的系統——使用者可以用同一個 OpenAI 帳號登錄所有服務,第三方也能通過 SDK 將 ChatGPT 深度整合進自己的應用介面。一旦個性化 AI 掌握了你的完整資訊與使用偏好,你自然希望無論在那種應用場景下,它都能與你保持一致的個性化體驗。雖然今天的API離這個目標還有相當距離,但我相信我們終將實現它。六、OpenAI的終極目標:成為AI時代的“作業系統”問:對於建構應用層產品的開發者來說,我們非常希望能用上你們各種API,比如Deep Research API(雖然還沒發佈)。你們是否會優先打造一個更開放的平台供大家使用?奧特曼:我希望未來能出現一種介於“完全封閉”和“完全開放”之間的新範式,類似一種“HTTP協議等級的AI網際網路標準”。我設想的是,未來的網路結構將支援更加細粒度的功能模組呼叫、智能體系統之間的高效協作,並內建身份認證、支付、資料交換等機制,做到“工具互通、系統互信”。目前我們還無法確切描述這個系統最終會長什麼樣,但我們對這個方向越來越清晰。要實現這樣的平台,可能需要經歷幾輪嘗試和演化,但我們希望這是AI生態發展的主路徑。問:AI想更好理解現實世界,需要更多輸入資料。你們有沒有考慮讓模型接收來自感測器的資料,比如溫度、環境等?奧特曼:實際上,已經有不少開發者在這麼做了。他們通過我們的 API 把感測器資料接入,比如使用GPT-4(03模型)來進行處理。某些場景下,這種做法效果非常出色。更重要的是,我們的最新模型在處理這類非結構化或多模態資料時,比以往更強大。未來我們很有可能會在模型架構上,更明確地支援這類輸入。問:語音模型在OpenAI 的技術堆疊中處於怎樣的位置?未來會如何整合進 ChatGPT?奧特曼:語音互動對我們來說極其重要。坦率地說,目前我們的語音產品還遠未達到理想狀態,但沒關係。我們在文字模型上也經歷了很長的迭代過程,最終做得很好,語音也一樣會做到。我認為,一旦語音技術成熟,很多使用者都會更願意通過語音與 AI 互動。最讓我著迷的是,我們發佈的語音模式允許使用者一邊講話、一邊操作手機介面,這是一種“語音 + UI”的混合互動方式,非常有潛力。雖然目前還不夠理想,但一旦純語音體驗完善,它不僅將在現有裝置上大放異彩,還可能催生全新的人機互動裝置形態。如果AI真的實現“類人語音互動”,一切都將不同。問:程式設計對於OpenAI來說,是一個垂直場景,還是核心戰略?奧特曼:程式設計絕對是我們的核心戰略之一。目前,你向ChatGPT 提問,它返回的可能是文字或圖像。但未來,我們希望它直接返回可運行的程式碼。我們認為,程式設計將成為AI與現實世界互動的主要方式,AI通過寫程式碼呼叫API,實現任務執行。因此,ChatGPT 必須成為世界上最好的程式設計助手。我們的願景是:從“助手”演進為“智能體”,再演化成“完整的應用系統”。這個過程會是連續的、逐步推進的。問:在打造更強大模型的過程中,除了常見的“資料、算力、架構”三要素之外,還有那些關鍵因素被大家低估了?奧特曼:這些基礎要素確實都非常關鍵,但我認為,真正能帶來質變的,是演算法層面的重大突破。我們還可能看到一兩個“數量級等級”的演算法創新(10倍甚至100倍提升),雖然出現的機率不高,但只要出現一次,就將產生巨大影響。問:作為世界頂級機器學習團隊的領導者,你是如何在“放手讓天才研究自己感興趣的課題”和“自上而下推動重點項目”之間取得平衡的?奧特曼:確實有些項目必須高度協調,必須自上而下推進。但我認為很多組織在這方面走得太遠了。我們在創立 OpenAI 時,花了很多時間研究歷史上優秀研究實驗室的運作模式。現代參考案例其實並不多,所以我們主要從歷史中汲取經驗。經常有人問:“為什麼 OpenAI 總能不斷創新,而別的實驗室只是跟隨?”我們其實公開分享過那些經驗與原則,但很多團隊聽完之後,還是更傾向於走自己的老路,結果並不理想。說到底,科學研究本身是可以高效管理的,但前提是你得真正理解“管理”不等於“管死”。問:現在的大模型似乎已經可以幫助研究者解決一些人文學科長期未解的問題,比如藝術周期的變化、系統性偏見等。OpenAI 是否考慮與學術界展開合作,推動這類研究?奧特曼:我們確實設有學術合作項目,核心資源是模型存取權。其實,大多數研究者並不需要完全定製的技術支援,他們想要的是:對通用模型的自由呼叫,或者獲得底層基礎模型的運行權限。好在我們的架構非常適合這類需求。許多學術項目只需標準化API即可完成,OpenAI模型天然適合支援這類探索。雖然我們偶爾會參與一些定製化研究,但我們90%以上的精力,還是集中在提升通用模型能力。這是我們認為最具長期價值的路徑。七、OpenAI真正的野心是“讀懂你一生的AI”問:你怎麼看待模型的定製化?它是過渡方案還是長期路徑?奧特曼:在我理想中的狀態是這樣的:未來會有一個極其輕量、推理能力強大的模型,擁有兆級 token 的上下文窗口。它能夠記住你一生的所有對話、讀過的書、郵件、瀏覽記錄,並持續吸收新增資訊。它無需調整模型權重,僅憑這些上下文資訊就能做出精準推理。當前技術距離這一願景還有相當距離,所有現有方案都只能算是對理想形態的妥協。但我希望最終我們能實現這種純粹由上下文驅動的個性化AI系統。問:你認為未來12個月AI領域的主要價值創造點在那裡?是記憶功能、安全協議,還是智能體與現實世界的連接?奧特曼:歸根結底,價值創造依然集中在三大方向:AI基礎設施建設(更大規模的計算和部署能力)、更聰明的模型、以及將AI納入現實社會結構的“支架”——包括介面、流程和信任機制等。只要持續推進這三項,其他進展自然會跟上。如果細化來看,我認為2025年將是“AI智能體突破年”,尤其在程式設計領域,智能體可能成為主流應用場景之一。2026年或許將成為AI輔助發現新知識的元年,也許AI會參與甚至主導人類歷史上的重要科學發現。長遠來看,一旦人類完成對地球的“擴散與殖民”,經濟增長將主要依賴科學進步與知識的應用落地。我猜測2027年將是AI從“認知層”轉向“物理世界”的關鍵節點,機器人將從探索性項目變為真正的生產力工具。當然,這只是我的直覺式預測。問:GPT-5會不會比我們所有人加起來都聰明?奧特曼:如果你現在還覺得自己比GPT-4聰明很多,那也許還真得加把勁了—— 畢竟GPT-3已經非常強大了。問:你上次來這裡時,剛經歷了OpenAI的“高層風波”。事過半年,有什麼建議可以給創業者,關於“韌性”、“耐力”和“抗壓”能力嗎?奧特曼:作為創始人,你一定會不斷面臨新的挑戰,它們會越來越複雜,賭注也越來越高。但好消息是,你的情緒承受力會不斷增強。即便挑戰更大,處理它們所需的心理能量卻越來越少。你會逐漸變得更“抗打擊”,更擅長應對壓力。問:那一部分最難?是危機爆發當時,還是之後的餘波?奧特曼:其實,最難的不是危機爆發的那一刻。在那個時點,你往往會被腎上腺素驅動,資源和支援也會快速聚集到你身邊,你甚至會“自動進入戰鬥狀態”。最艱難的是風暴過後的恢復期。比如到了第60天,喧囂褪去,你開始清點殘局、重建信心、重新組織團隊——這才是真正考驗心理韌性的階段。很多人關注如何應對“Day 0”的危機爆發,卻忽視了“Day 60”的重建過程。而真正寶貴的能力,是你能在那種低谷中重新站起來。沒有那本書能教你怎麼做,但每經歷一次,你就能變得更強。 (筆記俠)