當地時間10月6日,OpenAI在舊金山舉辦DevDay 2025開發者大會。在大會正式開場前5小時,AMD與OpenAI的合作消息公佈,OpenAI將在未來數年部署高達6GW(千兆瓦)的AMD Instinct GPU。AMD已向OpenAI發行最高1.6億股認股權證,行權條件與晶片部署進度及股價里程碑掛鉤,如果OpenAI全額行權,可能獲得AMD約10%的股權,AMD股價一度暴漲30%。
有開發者吐槽“又被資本操作搶戲”,也有人認為這是刻意編排,先講底層算力,再講上層工具,恰好符合OpenAI從晶片到模型到應用的一體化敘事。
回到這次DevDay上,OpenAI發佈了Apps SDK(在ChatGPT內建構應用的完整框架)、AgentKit(快速建構AI Agent的工具套件)、Codex正式版以及GPT-5系列和Sora2等模型的API。Sam Altman開場公佈了一組增長資料,開發者數量從2023年的200萬增長到400萬,翻了一番。ChatGPT的周活躍使用者從1億飆升至8億,增長了8倍;API每分鐘處理的token量從3億暴漲到60億,這是20倍的增長。
8億周活意味著超級應用,這個體量已經具備了成為平台的基礎設施。DevDay中Apps SDK是最值得關注的重點,它標誌著ChatGPT更像一個平台和作業系統了。Altman的判斷很直接,AI已經從人們玩耍的東西,變成了人們每天建構的東西。這次DevDay的目標,就是讓更多開發者能直接在ChatGPT上建構應用和Agent,並且在這個擁有8億使用者的平台上開發和分發。
OpenAI開始蘋果化了。
OpenAI曾經嘗試過讓開發者在ChatGPT上建構應用,那就是2023年推出的GPTs。但GPTs本質上只是Prompt範本,能力有限且生態混亂,已經被OpenAI放棄。去年底Anthropic推出了MCP開放標準,試圖為AI應用互操作性提供統一框架,而今天發佈的Apps SDK,則是OpenAI基於MCP標準,再次嘗試讓ChatGPT成為一個應用平台。
Apps SDK是一個完整的開發框架,讓開發者能在ChatGPT內部建構真正的互動式應用。開發者可以用TypeScript或JavaScript編寫後端邏輯,通過MCP介面連線據、觸發操作,並渲染完全互動式的使用者介面。這不是簡單的API呼叫,而是在ChatGPT對話方塊裡運行的“小程序”。
舉幾個現場演示的例子就能明白它的能力,Coursera應用可以在對話中嵌入媒體播放器,使用者邊看課程邊向ChatGPT提問;Zillow能展示可篩選的互動地圖,使用者說“找帶院子的三居室”,地圖即時過濾結果;Canva則能直接根據對話生成海報,並把海報轉換成完整的PPT。
OpenAI還推出了應用對話(Talking to Apps)機制。Apps SDK提供了一套API,允許第三方應用將內部上下文即時暴露給ChatGPT。當你在Coursera應用裡看到視訊第5分鐘,ChatGPT知道你正在學什麼章節,當你在Zillow地圖上點開某套房子,ChatGPT能精準理解你關注的是那個地址、什麼價位。深度整合讓對話式互動真正有了實用價值。
現場演示中,當演示者說“Spotify,給我周五派對做個歌單”,ChatGPT自動調出Spotify應用,螢幕上顯示“使用Spotify生成此答案”的提示,幾秒後歌單就出現在對話方塊裡,可以直接點選播放。整個過程流暢自然,就像在iOS上切換App一樣。
首批合作應用包括Booking.com、Expedia、Figma、Spotify、Zillow、Canva和Coursera,未來幾周還會加入DoorDash、Uber、Target、OpenTable等。Apps SDK今天開放預覽版,開發者可以在Developer Mode中測試應用。今年晚些時候,OpenAI將開放正式提交通道,並提供應用目錄供使用者瀏覽。
Altman還透露了商業化計畫,Apps SDK未來將支援新的Agentic Commerce Protocol,允許使用者直接在ChatGPT內部即時結帳。
很多人會問GPTs不是已經失敗了嗎,Apps SDK會重蹈覆轍嗎?GPTs門檻接近零程式碼,但能力也被侷限,回覆始終是一條條消息。
Apps SDK則是程式碼為中心。開發者需要在自己的伺服器上編寫真正的應用程式碼,實現MCP伺服器介面,聲明OAuth 2.0登錄和互動式UI元件。ChatGPT只是把App嵌入對話流裡,真正的邏輯、狀態管理和資料儲存都在開發者手中。Apps可以彈出富互動元件(地圖、表單、媒體播放器)、長時間保持session,並可在後台自行拉取和推送資料。換句話說,GPTs是範本,Apps in ChatGPT是完整的小程序。
GPTs和GPTStore既不像App Store那樣標準化,也不像外掛那樣通用,多數GPT缺乏區別化價值,使用者難以形成持續使用習慣,開發者又難以變現、使用者難以發現優質內容,最終生態陷入空轉。
Apps SDK則完全不同。開發者必須通過實名驗證、伺服器驗證和功能測試才能上架。稽核前置,並引入了年齡分級和權限管理,類似App Store的標準。Altman還暗示會有更正式的收入分成方案。
在ChatGPT上,一個新的iOS的雛形就這樣長了出來。
Apps SDK建構的是ChatGPT的應用生態,而AgentKit則是OpenAI給開發者提供的Agent開發工具箱。Altman的判斷是,AI已經從“你提問的系統”進化到“能為你做很多事情的系統”,也就是Agent。但他也坦言,符合定義的Agent成功落地的很少。
AgentKit是一個完整的工具套件,包含四個核心元件:
Agent Builder,這是一個可視化畫布平台,讓開發者能像使用Canva一樣拖曳設計Agent的邏輯、步驟和工作流。它建立在OpenAI的Responses API之上,支援if-else邏輯節點、循環、使用者審批節點、檔案搜尋和資料轉換等模組化元件。開發者可以從預設範本開始(如客服機器人、資料增強、文件對比),也可以從零搭建自訂流程。
ChatKit,一個可嵌入的聊天介面元件。開發者可以把這個介面整合到自己的網站或應用中,帶來ChatGPT等級的對話體驗,同時保留自己的品牌、工作流和產品特色。它能處理流式響應、管理對話執行緒、顯示模型思考過程,讓整合聊天UI的複雜工作變得簡單。
Connector Registry,一個企業級的連接管理中心。管理員可以通過控製麵板統一管理Agent如何連接內部工具和第三方系統,設定權限、監控使用情況,同時保證安全性和合規性。
Agent Evals(評估工具),提供性能測量和最佳化能力。包括逐步追蹤評分(Trace Grading,理解Agent的決策步驟)、評估資料集、自動化提示詞最佳化,以及在OpenAI平台上直接對外部模型運行評估的能力。
在現場OpenAI工程師Christina Huang8分鐘的演示中。她從零開始,用Agent Builder建構了一個名為Ask Froge的DevDay網站Agent。快速地將一個靜態的會議網站建立一個智能問答助手,以提升使用者體驗。
她先設定了Agent的基本指令,然後加入了預建構的Guardrails(防護欄)用於PII資訊掩碼,接著連接了DevDay的日程資料,最後加入了自訂Widget來顯示會議時間表。整個過程不到8分鐘,Agent就部署到了DevDay官網,觀眾可以現場訪問使用。
企業案例中,零售巨頭Albertsons用AgentKit建構了幫門店經理分析銷量的Agent,當某個品類銷量下降(比如冰淇淋),系統會基於季節性趨勢、歷史資料和外部因素(天氣、節假日)給出診斷和建議。行銷軟體公司HubSpot則用它改進了Breeze AI客服工具,Agent能整合知識庫、尋找當地治療方案和保險政策細節,生成更有針對性的回覆。Box、Canva和Evernote也已開始使用該平台。
Altman說這是我們當初造第一個Agent時希望擁有的工具。降低門檻的邏輯很清晰,讓更多人能造Agent,OpenAI才能搶佔Agent開發生態的制高點。
而這個生態的門檻因為模型能力提升而足夠低的時候,app就會被agent們替代。
除了應用和Agent,OpenAI還宣佈了一系列基礎設施更新。
Codex正式可用,OpenAI的軟體工程Agent Codex結束研究預覽,進入通用可用(GA)階段。Codex現在運行在專門訓練的GPT-5-Codex模型上,這個模型在程式碼重構和程式碼審查等Agentic程式設計任務上表現更出色。自8月初以來,Codex的日均消息量增長了10倍,已處理超過40兆個token。
過去兩三個月裡,開發者社區能明顯感覺到Codex很火。一方面,OpenAI用GPT-5-Codex把"AI程式碼這條垂直賽道往前推了一步,在程式碼質量和推理能力上形成優勢,另一方面,Codex提供了價格透明、場景統一、穩定可預期的開發體驗。相比之下,不少開發者抱怨Claude Code存在限流、質量波動等問題,甚至有人已經把主要精力轉到Codex上。這次正式發佈,是OpenAI在程式碼生成領域持續發力的一步。
OpenAI展示了內部資料,工程師在使用Codex後,每周完成的Pull Request數量提升了70%,幾乎所有OpenAI的PR都經過Codex審查。Codex還新增了三個企業功能:Slack整合(可以直接在團隊頻道里讓Codex寫程式碼或回答問題)、Codex SDK(讓開發者在自己的工作流中嵌入Codex能力)、以及管理工具(包括環境控制、監控和分析儀表板)。
模型和API更新方面,GPT-5 Pro API向所有開發者開放,這是OpenAI目前最智能的模型,專為需要高精度和深度推理的場景設計,如金融建模、法律檔案分析和醫療診斷,定價為每百萬輸入token 15美元、每百萬輸出token 120美元。
OpenAI剛剛發佈全新的Sora 2模型及同名Sora App,應用上線後迅速走紅,Sora 2、Sora 2 Pro API也進入預覽階段,這個新一代視訊生成模型在可控性上有巨大飛躍,能根據詳細指令生成風格化、構圖精良的視訊,還能配上豐富的聲音景觀、環境音訊和同步音效。Sora 2 輸出每秒 0.1 美元,Pro 輸出每秒0.3 美元。
GPT-Realtime-Mini則是一個更小、更便宜的語音模型,比之前的高級語音模型便宜70%,但音質和表達力保持一致。OpenAI認為語音將成為人們與AI互動的主要方式之一,更經濟的模型能讓語音應用更快普及。
這次DevDay最重要的訊號是,ChatGPT不再只是一個Chatbot,而是正在成為一個完整的應用平台。Apps SDK讓開發者能觸達8億使用者,AgentKit降低了Agent開發門檻,Codex提升了軟體開發效率。OpenAI正在建構一個從應用分發、開發工具到基礎設施的完整生態。
從現場演示來看,這些Agent更像是對話式的App,它們依然需要後端邏輯、資料管理和UI互動,只是把入口從圖示點選變成了自然語言對話。這是互動方式的革命,但軟體開發的本質沒有改變,你還是需要懂業務、懂技術、懂使用者需求。
蘋果推出App Store時,沒人想到十年後會有幾百萬個App。OpenAI推出了Apps SDK,現在的問題不是Agent是否會替代App,而是開發者們是否真的會來,在ChatGPT上“Build something new”。 (矽星人Pro)