#Codex
超級應用的平台野心!OpenAI版小程序誕生!奧特曼深夜五連發!ChatGPT可內建應用,Codex超強更新,AI建構者時代已至
一不留神,OpenAI 正式直接將ChatGPT聊天變成了各大app的平台入口了。就在 5 個小時前,OpenAI 再次更新了超級AI原生應用的定義!!!剛進入10月,OpenAI接連甩出了5連炸。Sora2隻是開胃菜!就在昨天凌晨2點,大洋彼岸的舊金山再次被OpenAI點燃了!Sam Altman 帶領著OpenAI終於實現了驚豔一跳:AI時代,超級AI原生應用已經從聊天進化成了內建應用入口平台了!“我們希望今天能給你一些新的靈感,去創造屬於你的作品。我們希望 OpenAI 能成為這個全新創造時代的理想平台。”OpenAI DevDay上,50分鐘左右的keynote,掌聲接連不斷。看得出來這次開發者對於OpenAI的發佈是真的太喜歡了!可以說,時隔兩年,這是最親民的一次發佈。奧特曼特別挑明了這次DevDay的主題:“讓AI建構變得更容易”。今天,我們要聚焦一件對你們最重要的事:讓 AI 建構變得更容易。我們一直在傾聽開發者的聲音——瞭解你們遇到的瓶頸,以及下一步想建構什麼。小編特地一早為大家整理了會上的發佈內容。這次發佈有四項精彩的主題:首先,OpenAI展示了開發者已經可以在 ChatGPT 裡直接建構應用,同時可以幫助更高效地觸達使用者。其次,如何更快、更好地建立智能體(Agents)。第三,如何讓寫程式碼變得更輕鬆——讓 AI 處理那些重複性工作,從而讓你專注於系統和創造力。第四,OpenAI帶來了新的模型和 API 的更新。這是有史以來最適合當“建構者”的時代!奧特曼用加速度來形容這場發佈——“從想法到產品,從未如此快速。你能真切地感受到這種加速度。”ChatGPT中直接建構App:應用直接裝在Chat中OpenAI 宣佈推出一種全新的方式,讓開發者可以在 ChatGPT 內直接建構應用程式。從周一開始,ChatGPT 使用者將能在聊天介面中訪問來自 Booking.com、Expedia、Spotify、Figma、Coursera、Zillow 和 Canva 等公司的互動式應用。同時,OpenAI 也發佈了 Apps SDK 的預覽版——這是一套供開發者使用的工具包,用於建立這些應用。據悉,開發者今天就可以開始使用了。至於推出的理由,奧特曼這樣描述這個新發佈:“我們希望 ChatGPT 成為一個幫助人們更好地前進的平台——讓他們更高效、更有創造力、更快地學習,更好地完成自己想做的事情。嵌入 ChatGPT 的應用程式,將讓新一代的應用變得更加互動、適應性更強、更加個性化,而且使用者可以直接通過聊天與它們互動。”但不難想像,這套新系統是 OpenAI 最新一次試圖在其旗艦 AI 產品 ChatGPT 周圍建構“應用生態”的努力。此前,OpenAI 曾通過 GPT Store 讓開發者製作互動式應用(當然最後市場的反應似乎並不是很成功)。但與那種獨立的應用程式商店不同,這次推出的“內嵌應用”直接整合進 ChatGPT 的回答中,讓使用者在日常對話時即可呼叫第三方工具。這樣既為開發者提供了更好的分發管道,也讓 ChatGPT 的使用者體驗更加豐富。具體怎麼操作?使用者只需在 ChatGPT 中輸入不同應用的名稱,就能調取來自各種服務的內容。例如,使用者可以說:“Figma,把這張草圖變成一個可用的流程圖”,以呼叫 Figma 應用。也可以輸入:“Coursera,教我一點機器學習相關的內容”,來呼叫 Coursera 應用。在 Zillow 的應用演示中,使用者可以用自然語言讓 ChatGPT 搜尋符合特定價格區間的公寓。隨後,ChatGPT 會生成一張互動式地圖展示結果,使用者還能通過對話瞭解各個房源的更多細節。此外,ChatGPT 還會在對話中主動推薦可能有幫助的應用。例如,當使用者請求“幫我為這周末的派對生成一個歌單”時,ChatGPT 可能會自動呼叫 Spotify 應用。未來,OpenAI 計畫將 DoorDash、Instacart、Uber 和 AllTrails 等更多應用引入 ChatGPT。OpenAI同時表示,這一系統是基於 Model Context Protocol(模型上下文協議,MCP)建構的——該協議允許開發者將他們的資料來源連接到 AI 系統。ChatGPT 應用不僅能觸發特定動作,還能在聊天介面中直接渲染完整的互動式介面。有些應用甚至可以在 ChatGPT 中播放視訊,視訊會固定在網頁頂部,並可根據使用者的需求進行動態調整。如果使用者已經訂閱了某項服務,他們將能夠直接在 ChatGPT 中登錄帳戶,使用部分特定功能。奧特曼還透露,OpenAI 未來會支援在 ChatGPT 內對應用進行商業化,包括通過公司最近推出的“即時結帳”(Instant Checkout)功能來付費購買。此外OpenAI還同步上線了一份開發者建構指南。地址:https://developers.openai.com/apps-sdk/app-developer-guidelines不過,圍繞 ChatGPT 應用系統的關鍵問題仍在於隱私和資料訪問範圍。OpenAI 表示,開發者“必須僅收集最低限度所需的資料,並對權限保持透明”。但目前尚不清楚開發者能訪問到使用者的全部聊天內容、最近幾條消息,還是僅能看到觸發該應用的提示語。此外,ChatGPT 在面對多個競爭服務(例如 DoorDash 與 Instacart)時如何選擇也仍是未知數。外界推測公司未來可能允許品牌付費提升曝光,但 OpenAI 表示,它的首要原則仍是“以使用者體驗為中心”。奧特曼這樣評價 Apps SDK:這是一種“在正確時間找到正確應用”的全新方式,同時也為開發者提供了新的曝光途徑。當然,小編髮現只有Plus或Teams使用者可以使用,相信漫漫就會向免費用放開。Agentkit:更快更好地建構部署智能體接下來的Agentkit也是本場DevDay的精彩看點。奧特曼上來就指出了現在建構生產級Agent的痛處:跟數千個團隊交流後,OpenAI在思考一個問題:既然 Agent 正在重新定義“工作”,那麼 OpenAI 能不能讓建構 Agent 變得更容易?所以這次全新的解決方案 AgentKit,就是專為希望“從想法快速到成品”的開發者而生。AgentKit 是 OpenAI 平台中的一整套模組化建構工具,幫助你將 Agent 從原型快速推向生產。建構、部署、最佳化,全流程也都有了。ps:大家都知道市面上的已經不少Agent框架發佈了,這次OpenAI的下場,勢必會加劇該領域市場的競爭。AgentKit 有三大核心元件。第一,Agent Builder。一個快速的可視化工具,讓你能直觀地設計邏輯步驟、測試流程、實現創意。它基於 OpenAI 廣泛使用的 Responses API 建構——已有數十萬開發者熟悉並使用它。第二,ChatKit。通過它,開發者可以輕鬆地把優質對話體驗整合到自己的應用中。你將獲得一個簡潔、可嵌入的聊天介面,可以自由定製品牌風格、工作流邏輯,專注於讓你的產品更具獨特性。下面視訊中可以看到,ChatKit 如何在每個 Agent 節點之間流暢工作,甚至呼叫工具,以生成最優回覆。第三,Evals for Agents。專門用於評估 Agent 性能的新功能。包括:Trace Grading(跟蹤評分):逐步分析 Agent 的決策邏輯;Datasets(資料集):評估單個 Agent 節點表現;自動提示最佳化(Automated Prompt Optimization);甚至可以在 OpenAI Evals 平台內直接評估外部模型。“這是我們在最初建構 Agent 時夢寐以求的一整套工具。”除此之外,在安全的資料訪問方面,也十足重要。OpenAI表示,通過此前發佈的 Connector Registry(連接器註冊中心),開發者可以安全地將 Agent 與內部系統或第三方服務連接,所有訪問都可通過管理員面板進行控制,既靈活又安全。奧特曼還親自展示了幾個例子。他提到了一家非常具有規模化的連鎖店智能體使用的例子。不同資料來源、不同系統協同運作,生成真正有用、合理的答案。這也是使用 AgentKit 能實現的體驗。“目前,已有多家出色的首發合作夥伴借助 AgentKit 成功規模化部署了 Agent。從今天起,所有人都可以開始使用。”更強大的 CodexApp、Agent 之後,下面則是軟體開發領域的智能體Codex。奧特曼特別提到了,軟體開發智能體降低開發門檻這件事。在日本,一位 89 歲的退休老人在 ChatGPT 的幫助下自學程式設計,他已經為老年人開發了 11 款 iPhone 應用,把自己一生的智慧變成了幫助他人獨立生活的工具。但這並不是重點,重點是,今天OpenAI終於全面開放了自家內部在使用的Codex,而不僅僅是預覽版!上一次Codex推出大量新功能還是8月份,跟隨GPT-5一起發佈: GPT-5 Codex 模型。該模型在程式碼重構和程式碼審查等任務上表現更佳,還能根據任務複雜度動態調整思考時間。奧特曼透露道,開發者非常喜歡這個新模型。Codex 的使用量增長極快。“我們關注的一個關鍵指標是每日消息量——也就是開發者每天與 Codex 的任務和對話次數。自 8 月初以來,這個數字增長了 10 倍。這種快速增長也讓 GPT-5 Codex 成為了我們增長最快的模型之一。自發佈以來,我們已處理超過 40 兆 tokens。”那這一次帶來的 Codex 版本自然也有一系列新功能,主要有以下幾點,主要是面向工程團隊推出的更新。第一,Slack 整合。這是很多人強烈要求的功能。現在你可以在團隊的 Slack 對話中直接讓 Codex 寫程式碼或回答問題。第二,新的 Codex SDK,幫助團隊在自己的工作流中擴展和自動化 Codex。第三,新的管理與報告工具,包括環境控制、監控和分析儀表盤等,幫助企業更好地管理 Codex。此外值得一提的是,與Anthropic的定位不同,奧特曼將Codex的使用者定位更廣——最鼓舞人心的一點,是 Codex 使用者的廣度:從周末寫 side project 的獨立開發者,到高速成長的初創公司,再到全球企業。比如 Cisco 已經在整個工程組織內部署了 Codex,他們的程式碼審查速度提升了 50%,項目周期從數周縮短到了幾天。通過 Codex 和 OpenAI 的 API,把你身邊的任何東西都變成可運行的軟體。OpenAI負責人還展示了幾個非常有意思的功能:比如在IDE環境裡的Codex,提示詞可以很簡短,自動理解上下文。另外還可以通過語音即時的氛圍互動,此外也可以接入已經開發好的MCP。這位負責人在語音模式過程中,全程沒有敲一行字,Codex可以即時的進行互動,並完美的按照語音指令,連接起了草稿、裝置,完成了現場拍攝照片的任務,可以說達到了一個小高潮!回到語音模式——“你能讓 Codex 顯示一個像電影片尾那樣的字幕動畫,演員名單就是在場的觀眾嗎?”“我正在用 Codex 處理,很快告訴你結果。”“太好了。那能同時倒數並給我們拍張合影嗎?”——搞定!(歡呼與掌聲)API 中新增的模型:GPT5-Pro、Sora2、精簡版語音模型為了極大拓展 AI 的可能性,OpenAI這次還在API中新發佈了GPT-5 Pro、Sora 2 和 Realtime Mini。其中 GPT-5 Pro被奧特曼成為有史以來最智能的模型。而Realtime Mini 則是一款高級語音模型的精簡版。Sora2自然不用說了,國慶節剛剛宣佈,現在算是終於上線API了。寫在最後:可怕的OpenAI時隔第一次 OpenAI Dev Day,已經過去兩年。OpenAI 給業界帶來的想像力真的可以說是恍如隔世。用奧特曼的話來形容,OpenAI的開發者生態已經發展到足以讓Google、蘋果都難以小覷的程度:回到 2023 年,當時我們有 200 萬開發者,1 億 ChatGPT 周活使用者。我們的 API 每分鐘處理約 3 億個 token,當時我們覺得這已經很多了。如今,已有 400 萬開發者在使用 OpenAI。每周有超過 8 億人使用 ChatGPT。我們的 API 每分鐘處理超過 60 億個 token。400萬開發者、8億周活躍使用者、每分鐘API呼叫量超過60億Token。而,這些數字自然是OpenAI作為最強大的模型供應商所帶來的虹吸效應,但僅僅只是如此嗎?這次開發者日的發佈,顯然說明,OpenAI的版圖遠不止於模型這麼簡單。從GPTs的嘗試,再到如今的直接將應用裝到ChatGPT的Apps SDK、再到一站式的Agentkit、視訊領域的Sora2、音訊領域的Realtime API,據說在硬體領域奧特曼和ive也已經開發出了全新一代的智能互動終端。可以說ChatGPT已經從一個聊天軟體逐漸演變成一個無所不能、無所不包含的超級平台。Apps SDK,幫助你在 ChatGPT 中建構原生應用;AgentKit,讓你能更自信地部署智能體;更強大的 Codex,助你和團隊更快完成產品發佈;在 API 中新增的模型:GPT-5 Pro、Sora 2 和 Realtime Mini,它們將極大拓展 AI 的可能性。所有這一切,奧特曼如是說:“OpenAI的目標,是讓 AI 對每個人都有用。”那對於我們技術人而言,請不要遲疑,沒錯,正在見證一場重大變革。網際網路時代,大家搞起了LAMP框架;移動開發時代,大家紛紛成為Android開發者、iOS開發者;而如今,相信地球上開始誕生一種名曰“OpenAI”開發者或者“ChatBot”開發者的稱謂。因為時代的車輪推進如此之快,以前需要幾年、幾個月的軟體開發,現在通過ChatGPT,只需幾分鐘。“之前複雜的基礎設施似乎再也不用多加考慮了,你只需要一個好的idea!”多麼可怕的未來,多麼可怕的OpenAI!AGI時代的巨頭已然成型了! (51CTO技術堆疊)
OpenAI Codex徹底火了,4個官方前端提示示例給你
gpt-5-codex徹底火了,很多人已經從Claude code 轉向 codex了,只能說使用者都是牆頭草,只要工具好,一秒切換,毫不猶豫,OpenAI 趁熱打鐵,官方codex示例和提示詞也來了gpt-5-codex在響應式和移動端前端開發方面表現非常好,以下是一些示例和提示詞1.像素遊戲English:Make a pixel art game where I can walk around and talk to other villagers, and catch wild bugs.中文:做一個像素風遊戲,我可以在裡面四處走動,和村民們交談,還能捕捉野生的昆蟲2.工作管理平台English:Give me a work management platform that helps teams organize, track, and manage their projects and tasks. Give me the platform with a kanban board, not the landing page.中文:給我一個工作管理平台,用來幫助團隊組織、跟蹤和管理項目與任務。我想要的是帶有看板的平台本身,而不是它的介紹頁3.根據草圖製作網頁English:Given this image as inspiration. Build a simple html page joke-site.html here that includes all the assets/javascript and content to implement a showcase version of this webapp. Delightful animations and a responsive design would be great but don't make things too busy.中文:以這張圖片為靈感,在這裡建立一個名為 joke-site.html 的簡單 HTML 頁面。頁面需要包含所有必要的資原始檔(assets)、JavaScript 和內容,用以實現這個網頁應用的展示版本。如果能有令人愉悅的動畫和響應式設計就更好了,但別把頁面弄得太花哨4.根據線框圖轉化為應用程式English:"I have this wireframe, can you convert it to a real app for me? Generate HTML / inline CSS code for this website. Include CDN links for Tailwind / Bootstrap etc. Save your output to a file called index.html in the container's current directory."中文:我有一個線框圖,你能幫我把它轉換成一個真正的應用程式嗎?請為這個網站生成 HTML 和內聯 CSS(inline CSS)程式碼,並引入 Tailwind、Bootstrap 等框架的 CDN 連結。然後,將輸出結果保存到容器當前目錄下一個名為 index.html 的檔案中可以試試以上提示詞,看看是否可以復現 (AI寒武紀)
OpenAI深夜放出「程式設計核彈」:GPT-5-Codex 正式發佈,能獨立爆肝7 小時
OpenAI 剛剛推出了 GPT-5-Codex ——這是在 GPT-5 基礎上專門為軟體工程最佳化的版本,也是 Codex 有史以來最大的一次升級,感覺這是全面對標Claude code的一個更新,但又與Claude code不同這次更新的核心變化主要有三點:1.GPT-5-Codex 模型上線:專門訓練於真實世界的複雜工程任務,包括從零搭建項目、大規模重構、生成測試、偵錯和程式碼審查,實現了計算資源的動態調度,可以獨立完成長達7小時的複雜重構任務2.工具全面升級:Codex CLI 重新設計、IDE 外掛支援 VS Code 等主流環境、GitHub 整合更深,雲端和本地環境無縫切換3.程式碼審查能力強化:能自動在 PR 中發現關鍵漏洞、減少無效評論,直接提出並實現修改建議。OpenAI四月首次推出 Codex CLI,五月推出 Codex web ,兩周前將 Codex 統一為一個由 ChatGPT 帳戶連接的單一產品體驗,能夠在本地環境和雲端之間無縫切換工作,而不會丟失上下文。現在,Codex 可以在開發的任何地方工作(終端或 IDE、在網頁上、在 GitHub 中, ChatGPT iOS 應用中)現在可以在 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 訂閱方案中使用,使用額度根據方案不同而異,Business 和 Enterprise 方案還提供購買額外積分或共享積分池的選項。GPT-5-Codex 計畫很快通過 API 提供,詳情請看 ChatGPT 使用限制https://developers.openai.com/codex/pricing終端體驗:$ npm i -g @openai/codex以下是詳細資訊:此次升級的核心是全新的 GPT-5-Codex 模型。作為 GPT-5 的一個特殊版本,它專為 agentic coding 進行了深度最佳化。GPT-5-Codex 的訓練資料聚焦於真實世界的軟體工程場景,使其能夠勝任從零建構完整項目、加入功能與測試、偵錯、執行大規模程式碼重構,乃至進行嚴謹程式碼審查等全方位任務本次更新還統一了 Codex 的產品體驗。使用者現在可以通過單一的 ChatGPT 帳戶,在本地環境和雲端之間無縫切換工作,而無需擔心上下文丟失。Codex 已深度整合到開發者日常的全流程中,覆蓋終端、IDE、網頁、GitHub,甚至 ChatGPT iOS 應用。功能已包含在 ChatGPT Plus、Pro、Business、Edu 及 Enterprise 方案中此次升級的目標是打造一個能深刻理解使用者工作上下文、與開發者並肩作戰、並能可靠地為團隊分擔任務的程式設計隊友GPT-5-Codex本體GPT-5-Codex 經過專門訓練,具備更強的可引導性,能更精準地遵循 AGENTS.md 檔案中的指令,並生成更高品質的程式碼。開發者只需簡單描述需求,即可獲得符合預期的成果,無需再為編碼風格或程式碼整潔度編寫冗長的指令1. 在關鍵基準測試中表現卓越GPT-5-Codex 的強大能力在多個行業標準和內部基準測試中得到了驗證在SWE-bench Verified (n=500)基準測試中,GPT-5-Codex 的精準率達到 74.5%,超越了 GPT-5 的 72.8%在極具挑戰性的程式碼重構任務(涵蓋 Python, Go, OCaml 等語言)上,其性能提升尤為顯著,精準率從 33.9% 大幅躍升至 51.3%。一個典型的例子是,它成功處理了一個來自 Gitea 的 Pull Request,該任務涉及修改 232 個檔案和 3,541 行程式碼2. 動態調整思考時間,兼顧速度與深度GPT-5-Codex 的一個關鍵特性是它能根據任務的複雜性動態調整計算資源。對於定義明確的小請求或即時聊天,其響應會非常迅速;而對於大型重構等複雜任務,它會投入更長的時間進行持久、獨立的執行。測試結果顯示,GPT-5-Codex 能夠連續獨立工作超過7個小時,不斷迭代實現方案、修複測試失敗,並最終成功交付這種效率也體現在tokens生成上。根據 OpenAI 內部員工流量資料顯示,對於簡單任務(token生成量最低的10%),GPT-5-Codex 比 GPT-5 減少了93.7%的token。而對於需要深度推理的複雜任務(token生成量最高的10%),它會投入更多資源,token生成量增加了102.2%,以確保高品質的輸出3. 更精準、更高品質的程式碼審查GPT-5-Codex 經過專門訓練,擅長髮現程式碼中的關鍵缺陷。它會導航程式碼庫,梳理依賴關係,並運行程式碼和測試來驗證正確性。評估結果顯示:不正確評論大幅減少:由 GPT-5-Codex 提出的不正確評論比例從 13.7% 驟降至 4.4%。高影響力評論顯著增加:其提出的高影響力評論比例從 39.4% 提升至 52.4%更聚焦重點:它平均每個 PR 提出的評論數更少(從1.32降至0.93),這意味著它更專注於提出關鍵、有價值的建議,避免了資訊過載此外,GPT-5-Codex 在前端任務中也非常強,能夠建立美觀的桌面和移動應用。具備多模態能力,可以接收使用者提供的圖像或截圖作為輸入,在雲端工作中直觀地檢查其進度,並向使用者展示其工作的截圖需要注意的是: 與通用模型 GPT-5 不同,官方建議僅在 Codex 或類似的代理式程式設計環境中使用Codex 生態系統全面更新為使 Codex 成為更出色的結對程式設計師,其整個生態系統也獲得了全面更新1. 全新 Codex CLIOpenAI 依據社區的反饋,對開放原始碼的 Codex CLI 進行了重建。現在,它支援:附加和分享圖像:直接在 CLI 中傳送截圖、線框圖和設計稿,以建立清晰的設計共識智能任務跟蹤:對於複雜工作,Codex 會生成一個待辦事項列表來跟蹤進度強大的工具集:整合了網頁搜尋、MCP 等工具,以連接外部系統,且工具使用更加精準最佳化的終端 UI:工具呼叫和程式碼差異(diffs)的展示格式更清晰易讀簡化的審批模式:提供唯讀、自動(工作區外需審批)和完全訪問三種模式,並支援壓縮對話狀態以管理長會話。詳情請看 Codex CLI 快速入門https://developers.openai.com/codex/cli2. Codex IDE 擴展Codex 現已深入整合到開發者的 IDE 中,支援 VS Code、Cursor 及其他 VS Code 分支利用本地上下文:Codex 能利用使用者已打開的檔案和選中的程式碼,讓使用者用更短的提示獲得更快、更精準的結果無縫雲端協作:使用者可以在 IDE 內建立雲端任務、跟蹤進度、審查結果,甚至直接在 IDE 中打開雲端任務進行最後修改,Codex 會全程保持上下文同步。詳情請看 IDE 擴展快速入門https://developers.openai.com/codex/ide3. Codex 雲雲端代理現在更貼近開發工作流,讓使用者無需離開編輯器或 GitHub 即可委派任務性能大幅提升:通過容器快取技術,新任務和後續操作的中位完成時間縮短了90%自動化環境設定:Codex 會自動掃描並執行項目中的設定指令碼(如 pip install),以配置運行環境和依賴可視化工作流:與 CLI 類似,使用者可以使用圖像分享設計規範或UI錯誤。Codex 可以在自己的瀏覽器中建構、迭代,並附上最終成果的截圖到任務或 GitHub PR 中。詳情請看官方檔案https://developers.openai.com/codex/cloud4. 智能程式碼審查Codex 的程式碼審查遠超傳統的靜態分析工具。它能理解 PR 的真實意圖,結合整個程式碼庫和依賴關係進行推理,並執行程式碼和測試來驗證行為自動化審查流程:為 GitHub 倉庫開啟後,Codex 會在 PR 從草稿變為就緒時自動進行審查並行布分析報告互動式修復:如果 Codex 建議修改,使用者可以直接在 PR 評論區要求它來實施按需觸發:使用者也可以通過 @codex review 或更具體的指令(如 @codex review for security vulnerabilities)來隨時請求審查在 OpenAI 內部,Codex 已經審查了其絕大多數的 PR,每天捕獲數百個問題,極大地提升了團隊的開發速度和信心https://developers.openai.com/codex/cloud/code-review安全沙盒環境:默認情況下,無論本地還是雲端,Codex 都在停用了網路訪問的沙盒中運行,以防止有害操作和提示注入攻擊權限控制:在執行潛在危險操作前,Codex 會請求使用者許可。開發者可以根據風險承受能力自訂安全設定,例如在雲端限制網路訪問到受信任的域,或在 CLI/IDE 中審批高權限命令透明與可追溯:Codex 會提供引用、終端日誌和測試結果,幫助使用者理解它的工作過程。官方始終建議將 Codex 視為輔助審查工具,而非人類審查的替代品與 OpenAI 對 GPT-5 的方法一致,GPT-5-Codex 在生物和化學領域被視為高能力模型,並已實施了嚴格的安全措施來最小化相關風險。 (AI寒武紀)
Sam Altman 宣布:CodeX 勢頭正猛,飆漲10倍!
Claude Code 最近表現拉胯,OpenAI 的Codex 卻開始狂飆!剛剛,Sam Altman 興奮地宣布,Codex 的使用量在過去兩周內暴漲了10 倍!這個成長速度可謂驚人。而另一邊,則是不少開發者反映友商Claude Code 最近降智明顯,程式碼理解能力和生成品質都不如從前。這一升一降之間,市場格局似乎正在悄悄改變。你可能會想,CC 不是挺好的嗎?怎麼OpenAI 的Codex 就突然開始爆發了呢?事實上,降了Claude Code 自個作死降智之外,Codex 也確實是戳中了許多開發者的痛點。setHacked(@setHacked) 表示非常喜歡用它來建構項目:很有趣,用它來建立專案!如果擴充能支援聊天功能就更好了,可以討論整個程式碼庫,而不是總是發布任務。當然也有用戶抱怨速度問題。 PastePad(@pastepad) 稱:喜歡它。就是希望能快一點!面對用戶的熱情,Sam Altman 承諾還有更多改進即將到來,但現在的勢頭已經讓人印象深刻。有趣的是,用戶們對定價策略有不少建議。arthur(@arthurbnhm) 和Flakon(@f_demaku) 都提到希望有 100 美元的訂閱檔位。Annie Annie(@AnnieAn51263550) 則建議推出30-50 美元的中階訂閱,提供比Plus 更高的使用限制。Shayan(@ShayanX69420) 也呼籲:請增加Plus 的限制,或添加50-100 美元的訂閱選項!開發者們就是這樣純樸而不忠誠,願意為更好的服務付費。用戶關心的其他問題也都很實際。Jmopix(@CarterrrT) 遇到了本地歷史記錄無法保存的bug:為什麼codex 的本地歷史記錄在我的VS Code 中沒有儲存?我只能看到雲端記錄。重啟VS 後本地聊天歷史就消失了。YogenshaSilver(@YogenshaSilver) 則期待獨立版Codex 能支援模型選擇功能。有趣的是,留言區也充斥著大量非CodeX 用戶關於GPT-4o 的抗議聲。多位用戶使用 #keep4o 和 #4oforever 標籤,要求OpenAI 保留4o 模型和基礎語音模式。Bio_LLM(@Bio_LLM) 甚至直接質疑:Sam?抱歉這麼問,但你聾了嗎?由紀春希(@Elune_Wren) 的諷刺更加尖銳:哦,Sam,如果你不用那些眼睛和耳朵,為什麼不捐給真正需要的人呢?看來用戶對OpenAI 頻繁調整產品策略屬實是不滿…ji yu shun(@kexicheng) 提出了一個關鍵問題:你的優先順序只是服務編寫程式碼的使用者嗎?請停止忽略其他使用者的需求。關於未來發展,用戶們的期待集中在幾個方面:luis mangione(@MangioneDelDato) 詢問plan mode 何時推出,以及是否會有多個平行子代理功能。@alexanderTt_95(@1_apollo33060) 和xKim0(@ak_kim0) 都在問GPT-5 Pro 何時能在API 中使用。Amine Hachemi(@amiinehachemi) 則稱:下一波AI 工程師不會是那些讀遍所有論文的人。而是那些真正能將AI Agents 投入生產的人。當Claude Code 在走下坡路時,OpenAI 的Codex 正在全速前進。10 倍成長或許不是終點,Sam Altman 說:這,只是開始。(AGI Hunt)
程式設計師從此不再寫程式碼!紅杉專訪Codex團隊,o3白菜價真相曝光
【新智元導讀】紅杉專訪OpenAI Codex團隊揭示AI程式設計的未來:從工具協作邁向「非同步自主Agent」時代。Codex正從程式碼補全演化為可獨立完成任務的智能體。此外還有更大爆料!未來的AI Coding會是什麼樣子?Copilot、Cursor、Windsurf還是Claude Code?都不是!而且你一定也猜不到。在紅杉最新專訪中,OpenAI Codex產品負責人Alexander Embiricos描述了他的理想未來:下一個AI Coding範式不再是和編碼助手配對合作,讓AI進行程式碼補全;而是徹底將任務全部委託給智能體——一種真正的「非同步自主Agent」。軟體從開發&測試的傳統「線性模式」,變成了「經紀人模式」:Agent與人類的關係,從「配合」徹底切換成「多工委託」。更大膽的設想還在後頭——Alexander說,未來的軟體開發介面或許不再是IDE,而是像Tinder或者TikTok的訂閱資訊流。Agent不斷推送工作進展,人類只需滑動決定Approve(通過) or Not。Sora製作的未來程式設計範式應用Codex核心理念一改以往程式碼補全邏輯,強調「大膽委託心態」:讓Agent平行運行多個任務,用Agent自動完成所有繁瑣工作——bug修復、重構、功能開發……而開發者則退居幕後,主導審查、規劃與驗證,從「親自動手」轉向「高效稽核」。Codex模型雖然基於o3,但進行了微調,更有「工程味」和「品位」。Codex不再是單純求解競賽難題的AI學霸,而是一個懂得PR描述、風格對齊、測試覆蓋的成熟工程師。另一個令人驚訝的消息是,把o3的價格打到「白菜價」的原因竟然也是Codex!OpenAI秘密使用Codex作為內部智能體軟體工程師來「遞迴的」最佳化推理成本——而這僅僅只是個開始。2025,註定是Agent元年,而OpenAI的大棋是:未來不再有「專門的Agent」,ChatGPT將成為唯一通用助手,接入所有介面,接管一切。Codex能否成功承載這個理想,也許年底就能見分曉。紅杉專訪Codex團隊精華版1 Codex演進路線:從工具到智能體Codex最初是程式碼補全模型,如今已發展為能在雲端獨立運行的程式設計智能體。使用者可將完整任務交給Codex完成,輸出如PR(Pull Request)等實際成果。未來,使用Codex完成任務,甚至無需觸碰電腦。2 與傳統自動補全的區別相較於o3等模型專注於競賽程式設計,Codex通過強化學習微調。更符合專業開發者的真實工作風格,輸出更可合併、更實用的程式碼。3 實際應用場景與優勢Codex特別擅長修復bug與執行重複任務,OpenAI內部工程師通過平行提交多個任務,顯著提升開發效率。未來開發者將主要做「稽核與決策」,而非具體程式設計。4 人與AI協作的新範式Codex強調的是「委託」而非「配對」。未來,AI將獨立在雲端運行,開發者只需提供任務描述。Codex將會嵌入CLI、IDE、項目管理工具等各類開發工具中。5 編碼之外的開發流程重塑軟體開發不僅是寫程式碼,更包括規劃、設計、部署和維護。Codex未來目標是覆蓋整個開發流程,甚至提出開發計畫、撰寫文件、參與維運等。6 行業影響與未來展望隨著AI程式設計工具門檻降低,「專業開發者」總量或將增加。未來開發者的日常可能更像「Tinder」式管理流式任務,由多個Agent提交工作成果,人類僅需篩選與稽核。7 訓練環境與挑戰Codex在訓練和推理階段都使用相同的容器化環境,解決了「只在我機器上能跑」的問題,實現了高度一致的開發體驗。8 未來形態與願景未來將不再區分「寫程式碼的Agent」與「助手Agent」,ChatGPT將統一一切,具備終端、瀏覽器等通用工具,適應使用者所有需求。9 IDE介面將被「刷資訊流」模式替代Alexander爆料,未來的軟體開發介面可能像Tinder那樣呈現:Agent不斷提交任務成果,你滑一滑決定是否通過。這一理念背後是「富足心態」:不再是補全狀態下的一行程式碼一個建議,而是多個任務平行執行、多個結果一起提交——未來的AI能力就像水一樣,任意使用。未來的程式設計,就好像訂閱了無數的智能體一樣,你只需決定使用誰的成果。遞迴自我改進的人工智慧Codex和紅杉採訪之外還有更大的爆料!OpenAI已經在內部運行遞迴自我改進的人工智慧!她的名字叫Alice。她已經存在,並且還在工作,只是還沒有完全穩定,沒有完全獲得「人類」的信任。據Satoshi介紹,Alice已經可以自主設計、評估和改進新的模型架構。這並不是推測,也不是理論,這是一種自我引導智能的開始。一旦解決了Alice的問題,就會進入模型自我升級的階段,其速度比任何人類工程師團隊都要快。Codex所預示著AI Coding未來似乎已經觸手可及。 (新智元)
X和OpenAI加入Rust重寫潮!馬斯克宣佈:基於Rust的X有了“比特幣風格加密”,慘被幣圈技術大佬群嘲:根本不懂!
馬斯克又放大招了——這次輪到 X 也加入 Rust 重寫潮了!他宣佈,X 內建的私信功能 XChat 已經完成 Rust 重構,並聲稱採用了“比特幣風格加密”。這句“比特幣風格加密”,聽上去是一種“不明覺厲”的術語,普通使用者只覺得大概是更安全了,而玩幣圈的技術黨則一頭霧水。Reddit 上,比特幣社區直接開貼發問:馬斯克說 Rust 重構後帶有“比特幣風格加密”,這到底是什麼意思?一位Reddit網友直接“貼臉開大”,毫不留情地說:馬斯克的技術水平很低。 如果他說了什麼技術性的話,請忽略。那回到技術本身——Rust,是否代表著安全?用Rust重構,是否正在成為“認真做系統”的象徵”?幣圈大佬集體懟:“比特幣根本沒加密”!比特幣核心開發者 Luke Dashjr 發表評論稱:“比特幣甚至不使用加密。”他還補充說,使用 Rust 語言從安全形度來看“是個壞主意”。Dashjr 的觀點反映了比特幣開發社區中一部分人的保守立場,即在安全關鍵的系統中應儘量避免引入新的程式語言和工具鏈,以符合比特幣強調的可審計性和最小依賴原則。馬里蘭大學電腦科學助理教授 Ian Miers 也公開指出術語本身就不靠譜:“比特幣所謂的‘加密’,其實是數位簽名機制,不是真正意義上的加密。”他更進一步指出:“‘比特幣風格’和‘Rust’,都不是加密方案的技術描述,也無法自動成為衡量通訊安全性的標準。”他還特別提醒:除非加密消息只在本地 App 內完成端到端處理,否則它的加密元件很可能不止使用 Rust。換句話說,即使 XChat 的某些部分是用 Rust 實現的,只要它涉及伺服器端轉發、雲端儲存或跨平台通訊,那它就必然依賴其他語言和系統元件協同工作。Rust 在其中的作用,可能只是建構鏈上的一環,而非決定安全性的“核心引擎”。XChat 的 Rust 重寫細節尚不明確,或借鑑ECDSA 簽名機制XChat 使用 Rust 語言重寫的實現細節尚未公開,而“比特幣風格加密”這一模糊術語,更是在技術社區引發了大量猜測與解讀。在 Reddit 上,許多開發者認為,XChat 可能借鑑了比特幣的簽名機制,採用了 ECDSA(橢圓曲線數位簽名演算法)來確保消息的完整性和不可否認性。這種機制在比特幣中用於驗證交易的有效性,而在通訊系統中,則可以用於驗證消息的傳送者身份和內容的未被篡改。有網友評論道:所以……XChat 將使用 ECDSA。 好的。 HTTPS 也使用 ECDSA。 SSH(遠端登錄協議) 也是。 並不新奇。確實,在 Rust 生態中已有多個成熟的 ECDSA 實現庫,如 k256 與 ecdsa,支援 secp256k1 曲線(即比特幣改採用的曲線類型)。這些庫提供了金鑰管理、簽名生成與驗證等核心功能,適用於建構高性能、記憶體安全的加密通訊系統。當然,以上推測是基於公開術語與生態合理性進行的技術推測和解讀,如果能等來馬斯克本人的“官方揭秘”就更權威了。“安全”不是用 Rust 就自動獲得的Rust 常被譽為“更安全的語言”,確實有其技術優勢:記憶體安全:編譯器在編譯期就能防止空指針、越界、懸掛引用等問題;無資料競爭:並行模型設計得更穩,不容易踩多執行緒的坑;無垃圾回收(GC):減少性能抖動,適合高性能通訊場景;但語言只是工具,真正決定安全性的,往往是“怎麼用”它:金鑰怎麼儲存? 是不是明文寫在配置檔案裡?加密邏輯實現是否可靠? 用的演算法有沒有已知漏洞?有沒有做沙箱隔離? 能否防止越權訪問、介面暴露?依賴項有沒有審計? 第三方庫會不會成為供應鏈攻擊入口?簡單地說,Rust 提供的是“更穩的地基”,但房子是否牢靠,還得看設計圖和施工隊。如果實現草率、權限設計混亂,再安全的語言也救不了系統。OpenAI 的 Codex CLI 也用Rust重寫了:但理由比較“務實”Rust 近年來確實在開發者社區中受到了越來越多的關注。馬斯克的老對手 Sam Altman 也開始“擁抱 Rust”——不過方式和理由都給的更加明確。據報導,OpenAI 已將即將發佈的 AI 命令列編碼工具 Codex CLI 用 Rust 語言重寫,目標是提升性能與安全性,同時擺脫對 Node.js 的依賴。Codex CLI 是一款 AI 程式設計助手,可運行在 macOS、Linux 及 Windows(通過 WSL)平台,目前已開源託管在 GitHub 上。當前版本主要使用 TypeScript 編寫,運行依賴 Node.js。項目的主要維護者 Fouad Matin 表示,Rust 重寫的一個直接動機就是繞過 Node.js 帶來的環境依賴問題:“Node.js 對一些使用者來說既令人沮喪,也可能成為使用障礙。”Matin 總結了選擇 Rust 的四大理由:零依賴安裝:當前版本要求 Node.js 22 或以上,對部分使用者是門檻;沙箱機制需求:在 macOS 上,Codex CLI 使用 Apple Seatbelt 的 sandbox-exec 命令執行沙箱化;在 Linux 上默認沒有沙箱,OpenAI 建議放入容器中運行。而 Rust 版本已支援在 macOS 上繼續使用 sandbox-exec,在 Linux 上使用Landlock 實現隔離;最佳化性能:Rust 無需執行階段垃圾回收,記憶體開銷更低;相容模型上下文協議(MCP):Rust 版本可同時作為 MCP 客戶端和伺服器使用,而這對 CLI 的擴展至關重要。寫在最後:Rust 是趨勢,但別神化它Rust 是為系統級程式設計設計的語言,運行效率遠高於基於 V8 引擎的 JavaScript。但代價是開發難度更高,因此生產力可能不如 TypeScript 或 JavaScript。在各大程式語言流行度調查中,Rust 的熱度雖穩步上升,但仍屬於“小眾中的明星”。但即便如此,Rust 的優勢已經讓許多開發團隊心甘情願為其效率和安全性“付出代價”。除了 X 和 OpenAI,Vue.js 作者 Evan You 最近也宣佈,其前端建構工具 Vite 將逐步以 Rust 編寫的新打包器 Rolldown 替代現有的 Rollup.js。他表示,這一切帶來了“3 到 16 倍的建構加速,以及高達 100 倍的記憶體佔用下降”。可見,這一波 Rust 重寫潮可能會持續很久,也會逐步向前端、工具鏈、AI 開發平台等多個方向快速滲透。當然,Rust 並非“萬能鑰匙”,並不是每個項目都適合強行遷移。工程選型,永遠要回到產品目標、團隊能力和長期可維護性的平衡。有網友在討論中反駁比特幣開發者Dashjr:“Rust 不夠安全?我倒覺得十年之內比特幣也會用 Rust 重寫!” (51CTO技術堆疊)
OpenAI:GPT-5將實現大統一,Codex最佳實踐是這樣的
GPT-5將實現大統一Codex發佈後,OpenAI Codex在Reddit舉行了AMA(Ask Me Anything)活動在這場1 小時的AMA 中,Codex 核心研發和研究負責人圍繞:為什麼先推雲端代理、CLI 為何用TypeScript、未來多語言繫結與IDE 外掛、GPT-5 與Operator 的整合、定價與API 計畫、安全沙箱、最佳實踐等問題給出了清晰路線圖:Codex-1 目前是「雲端沙箱+ ChatGPT 原生入口」的研究預覽,面向大倉庫+ 測試驅動工作流程效果最佳;CLI 走開源+ API 計費,本體將在Plus/Pro 長期整合並提供「彈性」付費;短期不會給代理外網,但已支援--approval-mode full-auto;他們希望10 年內實現“按規格即可落地可靠軟體”,並將Codex、Operator、Deep Research、Memory 等工具融合為一套完整代理體系詳細Q&ACodex產品定位與長期願景1 .為什麼先做雲端本地CLI 因單機算力與執行緒受限,只適合輕量任務;雲端可並行跑多個容器並隔離風險,是先髮型態10 年願景:給予「合理規格說明」即可在可觀時間內得到可靠軟體;雲端並行+ 沙箱是實現路徑。2 .GPT-5 與Codex、Operator 等工具是什麼關係?GPT-5 是下一代「統合」模型,目標是將Codex、Operator、Deep Research、Memory 等工具融合成“一體化桌面代理”,真正替使用者在電腦上執行任務CLI 設計與多語言計畫之所以選TypeScript,是作者@pourlefou 最熟悉且擅長做終端UI;很快就會提供高效能引擎並做多語言繫結Codex使用場景與最佳實踐最擅長:大倉庫+ 明確單元測試;拆小任務優於一句“幫我造一個App”Ask → Code 工作流程:先用Ask Mode 解析設計檔案自動拆任務,再交給Code Mode;AGENTS.md 內寫入測試/格式化/提交範本可顯著提升成功率Ask vs Code 邊界:目前由使用者明確切換,兩種模式各跑獨立容器,後續將探索帶有「記憶」的自適應流程並支援多repo任務上限:ChatGPT 版預設讓單任務跑滿一小時,以保障解決複雜問題安全模型與聯網策略代理取得執行階段後即斷網,只用本地repo 與預載入檔案,確保可審計輸出;未來會逐步開放“安全聯網”CLI 已支援--approval-mode full-auto,但仍處於雲端沙箱中—放權與安全會一起前進接取方式與計費CLI:開源,需要正常API 計費;不會因為你是Pro 就免tokenChatGPT 內的Codex:Pro/Team/Enterprise 使用者兩周內享「慷慨配額」;Codex 將長期整合Plus/Pro,並提供彈性付費選項(不限量+按需)正在面向Pro 使用者逐步灰度;行動端支援“在網頁裡用”,App 原生入口“很快上線”API 與生態路線Codex-1 目前僅適配ChatGPT UI,不直接開放API;團隊正努力讓代理能透過API 呼叫,並支援更多Git 託管與工作流程工具 (AI寒武紀)