太帶勁了!搶先Claude 5,OpenAI深夜祭出了一個編碼殺器——Codex。它可以讓一人指揮多Agent平行協作,自帶Skills,編碼從此進入自動化時代。
Claude 5的腳步聲越來越近,奧特曼終於坐不住了。
就在剛剛,OpenAI毫無預警地拋出「王炸」——Codex正式進化為獨立的桌面App。
這不僅僅是一個寫程式碼的窗口,更是一個能同時指揮千軍萬馬(多個Agent)的「全能指揮部」。
Codex定位非常明確:要做Agent的「指揮中心」
具體來說,Codex可以做到以下幾點:
假設想要為相簿裡的照片加入「拖曳」功能,選擇「工作樹」,即可讓AI在同一倉庫中各司其職。
Codex的進化令人毛骨悚然,它不僅生成程式碼,還學會了利用程式碼作為「Skills」來操控電腦。
比如想要解決項目中的Comment,直接呼叫安裝好的Skills,Codex立刻就把問題破解了。
不僅如此,OpenAI僅憑一句話,就讓Codex消耗700萬 token,徒手搓出一個3D版賽車遊戲。
這一次,Codex的誕生,並非是新瓶裝舊酒,更不是一次毫無誠意的「套殼」包裝。
它標誌著AI程式設計正式從「對話助手」進化為「指揮中心」。
奧特曼激動表示,「真是愛了愛了,它比我想像中還要驚喜」!
「AI程式設計師就是不會耗盡多巴胺。他們不會感到沮喪,也不會耗盡能量。它們會一直堅持下去,直到解決問題」。
OpenAI總裁Greg牆裂推薦——
我多年來一直是終端和Emacs的鐵粉,但自從用了Codex之後,再回到終端簡直感覺像穿越回了過去,代差太明顯了。
這種感覺,就像是一個專門為開發而生的AI智能體原生介面。
OpenAI Codex代表著一種全新的AI Coding範式,極有可能重塑開發者與程式碼互動的邏輯。
甚至,Codex還可與Claude Cowork狂飆能力,把雜亂桌面瞬間清理乾淨。
目前,Codex正式在macOS上線,Windows版即將推出。
OpenAI還放出了「限時福利」,ChatGPT免費使用者和Go版本也可用上Codex,Plus、Pro、Business、Enterprise和Edu計畫的使用者,速率直接翻倍。
macOS版Codex應用,是一個功能強大的新介面。
它能讓開發者能輕鬆駕馭多個AI智能體,平行處理任務,並與AI協作搞定那些耗時的大活兒。
過去一直以來,開發者和AI的關係是「結對程式設計」,你寫一段,它接一段。
如今,Codex的出世將徹底改變軟體建構的方式——
人類不再與AI緊密結對,直接給AI委派任務,貫穿於軟體設計、建構、發佈和維護的全生命周期。
這一轉變的苗頭,實際上從2025年4月發佈Codex以來,便已初見端倪。
開發者與AI的協作方式已發生了根本性轉變。
現有模型可以端到端地處理複雜的、長流程的任務,開發者也開始在跨項目中指揮多個AI智能體:
分派工作、平行跑任務,並放心地把耗時數小時、數天甚至數周的重大項目交給 AI 。
核心挑戰已不再是AI能做什麼,而是人們如何大規模地指揮、監督並與它們協作——
遺憾的是,現有的IDE和終端工具並非為此而生。
這種全新的建構方式,加上模型能力的提升,呼喚著一種全新的互動載體。
這正是OpenAI要推出Codex桌面應用的原因,主打「一個AI智能體的指揮中心」。
Codex為與AI智能體多工平行,建構了一個專注的空間。
所有AI在按項目組織的獨立線程中運行,確保你無縫地在任務間切換,而不會丟失上下文。
你可以在應用裡直接檢查AI的改動,在diff上寫評論,甚至用編輯器打開進行手動調整。
它還內建了對Git worktree的支援,所以多個AI可以在同一個倉庫(repo)上開工而互不衝突。
每個AI都在你程式碼的隔離副本上工作,讓你能探索不同的開發路徑,而無需操心它們會如何影響你的主程式碼庫。
當AI智能體幹活時,可以把改動拉(checkout)到本地,或者讓它繼續推進,完全不動本地的git狀態。
應用會自動從Codex CLI和IDE擴展中同步會話歷史和配置,這樣你馬上就能在現有項目中用起來。
Codex正從一個只會寫程式碼的AI,進化為一個能用程式碼在電腦上真正解決問題的AI。
通過Skills(技能),可以輕鬆擴展Codex的能力。
今後,Codex不再侷限於程式碼生成,還能處理資訊收集與整合、問題解決、寫作等任務。
Skills就像是打包好的指令、資源和指令碼,讓Codex能可靠地連接工具、運行工作流,並按照團隊的習慣完成任務。
Codex應用裡有一個專門的介面來建立和管理Skills。
你可以明確要求Codex使用某個Skill,或者讓它根據手頭的任務自動呼叫。
OpenAI舉了一個例子,曾讓Codex做一個賽車遊戲——
要有不同的車手、八張地圖,甚至還有玩家能用空格鍵觸發的道具。
利用圖像生成 Skill(由GPT Image驅動)和網頁遊戲開發Skill,Codex僅憑最初的一個使用者提示詞,就獨立工作並消耗了超過700萬個Token,把遊戲做了出來。
它身兼數職,既是設計師、遊戲開發者,又是QA測試員,通過實際試玩來驗證成果。
可以看到,在只消耗了6萬token的這個版本裡,畫面非常粗糙。
很窄的賽道中間,塞滿了撞上去會穿模的「障礙物」。
技能箱可以吃,也可以發射,但好像沒有什麼效果。
最尷尬的是,你會永遠在「第二圈」無限循環下去……
在80萬token的版本裡,畫面似乎好了一些,賽道也寬敞了不少,更接近大家平時玩的賽車遊戲了。
但是箱子吃到的技能好像沒什麼用,發射出去之後,小車們還是各跑各的……
而且依舊會在第二圈陷入循環,永遠跑不完。
最後這個700萬token的版本,畫質明顯好了很多。不僅有清晰的賽道,技能箱也更精緻了。
這次,技能箱確實有用了。
比賽剛開始,我們就吃了AI扔出的一個大招,沒有閃。於是,喜提倒數第一,
不過,比起前兩個陷入無限循環的世界來說,這次至少能完賽了。
從跑評測和盯著模型訓練,到起草文件和匯報增長實驗,OpenAI內部建構了數百個Skills,來幫助多個團隊自信地把以前很難統一定義的工作委派給Codex。
Codex應用內建了一個Skills庫,涵蓋了OpenAI內部流行的工具和工作流,下面重點介紹幾個。
使用Vercel和圖像生成Skills更新網站
使用電子表格Skill建立表格以生成購物清單
使用Linear管理你的Issue Backlog
當你在應用中建立一個新Skill時,Codex可以在你工作的任何地方使用它:應用內、CLI或IDE擴展中。
你也可以把Skills提交到程式碼倉庫,讓整個團隊都能用上。
Codex可以設定Automations(自動化),按計畫在後台自動幹活。
Automations將指令與可選的Skills結合,會按照你設定的時間表運行。
當Automation完成時,結果會進入審查佇列,可以隨時切回來查看並根據需要繼續後續工作。
在OpenAI,團隊一直用Automations來處理那些重複但重要的任務,比如每日Issue分類、尋找和總結CI失敗原因、生成每日發佈簡報、檢查Bug等等。
開發者在與AI合作時口味各不相同。
有人喜歡直截了當、只講執行的搭檔;有人則喜歡話多一點、更有互動感的風格。
Codex現在允許開發者在兩種個性間選擇——一種是簡潔務實風,另一種是更具對話感和同理心的風格。
兩者的能力完全一樣,只為貼合你的喜好。只需在應用、CLI和IDE擴展中輸入/personality命令即可切換。
此外,OpenAI還將「設計即安全」(Security by Design)的理念融入了Codex AI智能體棧的方方面面。
Codex 應用採用了原生的、開源且可配置的系統級沙箱(Sandboxing),這就跟在Codex CLI裡一樣。
默認情況下,Codex AI 智能體只能編輯它當前工作的資料夾或分支裡的檔案,並使用快取的網頁搜尋。
如果需要運行像聯網訪問這類需要更高權限的命令,它會先請求你的許可。
你可以為項目或團隊配置規則,允許特定命令自動以提升的權限運行。
如今,企業和開發者正越來越依賴Codex進行端到端開發。
自12月中旬發佈GPT-5.2-Codex以來,Codex的總使用量翻了一番,過去一個月裡有超過100萬開發者使用Codex。
下一步,團隊繼續擴展Codex使用場景,包括上線Windows版應用、不斷突破模型能力邊界,以及實現更快的推理速度。
OpenAI科學家感慨,過去幾周寫的程式碼比過去幾年還要多。而且,還用Codex修復了Prism多個bug和功能更新
在應用內部,OpenAI還將根據實際反饋持續打磨多AI智能體工作流,讓管理平行任務和在AI間切換變得更容易,且不丟失上下文。
他們還在為Automations開發基於雲端的觸發器支援,這樣Codex就能在後台持續運行——而不僅僅是在你電腦開著的時候。
Codex建立在一個簡單的前提之上:一切皆由程式碼控制。
一個AI智能體在推理和生成程式碼方面越強,它在各類技術和知識工作中的能力就越強。
然而,當今的一個關鍵挑戰在於,前沿模型的能力與人們在實際中輕鬆使用它們之間存在差距。
Codex旨在縮小這一差距,讓人們更容易指揮、監督並將OpenAI模型的全部智慧應用到實際工作中。
OpenAI致力於將Codex打造成最強的程式設計AI智能體,這也為它成為能處理程式碼之外廣泛知識工作的全能AI奠定了基礎。
在製作上面這款賽車遊戲時,Codex使用的初始提示詞如下(總結精煉版):
使用Three.js實現Voxel Velocity作為一個3D體素卡丁車賽車遊戲,只有一種模式:單人比賽(總是3圈,1個人類對7個CPU,所有8條賽道立即在這個模式下可用,沒有進度限制)。建構一個最小的賽前流程,僅包括:賽道(8),角色(8),難度(輕鬆/標準/刻薄),可選的鏡像模式,可選的允許克隆,和開始比賽,加上一個選項菜單和一個賽中暫停菜單(恢復/重新開始/退出)。建立一個街機駕駛模型,具有靈敏的操控,寬容的擦牆碰撞,有意義的漂移作為主要技能,以及一個漂移充電系統,產生精確的加速等級(1級0.7秒,2級1.1秒,3級1.5秒),同時保持基準速度「快但可讀」,並且在寬闊的道路上保持持續的超車。實現正好8個道具,單道具容量,微妙的位置加權分佈,和溫和的效果(最大失控≤1.2秒,最大轉向停用≤0.6秒),創造滑稽的混亂而沒有硬眩暈,加上在加速期間減少50%的越野減速。定義8個角色及其給定的統計資料和AI傾向,實現CPU難度預設和賽道編寫的賽車/變化樣條線,漂移區和危險迴避,以便AI使用多車道寬度進行乾淨的超車,並行布HUD/音訊要素(位置,圈數/最後一圈橫幅,小地圖,道具槽,計時器/分段,可讀的音效,和每個賽道一個音樂循環)。
隨後,Codex不斷地被從10個通用提示詞的隨機列表中重新提示,以繼續處理這個問題。
其中一個提示詞的例子是:
你的工作是加入新功能,使遊戲更接近原作。首先,玩遊戲並確定與原作相比缺少了什麼。然後挑選幾個缺失的功能並實現它們。在每個功能之後,徹底測試它,通過玩遊戲並確認它工作正常。如果你在玩的時候注意到任何錯誤,也要優先修復它們。 (新智元)