1小時前OpenAI再次放大招:推出名為Codex的雲端軟體工程智能體,由強大的codex-1模型驅動
Codex功能被描述為:Answers questions, runs code, and drafts PRs
簡單來說,Codex可以程式碼、測試、PR一站式搞定,它可以幫你:
• 編寫新功能
每一項任務都在獨立的雲沙盒環境中運行,並且會預裝好你的程式碼庫。目前,ChatGPT Pro、Team和Enterprise使用者今天就能嘗鮮,Plus和Edu使用者也快了!
網友已經在罵奧特曼了,plus使用者竟然沒有優先體驗權
Codex的“心臟”是codex-1,這是OpenAI o3針對軟體工程最佳化的專屬版本。它牛在哪?
1. 真實世界錘煉:通過強化學習在海量真實世界的編碼任務中訓練
操作直觀:
入口:ChatGPT側邊欄
下指令:輸入你的需求,想讓它幹活就點“Code”,想問問題就點“Ask”
獨立環境:每個任務都在隔離環境中處理,Codex能讀寫檔案、跑測試、用linter和類型檢查器等
即時進度:任務耗時1到30分鍾不等(看複雜度),進度條讓你心裡有數
任務完成後,Codex會提交更改,並提供終端日誌、測試輸出等可驗證的行動證據,方便你追溯每一步。你可以審查結果、要求修改、直接開PR,或者把程式碼整合到本地。甚至,你還能組態Codex環境,讓它無限接近你的真實開發環境
OpenAI的建議:
平行分配多個明確範圍的任務給不同的Codex Agent,並多嘗試不同類型的任務和提示,來摸索它的能力邊界
人工審查仍是王道:所有AI生成的程式碼,在整合和執行前,強烈建議人工審查和驗證,使用者可驗證,通過引用、終端日誌和測試結果來檢查Codex的工作,遇到不確定或測試失敗時,Codex會明確告訴你,幫你做決策
Codex在安全的隔離雲容器中運行。任務執行期間,網際網路訪問是停用的。它只能接觸到通過GitHub倉庫明確提供的程式碼,以及使用者通過設定指令碼組態的預裝依賴。想訪問外部網站、API或其他服務?沒門
智能引導:AGENTS.md檔案
Codex還能通過你倉庫中的AGENTS.md檔案(類似README.md)進行“調教”。這些檔案可以告訴Codex:
• 如何導航你的程式碼庫
就像咱們人類開發者一樣,一個組態完善的開發環境、可靠的測試和清晰的文件,能讓Codex發揮出120%的功力
在SWE-Bench Verified和OpenAI內部SWE任務基準測試中,codex-1表現搶眼,即使沒有AGENTS.md檔案也優於o3-high模型。它能產出比OpenAI o3更整潔、可直接供人工審查和整合的程式碼補丁
OpenAI內部:工程師們已經用Codex處理日常的重構、重新命名、寫測試等重複性任務,還用它搭建新功能、修Bug、起草文件。它甚至能幫忙分流on-call問題、規劃日初任務、處理後台工作,大大減少了工程師的上下文切換
外部測試夥伴:
* Cisco:用Codex加速將雄心勃勃的想法變為現實,並共同塑造Codex的未來。
* Temporal:加速功能開發、偵錯、測試執行和大型程式碼庫重構,讓工程師更專注。
* Superhuman:提升測試覆蓋率、修復整合故障,甚至讓產品經理也能貢獻輕量級程式碼(只需工程師Code Review)
* Kodiak(自動駕駛):編寫偵錯工具、提升測試覆蓋、重構程式碼,加速其自動駕駛技術的研發。還記得上個月OpenAI發佈的輕量級終端編碼助手Codex CLI嗎?它主要用o3和o4-mini模型
今天,OpenAI為其推出了一個更小的codex-1版本(可理解為o4-mini的特化版),專為CLI最佳化:
更快工作流:CLI體驗更絲滑。
低延遲:程式碼問答和編輯響應迅速。
保持強項:指令遵循和程式碼風格依然優秀。
默認選擇:已成為Codex CLI和API中codex-mini-latest的默認模型
連接開發者帳戶到Codex CLI也更簡單了:
ChatGPT帳戶登錄:選擇你的API組織。
自動組態API金鑰。
福利:Plus和Pro使用者通過ChatGPT登錄Codex CLI,分別能獲得5美元和50美元的免費API額度(有效期30天,今天晚些時候生效)
Codex本體:今天起向全球ChatGPT Pro、Enterprise和Team使用者推出。Plus和Edu使用者支援稍後就來。初期會有免費訪問額度,之後會轉為限速訪問和按需付費選項
codex-mini-latest API定價:每百萬輸入token 1.5美元,輸出token 6美元,還有給力的75%提示快取折扣
Codex當前侷限性,
暫缺功能:如前端工作所需的圖像輸入、任務中途的人工干預修正
遠端代理任務耗時比本地互動式編輯長,需要點時間適應。
OpenAI設想的未來是:開發者主導核心工作,將其他任務委託給AI智能體,從而更快、更高效。他們正建構一套支援即時協作與非同步委託的Codex工具:
• 即時配對(如Codex CLI)已成常態,非同步、多智能體工作流是下一站
OpenAI正與合作夥伴共同探索AI智能體廣泛應用對開發者工作流、技能發展及地域差異的深遠影響
這,僅僅是個開始
(AI寒武紀)