OpenAI深夜炸彈!AI程式設計師Codex正式“上崗”,程式設計師顫抖還是一起加班?

1小時前OpenAI再次放大招:推出名為Codex的雲端軟體工程智能體,由強大的codex-1模型驅動


Codex功能被描述為:Answers questions, runs code, and drafts PRs

簡單來說,Codex可以程式碼、測試、PR一站式搞定,它可以幫你:

• 編寫新功能

  • • 即時解答程式碼庫的各種疑問
  • • 修復Bug
  • • 提出PR(Pull Request)

每一項任務都在獨立的雲沙盒環境中運行,並且會預裝好你的程式碼庫。目前,ChatGPT Pro、Team和Enterprise使用者今天就能嘗鮮,Plus和Edu使用者也快了!

網友已經在罵奧特曼了,plus使用者竟然沒有優先體驗權

Codex的核心引擎與特點

Codex的“心臟”是codex-1,這是OpenAI o3針對軟體工程最佳化的專屬版本。它牛在哪?

1. 真實世界錘煉:通過強化學習在海量真實世界的編碼任務中訓練

  1. 2. “人味”十足:生成的程式碼風格和PR偏好都高度擬人化,力求與你的團隊無縫對接
  2. 3. 精準執行:嚴格遵循指令
  3. 4. 迭代測試:能自己跑測試,不通過不罷休,直到拿到“綠燈”。

Codex如何使用?

操作直觀:

入口:ChatGPT側邊欄

圖source:@testingcatlog

下指令:輸入你的需求,想讓它幹活就點“Code”,想問問題就點“Ask

獨立環境:每個任務都在隔離環境中處理,Codex能讀寫檔案、跑測試、用linter和類型檢查器等

即時進度:任務耗時1到30分鍾不等(看複雜度),進度條讓你心裡有數

任務完成後,Codex會提交更改,並提供終端日誌、測試輸出等可驗證的行動證據,方便你追溯每一步。你可以審查結果、要求修改、直接開PR,或者把程式碼整合到本地。甚至,你還能組態Codex環境,讓它無限接近你的真實開發環境

OpenAI的建議

平行分配多個明確範圍的任務給不同的Codex Agent,並多嘗試不同類型的任務和提示,來摸索它的能力邊界

人工審查仍是王道:所有AI生成的程式碼,在整合和執行前,強烈建議人工審查和驗證,使用者可驗證,通過引用、終端日誌和測試結果來檢查Codex的工作,遇到不確定或測試失敗時,Codex會明確告訴你,幫你做決策

Codex在安全的隔離雲容器中運行。任務執行期間,網際網路訪問是停用的。它只能接觸到通過GitHub倉庫明確提供的程式碼,以及使用者通過設定指令碼組態的預裝依賴。想訪問外部網站、API或其他服務?沒門

智能引導:AGENTS.md檔案

Codex還能通過你倉庫中的AGENTS.md檔案(類似README.md)進行“調教”。這些檔案可以告訴Codex:

• 如何導航你的程式碼庫

  • • 運行哪些測試命令
  • • 項目有哪些標準規範

就像咱們人類開發者一樣,一個組態完善的開發環境、可靠的測試和清晰的文件,能讓Codex發揮出120%的功力

性能如何?資料說話!

在SWE-Bench Verified和OpenAI內部SWE任務基準測試中,codex-1表現搶眼,即使沒有AGENTS.md檔案也優於o3-high模型。它能產出比OpenAI o3更整潔、可直接供人工審查和整合的程式碼補丁

早期使用者怎麼說?

OpenAI內部:工程師們已經用Codex處理日常的重構、重新命名、寫測試等重複性任務,還用它搭建新功能、修Bug、起草文件。它甚至能幫忙分流on-call問題、規劃日初任務、處理後台工作,大大減少了工程師的上下文切換

外部測試夥伴

*   Cisco:用Codex加速將雄心勃勃的想法變為現實,並共同塑造Codex的未來。
*   Temporal:加速功能開發、偵錯、測試執行和大型程式碼庫重構,讓工程師更專注。
*   Superhuman:提升測試覆蓋率、修復整合故障,甚至讓產品經理也能貢獻輕量級程式碼(只需工程師Code Review)
*   Kodiak(自動駕駛):編寫偵錯工具、提升測試覆蓋、重構程式碼,加速其自動駕駛技術的研發。

Codex CLI也迎來升級,更快更便捷!

還記得上個月OpenAI發佈的輕量級終端編碼助手Codex CLI嗎?它主要用o3和o4-mini模型

今天,OpenAI為其推出了一個更小的codex-1版本(可理解為o4-mini的特化版),專為CLI最佳化:

更快工作流:CLI體驗更絲滑。
低延遲:程式碼問答和編輯響應迅速。
保持強項:指令遵循和程式碼風格依然優秀。
默認選擇:已成為Codex CLI和API中codex-mini-latest的默認模型

連接開發者帳戶到Codex CLI也更簡單了:

ChatGPT帳戶登錄:選擇你的API組織。
自動組態API金鑰。
福利:Plus和Pro使用者通過ChatGPT登錄Codex CLI,分別能獲得5美元和50美元的免費API額度(有效期30天,今天晚些時候生效)

Codex 定價與侷限

Codex本體:今天起向全球ChatGPT Pro、Enterprise和Team使用者推出。Plus和Edu使用者支援稍後就來。初期會有免費訪問額度,之後會轉為限速訪問和按需付費選項

codex-mini-latest API定價:每百萬輸入token 1.5美元,輸出token 6美元,還有給力的75%提示快取折扣

寫在最後

Codex當前侷限性,

暫缺功能:如前端工作所需的圖像輸入、任務中途的人工干預修正

遠端代理任務耗時比本地互動式編輯長,需要點時間適應。

OpenAI設想的未來是:開發者主導核心工作,將其他任務委託給AI智能體,從而更快、更高效。他們正建構一套支援即時協作與非同步委託的Codex工具:

• 即時配對(如Codex CLI)已成常態,非同步、多智能體工作流是下一站

  • • 兩種互動模式將融合:開發者將在IDE和日常工具中與AI智能體協作——提問、獲取建議、分派較長任務,形成統一工作流
  • • 更深度整合:Codex將與GitHub、Codex CLI、ChatGPT桌面端,乃至你的問題跟蹤器和CI/CD系統深度整合

OpenAI正與合作夥伴共同探索AI智能體廣泛應用對開發者工作流、技能發展及地域差異的深遠影響

這,僅僅是個開始

(AI寒武紀)