再見,人類程式設計師!OpenAI自曝:一行程式碼都不寫了,100%用Codex

【新智元導讀】100%是用Codex寫的。還有內部爆料說,Codex讓他們僅用三天時間就搭出了伺服器,三周就發佈了APP。人類程式設計師,真的要退出歷史舞台了?

矽谷的空氣裡再次充滿了躁動,而這一次的震源中心,回到了OpenAI。

OpenAI的奇點時刻,也要來了?

就在剛剛,X被一條爆料徹底刷屏——

Codex,已經正式接管了OpenAI研究員「Roon」100%的程式碼編寫工作!

Roon發出了感慨萬千的宣告:

程式設計一直很痛苦,然而卻是必經之路。我很高興,它終於結束了。
我驚訝於自己竟然這麼快就擺脫了程式設計的陰影,而且一點都不懷念它。甚至我有點遺憾,從前的電腦為什麼不是這樣的。

早在去年12月,Claude Code之父Boris Cherny就曾投下一枚震撼彈——

自己對Claude Code的貢獻100%都是由Claude Code完成的。

這一「套娃式」的自我進化,直接引爆了矽谷的自動編碼狂潮。

面對如此巨大的蛋糕,OpenAI顯然不會拱手相讓。

如今,反擊已經開始。

在剛剛過去的末,Sam Altman已經公開預告:接下來一個月會發佈一堆關於Codex編碼模型的新產品。

社區的風向也開始發生微妙的轉變。

一些資深開發者評論道:在90%的情況下,GPT-5.2-Codex都能一次性完成我提出的請求。

Claude雖然不錯,但它偶爾會偷偷插入「壞程式碼」;相比之下,OpenAI的新方案更像蘋果——主打一個開箱即用。

看來,Codex和Claude Code的大戰,已經一觸即發!

人類寫程式碼的時代,徹底結束?

OpenAI研究員Roon的這個爆料,也讓網友們直言:AI終於到達了這個奇點!

看來,人類直接手寫程式碼的時代,真的結束了。

經過多年的模型迭代與資料積累,我們似乎真的站在了一個臨界點上:

人類直接手寫程式碼,正在變得不再有任何意義,甚至是一種效率的浪費。

在Roon的評論區,人們開始集體對程式設計時代說再見。

是的,我熱愛電腦,熱愛軟體開發,對我而言,程式設計只是實現目標的手段,僅此而已。
複雜的語法只是是我們為了讓邏輯得以執行而必須付出的昂貴代價。
如今,這些中間商終於可以退場了。

激進的觀點開始湧現。

甚至有人建議,既然不需要人類閱讀程式碼了,我們就該讓模型跳過人類可讀的彙編語言,直接使用機器程式碼。

今天的程式設計就像曾經的打孔卡一樣,應該永遠消失了。

與此同時,另一個炸裂的消息從OpenAI內部流出——

一位研究員爆料,在Codex的輔助下,他們僅用了三天時間,就從零搭建了OpenAI的MCP伺服器,並完成了規模驗證。

不僅如此,他們還在3周內推出了Sora的Android應用;此外,還有一大波由Codex建構、甚至由Codex自我稽核的內部工具正在排隊上線。

如果沒有Codex的話,很難想像OpenAI能以如此驚人的速度發佈產品。

有趣的是,這位大佬似乎還玩起了Claude Code之父的梗:

過去30天,我花了大量時間稽核Plan和PR,幾乎沒寫一行程式碼!

有人評價,這正是「起飛」第一階段的樣子。

而下一步,或許就是真正的端到端AI自主研究。

還有人問,確定你們這不是行銷?

這位研究者詳細解釋說,絕對不是。

具體的使用過程是這樣的:

首先,他會花很多時間來撰寫規格說明,並在腦海中構想輸出應該是什麼樣子。

然後,會啟動一個「4×Codex」的雲端並行任務。這樣不僅可以一次性看到多種不同的變體,也能補上自己一開始遺漏的細節。

接下來,就是讓Codex自己發揮。等它跑完,人類再介入進行測試和驗證。

Codex CLI 0.9+來了!

既然「人機協作」的範式已經改變,那麼承載這種範式的工具自然也要升級。

面對Anthropic在的步步緊逼,OpenAI顯然有備而來。

就在今天,Codex CLI連續推送了兩次更新,版本號直接來到了0.91.0。

其中,Codex 0.9.0帶來了最受大家期待的功能——Plan Mode(計畫模式)

Code模式是Codex的默認體驗,它的工作方式和其他AI智能體一樣。

這點咱們就不多費口舌了。

但Plan模式則完全不同,它將程式設計任務拆解為兩個截然不同的階段:

第一階段:理解意圖(明確目標、劃定範圍、識別約束條件、制定驗收標準)

第二階段:技術規格(生成決策完備的實施方案)

在這種模式下,輸出的內容非常詳盡,無需任何後續追問即可直接執行。

Plan模式最聰明的地方在於:它堅持「證據優先探索」

在開口問問題之前,Codex會先在你的程式碼庫中進行2次以上的針對性搜尋,檢查配置、Schema結構、程序入口等。

此外,Plan模式還可以呼叫全套工具:

它可以(並且將會)呼叫各種技能、子智能體和後台終端,從而建構高層級的實施計畫。

當Codex確實需要你輸入時,它是結構化的,而且只有關鍵且聚焦的問題:

· 儘可能提供選項
· 總是包含一個推薦選項(對新手極其友好)
· 只問那些會實質性改變計畫的問題

為了實現這一互動,它利用了新的request_user_input工具。

這個工具會暫停執行流程,拋出一道有針對性的多項選擇題,並支援你在選擇時補充反饋或上下文。

更貼心的是,一旦它在任何時候檢測到歧義,尤其是當你在引導它時指令模糊,它會立即停下來確認,而不是盲目執行。

現在,開發流程變成了這樣:

使用者請求一個計畫 -> AI研究程式碼庫與規劃 -> 針對性詢問使用者 -> AI完善並完成計畫 -> 提示是否執行?

但是,程式碼誰來審?

看起來完美無缺,對吧?Codex負責思考,Codex負責執行,Codex負責填滿你的GitHub。

但就在我們為這種極致的效率歡呼時,一個被忽視的深淵正在腳下裂開——

在這個新時代,最大的懸念不再是誰在寫程式碼,而是誰來稽核程式碼。

當AI火力全開,每天向倉庫甩出10+個PR時,人類開發者面臨的實際上是一場針對注意力的DDoS攻擊。

AI生成程式碼是毫秒級的,而人類理解程式碼上下文是分鐘級甚至小時級的。

這種「生產與審查的極度不對稱」帶來了兩個可怕的後果:

  • 審查者被淹沒,開始習慣性點「Approve」,Code Review淪為形式。
  • 那些看起來能跑、但缺乏系統性思考的程式碼塊,正在像癌細胞一樣在程式碼庫中擴散。

利益衝突顯而易見,但我們需要看透這一層。

Claude Code的創造者吹捧自己的工具天經地義——這是商業的本能。

但作為受眾,我們不能把「Demo裡的完美世界」當成日常。

畢竟,Demo不會展示偵錯三小時都找不到的競態條件,也不會展示由於上下文丟失導致的邏輯斷層。

除此之外,資料裡還藏著一個迷人的悖論。

Ars Technica曾報導稱,開發者對AI工具的使用量在漲,信任度卻在跌。

為什麼?因為AI正在跨越「恐怖谷」。

以前的AI程式碼爛得很明顯,現在的AI程式碼爛得很隱蔽——它引用了不存在的庫,或者在一個極其邊緣的Case上埋了雷。

人們用得越多,踩的坑越多,信得自然越少。

正如Jaana Dogan所警示的,我們正在面臨軟體工程「瑣碎化」的風險。

  • 100個提交,可能讓GitHub的綠格子很好看。
  • 1個架構變更,可能需要三天思考,零行程式碼產出。

前者廉價如塵土,後者珍貴如黃金。

問題從來不是AI能不能寫程式碼,而是它寫的程式碼,是不是我們系統真正需要的,以及我們是否有能力維護它。

這對我們意味著什麼?

無論我們是否準備好,這個時代已經來了。對於不同的人群,這意味著完全不同的生存法則。

  • 致開發者

AI編碼工具不是「即將來臨」,它們已經破門而入。

問題在於,如何在不丟失自身核心價值的前提下整合它們。

技術大牛們依然在做那些艱難的思考工作,AI只是接過了「打字員」的工作。

如果你只會「搬運程式碼」,那你確實該慌了。

  • 致非開發者

「技術工作」與「非技術工作」的邊界正在消融。

Claude Cowork這類工具創造了新物種。曾經需要開發者才能搞定的任務,可能很快只需要你能清晰描述出你想要什麼。

清晰描述需求的能力,將成為新的程式語言。

最後的話

雖然OpenAI的研究員和Claude Code的創造者都在宣稱AI包辦了100%的程式碼,但請記住——

那是他們的實驗室環境,不是你的生產環境。

唯一可以確定的是,我們正在經歷從「寫程式碼」到「指揮寫程式碼」的不可逆的轉變。

而且,正在加速。 (新智元)