OpenAI 發佈 12 個 Codex 官方案例庫,手把手教到你會為止
OpenAI 的開發者關係負責人 Romain Huet 宣佈 Codex 上線了一個官方案例庫。
12 個實打實的使用場景,每個都帶完整的操作步驟、Prompt 範本,甚至可以一鍵在 Codex 應用裡打開。
“
我們剛剛發佈了 Codex 案例庫!這是一個涵蓋程式設計和非程式設計任務的實用案例集合,展示了 Codex 的真實使用方式。我特別喜歡的一點是:如果你安裝了 Codex 應用,可以直接一鍵打開每個案例的 Starter Prompt!
這 12 個案例覆蓋了從程式碼審查到做 PPT、從資料分析到做遊戲的各種場景,有些確實刷新了我對「AI 程式設計工具」邊界的認知。
逐個來看。
PR 自動審查
第一個案例是 GitHub PR 審查,也是上手門檻最低的一個,難度標註為 Easy,耗時大約 5 秒。
做法很直接:把 Codex 接入你的 GitHub 倉庫,它會在每個 PR 提交後自動掃一遍,找出潛在的回歸問題、缺失的測試、以及文件漏洞。
你也可以選手動模式,在 PR 評論裡 @codex review,它就來了。
發現問題之後呢?直接在評論裡回一句 @codex fix it,Codex 會啟動一個雲端任務自動修復。
這裡面有個細節值得一提:你可以在倉庫裡放一個 AGENTS.md 檔案,定義審查規則。比如「拼寫和語法錯誤標為高優先順序」「缺少測試覆蓋標為中優先順序」,Codex 會根據離每個檔案最近的 AGENTS.md 來調整審查策略。
Starter Prompt:
“
@codex review,檢查安全回歸、缺失測試、以及有風險的行為變更。
算是把 Code Review 這件事從「等同事有空」變成了「提交即審查」。
截圖變頁面
第二個案例是前端開發:把截圖和設計稿直接變成響應式 UI 程式碼。
難度中等,大約需要 1 小時。
流程是這樣的:你把設計參考圖(桌面版、移動版、各種互動狀態的截圖)丟給 Codex,同時告訴它你項目裡已有的設計系統、元件庫、色彩 token、排版規範。
Codex 會用你現有的元件和設計 token 來實現,而不是另起爐灶搞一套新的。
然後用 Playwright 打開瀏覽器,逐個螢幕尺寸對比。不對?繼續調。
Starter Prompt:
“
用截圖和說明作為參考,在當前項目中實現這個 UI。要求:復用現有設計系統的元件和 token,把截圖翻譯成倉庫裡的工具類和模式,匹配間距、佈局、層級和響應式行為,相容桌面和移動端。
這個案例的關鍵在於「復用」二字。Codex 會基於你已有的設計體系來寫程式碼,復用現成的元件和 token,這一點倒是和真人前端工程師的工作方式一致。
資料分析全流程
第三個案例,也是我覺得最適合非程式設計師的一個:資料分析。
難度中等,大約 1 小時。
這個案例的完整度讓我有點意外。它不只是「幫我畫個圖」,而是從資料匯入、清洗、合併、建模到最終報告,一條龍。
具體的步驟:
先定義問題。 比如「高速公路附近的房子,房價是不是更低?」問題越具體,Codex 越好辦事。
再設定環境。 在 AGENTS.md 裡定義項目規則:用什麼 Python 環境,資料夾結構怎麼放,原始資料放 data/raw/,清洗後的放 data/processed/,永遠不覆蓋原始檔案。
然後讓 Codex 自己看資料。 它會檢查檔案格式、編碼、每個資料集代表什麼、有那些候選主鍵、明顯的質量問題。
接著合併和建模。 在合併之前先做資料畫像,測試主鍵的唯一性和空值率,用試探性 join 看匹配率。建模則從可解釋的基線模型開始,statsmodels 和 scikit-learn 為主。
最後輸出報告。 可以是 Markdown 給同事看,Excel 給營運看,PDF 或 .docx 給老闆看。
這套流程其實就是一個標準的資料分析 pipeline,只不過以前是人寫程式碼跑,現在是 Codex 幫你寫幫你跑。
Starter Prompt:
“
我在這個工作區做資料分析項目。目標:搞清楚高速公路附近的房子是否估值更低。先讀 AGENTS.md 瞭解 Python 環境,載入資料集,描述每個檔案的內容、可能的 join key 和資料質量問題,然後提出一個可復現的工作流程。約束:優先用指令碼而非 notebook 狀態,不要編造缺失值或合併鍵。輸出:環境配置計畫、資料清單、分析計畫、第一批要建立的命令或檔案。
做 ChatGPT 應用
第四個案例是高級玩法:把你的產品做成一個 ChatGPT 應用。
難度標註為 Advanced,大約 1 小時。
一個 ChatGPT 應用由三部分組成:
• MCP 伺服器:定義工具、返回資料、處理認證
• 可選的 Widget:一個在 ChatGPT 內渲染的 Web 元件(React 或原生 HTML/CSS/JS)
• 模型整合:ChatGPT 根據你的工具中繼資料來決定何時呼叫
Codex 在這裡的角色是幫你規劃工具介面、搭建 MCP 伺服器和 Widget 腳手架、配置本地 HTTPS 測試環境、實現認證流程。
工作流程分七步:先規劃(別一上來就寫,先想清楚核心使用者場景),然後選技術堆疊,搭腳手架,測試,迭代核心功能,最後才加認證和部署。
Starter Prompt:
“
用 $chatgpt-apps 和 $openai-docs 為 [你的場景] 規劃一個 ChatGPT 應用。要求:從一個核心使用者場景開始,提出 3-5 個工具及其名稱、描述、輸入輸出,建議 v1 是否需要 Widget,TypeScript 做 MCP 伺服器,React 做 Widget。輸出:工具規劃、檔案樹、測試 Prompt 集、風險和待定事項。
官方文件裡還貼心地列了常見坑:
別一開始就想把整個產品搬過來,先做一個核心功能。別寫一個巨大的 Prompt,拆成「規劃 → 搭建 → 認證 → 部署 → 稽核」五步。
別先做 UI,先把工具介面定義清楚。別跳過在 ChatGPT 開發者模式裡的實際測試。
iOS 和 macOS 開發
第五個案例面向 Apple 生態的開發者:用 Codex 搭建 SwiftUI 應用。
難度 Advanced,大約 1 小時。
核心思路是 CLI 優先。用 xcodebuild 命令列工具,不走 Xcode GUI,保持終端化的工作流程。如果覺得 xcodebuild 太繁瑣,可以用 Tuist 來簡化項目生成。
對於已有的 Xcode 項目,可以接入 XcodeBuildMCP 工具來做 Scheme 檢查、模擬器控制、截圖捕獲和 UI 自動化。
官方還提供了一系列專項 Skill:SwiftUI 專家、Liquid Glass 專家、性能審計、並行專家、檢視重構……每個都是一個可以載入的專項能力包。
Starter Prompt:
“
搭建一個 SwiftUI 啟動應用,並加入一個建構和啟動指令碼,我可以把它繫結到本地環境的 Build 操作上。
瀏覽器遊戲
第六個案例畫風突變:做遊戲。
難度中等,但官方標註為「長時間運行任務」,因為大量素材生成可能需要幾個小時。
流程值得展開說說。先寫一份遊戲策劃文件 PLAN.md,定義玩家目標、核心遊戲循環、操作方式、勝負條件、難度遞進、視覺風格、技術堆疊和開發里程碑。
然後在 AGENTS.md 裡配置 Codex 的行為規範:遊戲名稱、類型、技術堆疊(推薦 Next.js + Phaser 或 PixiJS 做渲染),以及要用到的 Skill。
這裡用到三個關鍵 Skill:
• Playwright Interactive:在真實瀏覽器裡測試遊戲,調整操控和 UI
• ImageGen:生成概念圖、精靈圖、背景、各種視覺素材
• OpenAI Docs:查最新的 API 文件
Codex 根據計畫生成第一版,然後你截圖反饋,它再調整,如此迭代。
Starter Prompt:
“
用 $playwright-interactive、$imagegen 和 $openai-docs 來規劃並建構一個瀏覽器遊戲。實現 PLAN.md,並在 .logs/ 下記錄工作日誌。
從寫策劃到出成品,一個人就能做一款瀏覽器小遊戲……
這也算是 Vibe Coding 的最佳註腳了。
自動做 PPT
第七個案例回到職場剛需:做 PPT。
難度 Easy,大約 30 分鐘。
用的是 PptxGenJS 庫來操作 .pptx 檔案,配合 ImageGen 生成視覺素材。
幾個關鍵原則:
先看再改。 改已有的 PPT 之前,先讓 Codex 檢查現有的幻燈片結構,匹配寬高比,對照渲染截圖來調整。
保持可編輯。 文字保留為 PowerPoint 文字對象,簡單圖表用原生 PowerPoint 圖表,不要把整張幻燈片柵格化成圖片。
驗證流程。 渲染成每頁 PNG 再檢查,檢測文字是否溢出畫布邊界,報告缺失或被替換的字型。
Starter Prompt:
“
用 $slides 和 $imagegen 編輯這個幻燈片:在每頁右下角加 logo,把文字左移並在指定頁面生成抽象數字藝術插圖,保持文字可編輯,按現有品牌風格新增幻燈片,渲染成圖片稽核,檢查溢出和字型替換問題,保存可復用的生成 Prompt。
30 分鐘,即可做一套品牌風格統一的 PPT 出來。
死磕難題
第八個案例的思路和其他的都不一樣:它教你怎麼讓 Codex 反覆迭代,死磕那些一次搞不定的難題。
這個案例的核心概念是「評估驅動的改進循環」。
很多任務並非「做了就對」,需要反覆最佳化。Codex 的做法是:檢查輸出 → 打分 → 決定下一步改動 → 再檢查再打分,循環往復,直到達標。
打分機制分兩層:確定性檢查(程式碼能不能跑、測試過不過)和 LLM 評審(可讀性好不好、輸出有沒有用)。
Starter Prompt:
“
這個工作區裡有個棘手的任務,我想讓你用評估驅動的改進循環來做。開始之前:讀 AGENTS.md,找到給當前輸出打分的指令碼或命令。迭代循環:每次只做一個聚焦的改進,每次有意義的改動後重跑評估,記錄分數和改動內容,直接檢查生成的產物,持續迭代直到總分和 LLM 評審平均分都超過 90%。約束:不要在第一個可接受的結果就停下來,除非新結果明顯更差否則不要回退,遇到瓶頸時說明卡在那裡。
這其實是把「進化演算法」的思路用到了 AI 程式設計裡,通過反覆評估和微調來逼近最優解,不追求一步到位。
Slack 發任務
第九個案例走的是整合路線:直接在 Slack 裡給 Codex 派活。
難度 Easy,5 分鐘搞定。
裝好 Slack 應用,連接倉庫和環境,把 @Codex 加到頻道里。然後在任何一個 Slack 對話線程裡 @Codex,附上你的需求,它就會啟動一個雲端任務。
做完之後會線上程裡貼回結果連結,你也可以去 Codex 雲端面板查看詳情。
Starter Prompt:
“
@Codex 分析這個線程裡提到的問題,並在 <環境名稱> 中實現修復。
官方建議:請求要具體,指明用那個倉庫和環境,大型程式碼庫的話還要引導 Codex 去看那些檔案或目錄。
這其實是把 Codex 變成了一個隨時待命的遠端程式設計師。產品經理在 Slack 裡描述 bug,@Codex,然後去喝杯咖啡回來看結果。
Figma 變程式碼
第十個案例是設計師和前端的橋樑:把 Figma 設計稿直接變成程式碼。
難度中等,大約 1 小時。
和第二個案例(截圖變頁面)的區別在於,這個直接從 Figma 的結構化資料入手,而不是從截圖。
流程分幾步:
先在 Figma 裡做好準備工作。用 Variables/Design Tokens 管理顏色、排版、間距,建構可復用的元件,別用散落的圖層,用 Auto Layout 實現響應式行為,命名規範清晰。
然後用 Figma Skill 的幾個關鍵命令:get_design_context 獲取節點的結構化設計資訊,get_metadata 獲取更詳細的中繼資料,get_screenshot 獲取精確的視覺參考。
最後用 Playwright 做視覺驗證,對比實際渲染效果和設計稿。
Starter Prompt:
“
實現這個 Figma 設計……先用 get_design_context 獲取目標節點或畫面……復用現有設計系統的元件和 token……桌面和移動端都要做響應式……用 Playwright 檢查 UI 是否匹配參考設計。
讀懂大型程式碼庫
第十一個案例特別適合新人:快速理解一個陌生的程式碼庫。
難度 Easy,5 分鐘。
你要做的就是問 Codex:這個系統的請求是怎麼流轉的?那些模組負責什麼?資料在那裡做校驗?改程式碼之前有什麼坑要注意?最後推薦我下一步該讀那些檔案?
Starter Prompt:
“
解釋程式碼庫中 <系統區域> 的請求流轉過程。包括:那些模組負責什麼,資料在那裡做校驗,改程式碼前有那些注意事項。最後告訴我接下來應該讀那些檔案。
還可以追問更深的問題:
• 那個模組負責業務邏輯,那個負責傳輸層,那個是 UI?
• 校驗邏輯在那裡執行,有那些隱含的假設?
• 如果我改了這個流程,那些關聯檔案和後台任務容易被忽略?
• 改完之後應該跑那些測試?
對於新入職的工程師來說,這相當於一個隨時線上的「程式碼庫導遊」。
5 分鐘就能對一個模組建立起初步認知,比翻文件快太多了。
升級 API 整合
最後一個案例是 API 遷移:把現有的 OpenAI API 整合升級到最新版本。
難度中等,大約 1 小時。
這個案例直面一個現實問題:換模型不是改個模型名就完事的。API 參數可能變了(比如 GPT-5.4 新增了 phase 參數),模型行為可能不同導致 Prompt 需要調整,還需要建評估流水線來防止回歸。
Codex 的做法是先盤點:當前用了那些模型、那些 endpoint、那些工具呼叫假設。然後製訂最小遷移計畫,只改必須改的。更新 Prompt 時參考最新的模型指南。最後標記出所有需要人工稽核的 Prompt、工具或響應格式變更。
Starter Prompt:
“
用 $openai-docs 將這個 OpenAI 整合升級到最新推薦的模型和 API 特性。具體來說,尋找最新的模型和 Prompt 指南。盤點當前的模型、endpoint 和工具假設,制定最小遷移計畫,保留現有行為(除非新 API/模型要求改變),根據最新指南更新 Prompt,標記所有需要人工稽核的變更。
◇ ◆ ◇
回過頭來看這 12 個案例,有幾個觀察。
Codex 應該是在有意模糊「程式設計工具」和「通用工作工具」之間的界限。做 PPT、分析資料、做遊戲,這些案例裡有一半和寫程式碼沒什麼直接關係。
另一個值得注意的是 AGENTS.md 的檔案。它在幾乎每個案例裡都出現了,承擔的角色類似於「給 AI 的工作手冊」。
定義好規則,Codex 按規則辦事。
這本質上是一種新的協作範式:你只需要定義規則和目標,剩下的讓 AI 自己去執行。 (AGI Hunt)