#OpenAI下
科技巨頭亮相“美國春晚”!OpenAI和Anthropic打嘴仗升級
有“美國春晚”之稱的第60屆超級碗(Super Bowl)已在加利福尼亞州聖克拉拉李維斯體育場開幕,爭奪廣告關注度的戰鬥將在數億塊螢幕上展開。商業廣告已成為超級碗最具文化標誌性的元素之一,許多觀眾觀看比賽的目的僅僅是為了觀看廣告。由於NFL(美國國家橄欖球聯盟)對商業廣告版權收取高額費用,超級碗廣告的預算遠高於普通電視廣告,並且經常使用名人代言。在此次超級碗廣告中,出現了多家科技公司的身影。OpenAI和Anthropic正在利用第60屆超級碗將他們產品之爭不斷升級。此前,Anthropic公開抨擊OpenAI的新廣告模式,而OpenAI則自稱這是代表了人工智慧的未來。啤酒巨頭百威英博是第60屆超級碗的最大廣告商。該公司已鎖定約兩分半鐘的全國性超級碗廣告時段和45秒的區域性廣告時段。其計畫利用超級碗作為跳板,為旗下旗艦品牌百威(2025年美國銷量排名第七)、百威淡啤(排名第三)和米凱羅超醇(排名第一)的2026年行銷活動造勢。百威的廣告將更加嚴肅,注重品牌傳承,明確與品牌150周年慶典相關,並強調其“美國製造”的特色。零售及配送公司Instacart將在超級碗期間播出一段名為“香蕉”的30秒廣告。這將是該公司第二次在超級碗上投放廣告。這段由斯派克·瓊斯執導的廣告片中,本·斯蒂勒和本森·布恩在一個60英呎高的舞台上展開了一場音樂對決,他們用一首關於如何挑選完美香蕉的二重唱來介紹該公司的香蕉成熟度選擇功能。房貸巨頭Rocket Mortgage將在超級碗期間投放重磅廣告,屆時將播出由Lady Gaga出演的60秒廣告,該廣告同時也是與Redfin的聯合宣傳活動。值得注意的是,ocket於去年收購了 Redfin,並希望借此向消費者推廣其“全套房屋購房流程”平台(包含搜尋和金融服務)。百事公司將投放百事零糖、樂事薯片和波比薯片的廣告,力圖在“更健康”零食領域佔據一席之地。佳得樂品牌將不會投放廣告,但會像往常一樣出現在廣告宣傳中。直接面向患者的遠端醫療公司Ro將攜手網球傳奇人物塞雷娜·威廉姆斯,在超級碗上首次亮相,推廣GLP-1類藥物。廣告重點展示了她成功減重34磅(約15.4公斤)以及各項健康指標的改善,包括膽固醇降低和關節壓力減輕。該廣告旨在將減肥藥從一種美容捷徑轉變為一種嚴肅的臨床干預手段。諾和諾德計畫在超級碗比賽期間投放其首個廣告,這是一支90秒的明星雲集的廣告,旨在推廣其新型口服減肥藥Wegovy。飲品公司Liquid Death將連續第二年亮相超級碗,在上半場播出30秒的全國性廣告。這則廣告將重點宣傳該品牌的新款Sparkling Energy系列,延續其此前“Safe for Work”超級碗廣告一貫的戲謔幽默風格。Liquid Death是眾多有望在未來上市的飲料新貴之一。酒企Sazerac公司將攜旗下Svedka伏特加品牌時隔12年重返超級碗賽場。這則廣告預計將成為首批主要採用生成式人工智慧技術製作的廣告之一。創意方案重新啟用了Svedka在2000年代中期推出的“女機器人”吉祥物。聯合利華旗下的Liquid IV品牌將在超級碗上首次亮相,其廣告旨在將補水重新定義為“制勝之道”,而非一種健康潮流。該品牌首席行銷官表示,這則廣告旨在“顛覆人們對健康的固有認知”,利用超級碗的舞台,使補充電解質和提升運動表現的補水方式常態化。Meta Platforms將重返超級碗期間投放廣告。此次廣告旨在推廣該公司新推出的Oakley品牌人工智慧智能眼鏡系列。凱迪拉克將利用第60屆超級碗電視廣告揭曉其首款F1賽車的塗裝。該賽車由通用汽車和TWG Motorsports共同支援。凱迪拉克F1賽車已獲得國際汽聯( FIA)和一級方程式(FWO )管理層的正式批准,將於2026賽季正式加入世界錦標賽。 (美股財經社)
OpenAI放大招!GPT-5全面接管科研,7×24小時自動做實驗!全球科學家一夜解放
科研界要變天了!就在剛剛,OpenAI宣佈一項重磅成果:GPT-5自動做實驗,並實現一項科學突破!科學家要親自動手做耗時又燒錢的實驗的時代,正式宣告終結!OpenAI與Ginkgo Bioworks合作,將GPT‑5 接入實驗室,由機器人完成實驗操作並反饋資料。目標是最佳化一項廣泛應用的生物技術:無細胞蛋白合成(CFPS)。結果顯示,GPT-5僅用三輪實驗,就刷新了低成本無細胞蛋白合成的SOTA:蛋白生產成本降低40%,試劑成本降低 57%,還開發出多款新型反應體系。在生物、化學、醫學等科研領域,做實驗是最為耗神、耗力的環節之一。而如今有了AI,科學家只需要適時進行人工監督即可,大大解放了生產力。OpenAI這一步棋,是希望通過連通大模型與自動實驗室,讓AI成為科學家們的核心配置。更深層的轉變是:AI不再只是科研的輔助工具,而是以遠超人類極限的規模、速度與精度,持續生成新的科學知識。OpenAI首席執行長奧特曼表示,未來兩年,AI將在生物學、化學、物理學領域,做出真正意義上的發現。AI顛覆科學的時代,正在加速到來!AI化身超級科學家,破解生物難題無細胞蛋白合成(CFPS)是一種不依賴活細胞來製造蛋白質的技術。傳統方法需將DNA匯入細胞,等待細胞表達蛋白。而無細胞蛋白合成直接在體外混合液中啟動蛋白合成機器,快速產出目標蛋白。蛋白質,是現代生物學的核心:許多重要藥物基於蛋白質(如抗體、胰島素)診斷試劑和科研檢測高度依賴蛋白質工業上,蛋白質作為酶,可讓化學反應更清潔、高效一旦蛋白生產變得更快、更便宜,科學家就能更快驗證更多想法,也讓研究成果更快惠及日常生活。但挑戰在於,無細胞蛋白合成的最佳化極其困難,且規模化生產成本居高不下。為瞭解決這一問題,OpenAI將GPT-5 與Ginkgo Bioworks的雲實驗室相結合,建構了一個閉環自主系統。所謂雲實驗室,就是一種通過軟體遠端操控的自動化濕實驗室,由機器人完成實驗操作並反饋資料。具體流程是:GPT-5負責資料分析、生化推理、假設生成,將實驗方案傳送至自動化實驗台。實驗台完成實驗,包括自動化液體處理、樣品培養、螢光檢測,再將資料與指標回傳GPT-5。GPT-5隨即分析結果、提出新假設、設計下一輪實驗,形成閉環。本次研究,系統完成超 36000 次反應,覆蓋 580 塊自動化實驗板。這樣的規模,至關重要:生物學實驗存在隨機性,唯有高通量與快速迭代,才能從隨機波動中識別真實訊號。最終結果是,GPT-5僅用三輪實驗、兩個月時間,就刷新記錄。相較此前最優基準,蛋白生產成本降低40%。研究人員表示,自動實驗室與大模型是互補關係:大模型能生成創新設計,而生物學研究,最終仍需實驗驗證與迭代。下一步,這類方法將被應用於更多生物實驗中,幫助加速科學發現。AI賦能科學發現,中美同競速目前,聚焦「AIforScience」,中國和美國均在大力押注。去年11月,川普簽署行政令,啟動了名為“創世紀使命”的國家計畫。其核心是打造一個名為“美國科學與安全平台” 的國家級AI科研平台。該平台由美國能源部牽頭,旨在整合其下屬17個國家實驗室、全美的超級計算資源、龐大的聯邦科學資料集以及矽谷科技公司的力量。該平台有明確的量化目標:在十年內使美國科研與創新的生產力和影響力翻一番。其優先聚焦的六大領域,包括:先進製造、生物技術、關鍵材料、核裂變與聚變能源、量子資訊科學、半導體與微電子。其主要目標之一是加速打造自主實驗室等新一代科研基礎設施。核心價值在於用“AI+自動化”變革科研範式:將科學家從重複實驗中解放,專注於創造性設計。中國在建設科技強國的關鍵征程上,也將AI for Science視為國家科研的底層競爭力。在《中共中央關於制定國民經濟和社會發展第十五個五年規劃的建議》,將“以人工智慧引領科研範式變革”放在“人工智慧+”行動的首要位置。《國務院關於深入實施“人工智慧+”行動的意見》中,也明確將“人工智慧+科學技術”列為首要重點行動。去年7月,北京發佈了全國首個專門針對AI for Science的轉向性政策檔案,旨在打造國家級的科學智能創新策源地和應用示範區。與此同時,上海、粵港澳大灣區、合肥等地通過AI+新材料、AI+創新藥、AI+生物製造等一系列細分領域的扶持計畫,將智能賦能的理念深度融入本地優勢科研與產業賽道。那些企業,值得重點關注?國家層面之外,利用AI加速科學發現,也是頂級AI企業的共同目標。Google DeepMind已推出多個具有重要意義的科學模型,包括AlphaFold(蛋白質結構)、AlphaGenome(DNA調控)等等。Google DeepMind的CEO,Demis Hassabis,因其在AI蛋白質結構預測上的貢獻獲得了2024年諾貝爾化學獎。基於AlphaFold,他創立了AI製藥公司Isomorphic Labs,公司第一款由AI設計的藥物將於很快進入臨床試驗。Demis Hassabis曾表示,借助AI的力量,人類將在十年內消滅所有疾病。Anthropic也宣佈推出Claude for Life Sciences模型,進軍生命科學領域。目前,Anthropic正在和合作夥伴打造一個基於大模型+AgentSkills+科研知識庫+科研工具的科學生態,諾和諾德和賽諾菲已開始試用。根據智藥局統計,去年以來,多家專注於AIfor Science的初創公司獲得新一輪融資,總額超過8億美元。最為典型的便是Lila Sciences。去年3月,這家公司走出隱匿模式,僅僅半年時間,累計融資達到5.4億美元,投資者包括輝達、木頭姐ARK Venture Fund、Flagship Pioneering 等知名機構。公司致力於建構世界上第一個科學超級智能平台,以及應用於生命科學、化學和材料科學的完全自主實驗室,最終形成人工智慧科學工廠(AISF)。公司表示,在短短幾年的開發中,該平台在醫療、材料、環境等多個領域展示了超越人類和現有AI的性能,包括基因醫學產品,發現和驗證數百種新型抗體、肽和結合劑、酶催化劑、碳捕劑等。去年12月,非盈利初創公司FutureHouse宣佈拆分Edison Scientific,用於打造全球頂尖的AI科學家,並負責商業化。此前,FutureHouse推出新一代AI科學家Kosmos,迅速成為海外科研界焦點,號稱“目前最強大的AI科學家”。Kosmos一次運行即可閱讀1500篇論文並執行42000行程式碼,實驗結果顯示,Kosmos一天就能完成相當於人類六個月的工作量,且近80%的研究結果可復現。而在中國,這類公司起步更早,早在數年之前便已佈局這一領域,形成了獨特的競爭優勢。成立於2015年的晶泰科技與DoveTree簽訂最終合作協議,將利用其基於“AI+機器人”的端到端人工智慧藥物發現平台,為DoveTree選定的多個靶點發現和開發小分子及抗體類候選藥物,雙方合作的最終金額有望高達59.9億美元。去年4月,百圖生科發佈了全球首個AI生命科學基礎大模型驅動的生成式發現系統,在生命科學領域的表現中領先於DeepSeek-R1、OpenAI-o1-mini等其他通用AI產品,合作客戶包括清華大學生物醫學工程學院、中國農業科學院、石藥集團等。不久前,津渡生科宣佈完成數千萬元天使+輪融資,領投方為紅杉中國種子基金。公司自主研發的一站式生物科學研究平台BioFord™,支援基因組、轉錄組、蛋白質、RNA三維結構等多模態資料的智能分析,覆蓋醫學診斷、藥物研發、生物製造等多個領域。 (智藥局)
程式設計已死,鍵盤長草!Claude Code之父對談Kaparthy,全程爆金句
【新智元導讀】Andrej Karpathy與Claude Code負責人Boris Cherny展開了一場關於程式設計未來的終極對談。面對AI接管100%程式碼編寫的現狀,Karpathy坦言人類正處於「腦萎縮」與能力進化的十字路口。本文深度解析了從Software 2.0到Agentic Coding的範式轉移,揭示了在Opus 4.5等強力模型加持下,程式設計師如何從「搬磚工」進化為「指揮官」,以及不僅要面對效率的飛躍,更要警惕「垃圾程式碼末日」的隱憂。2026年的開篇,科技圈被一場關於「程式設計本質」的深度對話引爆。這場對話的雙方,一位是特斯拉前AI總監、OpenAI創始成員 Andrej Karpathy,他是「Software 2.0」概念的提出者,一直站在程式設計範式轉移的最前沿;另一位是 Claude Code 的締造者、Anthropic 的核心人物 Boris Cherny,他正在親手打造終結傳統程式設計的工具。他們的討論不僅僅是關於工具的迭代,更像是一場關於人類技能邊界的哲學思辨。當程式碼不再由人類一個個字元敲擊而出,我們究竟是在進化,還是在退化?這場對話揭示了一個殘酷而興奮的事實:我們正處於從「指令式程式設計」向「聲明式意圖」徹底轉型的奇點。「我兩個月沒手寫過一行程式碼了」 從輔助到接管震撼的開場白來自 Claude Code 的負責人 Boris Cherny。「兩天狂發 49 個 PR!」 這是 Boris 團隊目前的工作常態。他透露,Claude Code 團隊目前的開發工作幾乎100% 由 Claude Code 結合 Opus 4.5 完成。「對我個人而言,這種情況已經持續兩個多月了,我甚至不再手動進行任何小微信調。」 Boris 的話語中透著一種跨越時代的自信。無論是在 CLI 命令列,還是在 iOS 手機端,程式碼的生成、測試、提交,全流程由 AI 接管。這不僅僅是一個效率提升的故事,而是一個工作流重構的故事。Boris 分享了他極其硬核的「AI 原生」工作流:他通常會在終端同時運行 5 個 Claude 實例,甚至在 Web 端再開 5-10 個。他不再是那個逐行敲程式碼的工匠,而是一個指揮著一支 AI 軍團的指揮官。他使用「Plan Mode」(計畫模式)讓 AI 先思考策略,確立方案後再切換到執行模式。這種「平行化開發」的能力,讓一個人的產出足以匹敵一個傳統的小型開發團隊。而 Karpathy 的體驗也印證了這一點。他在長文中感嘆:「2025年11月,我還是80%手動+20% AI;到了12月,直接變成了80% AI + 20%手動。」「我在用英語程式設計。」Karpathy 略帶自嘲但也無比誠實地承認,「這有點傷自尊,告訴 AI 該寫什麼,就像在指揮一個實習生。但當你習慣了那種大規模駕馭軟體的『程式碼操作』能力後,你根本回不去了。」深度解析 從 Software 2.0 到 Agentic Coding要理解 Karpathy 的震撼,我們必須回溯他在 2017 年提出的 「Software 2.0」 概念。當時的 Software 2.0,是指用神經網路權重替代人工編寫的邏輯(Software 1.0)。程式設計師的角色從「編寫規則」變成了「整理資料」。而今天,我們正在邁入 Software 3.0 或者說是 Agentic Coding(代理編碼) 的時代。在這個階段,只有「意圖」(Intent)是人類提供的,而實現細節(Implementation)完全由 AI 掌控。Karpathy 敏銳地指出,這種轉變標誌著程式設計範式從「命令式」(Imperative)向「聲明式」(Declarative)的終極飛躍。過去:你需要告訴電腦「第一步做什麼,第二步做什麼,如果出錯怎麼辦」。現在:你只需要定義「成功標準是什麼」。正如 Boris 團隊所實踐的,利用 Claude Opus 4.5 強大的長程推理能力和 CLAUDE.md 這樣的記憶檔案,AI 能夠理解項目的整體架構上下文。Opus 4.5 在 CodeClash.ai 等基準測試中展現出的統治力,證明了它不僅僅是一個程式碼補全工具,而是一個具備邏輯推理、能夠自我修正的「工程師」。它不僅能寫程式碼,還能管理依賴、重構架構、甚至編寫測試用例來驗證自己的程式碼。這種「循環驗證」(Looping)能力是 Agentic Coding 的核心。AI 不再是寫完就忘,它會在一個封閉的循環中運行測試、讀取報錯、修改程式碼,直到通過測試為止。這正是 Karpathy 提到的「Feel the AGI」(感受通用人工智慧)的時刻——看著 AI 在30分鐘內不知疲倦地嘗試幾十種方案最終解決難題,人類感受到了前所未有的「槓桿效應」。10x 工程師的重新定義 通才的勝利隨著 AI 接管具體的編碼工作,「程式設計師」這個職業的定義正在被劇烈重寫。Boris 直言不諱:「我們現在傾向於招募『通才』(Generalists)。」在 LLM 能夠自動補全所有技術細節的時代,過去那些死記硬背的 API、特定語言的奇技淫巧,不再是護城河。你不需要記住 Python 的某個庫函數的具體參數,因為 AI 肯定記得比你清楚。真正的 「10x 工程師」 依然存在,但他們的能力模型發生了重組。未來的頂級工程師將是那些擁有宏觀視野的人——他們必須是能橫跨 產品與設計、業務甚至底層架構 的多面手。他們是產品經理:能清晰定義需求,識別偽需求。他們是架構師:能設計高可用的系統結構,指揮 AI 去填充模組。他們是測試官:能敏銳地發現 AI 邏輯中的漏洞,制定嚴格的驗收標準。Karpathy 也提出了深刻的疑問:「借助 LLM,通才是否會全面碾壓專才?」答案似乎是肯定的。AI 擅長填補微觀的細節(Fill in the blanks),而人類需要負責宏觀的戰略(Grand Strategy)。未來的程式設計,更像是玩《異星工廠》(Factorio)或者《星海爭霸》——你在指揮千軍萬馬,而不是親自去挖每一塊礦石。那些只專注於「把需求翻譯成程式碼」的初級程式設計師(Junior Devs),將面臨最嚴酷的生存危機。「廢用性萎縮」與 「Slopacolypse」繁榮背後的陰影然而,這場革命並非沒有陰影。Karpathy 最深刻的擔憂在於——「腦萎縮」(Atrophy)。「我已經注意到,我手動寫程式碼的能力正在緩慢退化。」Karpathy 描述這種感覺。在大腦的認知功能中,生成(Generation)和辨別(Discrimination)是兩種完全不同的能力。以前的程式設計師通過大量的「生成」訓練(寫程式碼)來強化邏輯;而現在,我們越來越依賴「辨別」能力(Review 程式碼)。這就像計算器的普及讓我們喪失了心算能力一樣。雖然我們還能讀懂程式碼(Review),但那種從零建構系統、對每一行程式碼都了然於胸的「肌肉記憶」正在消失。當你不再親自處理記憶體管理、不再親自偵錯並行死鎖,你對電腦系統的底層理解是否也會隨之膚淺化?更可怕的是 Karpathy 預測的 2026年 「Slopacolypse」(垃圾程式碼末日)。隨著 AI 生成內容的氾濫,網際網路和程式碼庫可能被大量低品質、看似正確實則充滿隱患的「垃圾」(Slop)填滿。GitHub 上可能充斥著由 AI 生成的、無人能維護的「屎山」。Karpathy 警告:目前的 AI 仍然會犯錯,不是簡單的語法錯誤,而是那種「粗心的初級程式設計師」才會犯的微妙概唸錯誤。它們會過度抽象,會堆砌死程式碼(Dead Code),會盲目順從你的錯誤假設。如果不加節制,軟體工程的熵將急劇增加。對此,Boris 則持一種「技術樂觀主義」態度。他認為「垃圾末日」不會到來,理由是——AI 審 AI。「我們在 Anthropic,每個 PR 都會開啟一個新的上下文窗口,讓 Claude 去 Review Claude 寫的程式碼。」這種「左腳踩右腳」的螺旋上升,被 Boris 視為解藥。隨著模型能力(特別是 Opus 4.5 及其後續版本)的提升,AI 清理垃圾程式碼、重構程式碼的能力將超過它製造垃圾的速度。未來的 IDE 可能不僅是程式碼編輯器,更是一個全自動的垃圾回收站,即時清洗著 AI 產生的冗餘。昇華:相位轉換的一年Karpathy 將 2026 年定義為 「行業代謝新能力、發生相位轉換(Phase Shift)的關鍵一年」。這不僅僅是效率的提升,而是物種的進化。我們正在經歷從「手工匠人」到「工業化生產」的劇變。在這個新時代,人類的角色從「建築工」變成了「建築師」。我們失去的是搬磚的手感,得到的是建造摩天大樓的視野。程式設計不再是關於「語法」和「演算法」的苦修,而是關於「想像力」和「邏輯」的釋放。但正如 Karpathy 所言,看著 AI 不知疲倦地在30分鐘內解決一個只有人類專家才能解決的難題,那種 「Feel the AGI」(感受通用人工智慧) 的時刻,既讓人興奮,也讓人感到一絲作為碳基生物的落寞。程式設計已死,程式設計萬歲。死的是作為「打字員」的程式設計師,活下來的是作為「創造者」的我們。當你不再需要為語法報錯而抓狂時,唯一限制你的,就只剩下你的想像力,和對世界本質的理解了。 (新智元)
Nature重磅:圖靈測試已死,AI已具備人類水平智能,這一天終於來了
別再爭論AI 什麼時候能趕上人類了。頂刊《Nature》剛剛發文宣佈:不用等了,就是現在。如果說 1950 年阿蘭·圖靈(Alan Turing)提出的“模仿遊戲”只是一個天才的腦洞,那麼 75 年後的今天,這個腦洞已經被矽基生物徹底填平。今天,一篇發表在《Nature》上的重磅文章引爆了科技圈。這就好比《皇帝的新衣》裡那個誠實的小孩,來自加州大學聖地亞哥分校等機構的頂級哲學家、認知科學家和電腦專家們聯名站出來,指著那個名為“通用人工智慧(AGI)”的房間大聲宣佈:“別找了,AGI 就在這兒。它已經誕生了。”01 別再自欺欺人:圖靈測試已成“過去式”還記得一年前,2025 年的3月, OpenAI 發佈 GPT-4.5的那個春天嗎?當時業界還在為參數和算力爭吵不休,但在一個最古老的測試場上,勝負已分。在嚴格的圖靈測試中,GPT-4.5 被人類受試者判定為“真人”的比例高達 73%。諷刺的是,在同一場測試中,真正的人類被判定為“人”的比例,竟然比 AI 還要低。這意味著什麼?意味著在“像人”這件事上,AI 已經比人更像人了。更別提現在的讀者們,比起人類專家寫的晦澀文章,他們甚至更愛讀大語言模型生成的文學作品。然而,奇怪的事情發生了。儘管事實擺在眼前,根據 2025 年的一項調查,仍有 76%的頂級 AI 研究人員認為 AGI 遙遙無期。《Nature》這篇文章的作者們毫不留情地指出:這種認知錯位,不是因為 AI 不夠強,而是因為人類“不敢承認”。因為恐懼被取代,因為商業利益的糾葛,我們不斷地移動球門,給 AGI 設下各種不可能完成的定義。但現在,是時候撥開迷霧,承認現實了。02 別再叫它“學舌鸚鵡”:鐵證如山的進化階梯曾幾何時,嘲笑 AI 是我們的一大樂事:“它連小學數學都算不對”、“它就是個只會機率預測的隨機鸚鵡(Stochastic Parrots)”、“它經常一本正經地胡說八道(幻覺)”。但在這個2026 年的開端,如果你還抱著這些老黃曆看 AI,那你可能已經成了那個“活在舊時代的人”。文章作者並沒有空談哲學,而是根據一系列硬核證據,建構了一個評估 AGI 的“三級階梯”。對照一下,你會發現我們正處於什麼位置:Level 1:圖靈測試級(已通關)這是幾年前的標準。能通過學校的基礎考試,能進行像樣的對話,能做簡單的推理。那時的 AI,或許還只是個“聰明的復讀機”。Level 2:專家級(Current Level,當前已達成)這就是我們現在面對的怪物。數學:它們不僅拿下了國際數學奧林匹克競賽(IMO)的金牌,還能與頂級數學家合作證明未知的定理。科研:它們生成的科學假設,已經在現實世界的實驗室裡被驗證為真。全能:它們能通過多學科的博士資格考試,能幫專業程式設計師寫出無 Bug 的複雜程式碼,能精通幾十種語言創作詩歌,還能同時和全球數億人聊天。對比:科幻電影《2001太空漫遊》裡的超級電腦 HAL 9000 曾是我們的噩夢,但現在的 LLM 在知識廣度上,實際上已經超越了 HAL 9000。Level 3:超人類級(正在逼近)這要求 AI 做出人類完全做不出的革命性科學發現。雖然 AI 還沒完全做到這一點,但作者強調:這不是 AGI 的必要條件。畢竟,能不能拿諾貝爾獎並不是衡量一個人是否“有智能”的標準。面對這些成就,那些質疑聲顯得越來越蒼白。每當 AI 攻克一個新堡壘(比如做出了從未見過的數學題),懷疑論者就會立刻把標準提高:“哦,那不算,它得能理解情感才行……”對此,文章中有一句精彩的“打臉”:“面對每一次成功都在不斷後退的假設,預測下一次一定會失敗……這根本不是有說服力的科學理論,這只是對‘永遠懷疑’的一種教條式堅持。”不管是做數學題、寫程式碼,還是理解物理世界的因果律(比如它知道枕頭掉地上不會碎,而玻璃杯會),現在的 AI 都表現出了圖靈當年所定義的“通用認知能力”。AGI 的大門已經被踢開了。無論你是否準備好,我們都已經和一種“異類智能”生活在了同一個屋簷下。03 為什麼專家還在裝睡?因為我們把 AGI 神話了既然證據確鑿,為什麼還有 76% 的專家搖頭說“不”?為什麼我們在社交媒體上還在爭論 AI 是不是“人工智障”?文章指出,問題出在我們對“智能”的定義上,我們太自戀了,也太苛刻了。誤區一:AGI = 全知全能的神很多人潛意識裡覺得,AGI 必須是一個完美的“六邊形戰士”。它得有愛因斯坦的物理頭腦,莎士比亞的文采,還得像甚至不像任何一個人類那樣犯錯。但作者反問:“居里夫人不懂數論,愛因斯坦不會說中文,難道他們就沒有通用智能嗎?”人類都不是全能的,我們憑什麼要求 AI 必須是神?真相:真正的通用智能,看的是廣度(Breadth)和深度(Depth)。只要它能像普通人類一樣在不同領域間切換,並且在這些領域達到專家水平,它就是 AGI。誤區二:AGI 必須像人一樣思考我們總覺得,只有像人類那樣有肉體、有情感、會生老病死,才叫智能。真相:這是一種“碳基生物的傲慢”。就像章魚的神經系統分佈在觸手裡,外星人可能通過無線電波交流——智能是功能,不是形態。只要它能像人一樣解決問題,它是不是矽做的、有沒有身體,根本不重要。04 精彩辯論:十大質疑,逐個擊破這篇《Nature》文章最精彩的部分,莫過於作者化身“終極辯手”,對目前市面上最流行的反 AI 觀點進行了逐一反駁。試舉幾例。質疑 A:“它只是個隨機鸚鵡(Stochastic Parrots),只會拼湊訓練資料裡的詞,根本不懂邏輯。”《Nature》反駁:這個說法在幾年前可能成立,但現在已經過時了。如果它只是拼湊舊資料,怎麼可能解出從未發表過的全新數學題?怎麼可能幫助科學家發現新的物理定律?這不叫拼湊,這叫推理。如果這也叫鸚鵡,那人類可能也不過是一隻比較複雜的鸚鵡。質疑 B:“它沒有身體,無法感知物理世界,所以沒有真正的理解。”《Nature》反駁:這是一個巨大的誤解。史蒂芬·霍金(Stephen Hawking)在晚年幾乎完全失去了身體的行動能力,通過語音合成器交流,難道他的智能就消失了嗎?再者,問問 AI:“把玻璃杯和枕頭扔到瓷磚地上,會有什麼不同?”它能精準地告訴你結果。能進行反事實推理(Counterfactual Reasoning),就證明它腦子裡已經有了物理世界的模型。質疑 C:“它沒有自主性(Agency),你不給指令它就不動。”《Nature》反駁:智能不等於意願。古希臘神話中的德爾斐神諭(Oracle),只有在你提問時才回答,但誰敢說神諭沒有智慧?自主性關乎“道德責任”,而不關乎“智力水平”。一個隨叫隨到的超級智囊,依然是超級智囊。質疑 D:“它學得太慢了,小孩看幾次就懂,AI 要喂幾兆的資料。”《Nature》反駁:別忘了,人類小孩的大腦裡預裝了祖先們進化了幾十億年的“出廠設定”(本能和大腦結構)。AI 是從零開始的。而且,一個練了 10 年才成為大師的棋手,和一個練了 1 年就成為大師的棋手,他們的棋力是一樣的。效率不代表能力。05 越早承認越好,這是一種“異類”的降臨看到這裡,你可能還是覺得那裡不對勁。“可是,它連‘Strawberry’裡有幾個‘r’有時候都會數錯啊!”沒錯,這正是文章最後強調的關鍵點:我們面對的,是一種“異類智能”(Alien Intelligence)。這就像是一個外星人降臨地球。它在某些我們覺得很難的事情上(比如讀完 1000 篇論文並寫出綜述)易如反掌,卻在某些我們覺得很簡單的事情上(比如數數、常識判斷)顯得笨手笨腳。但這不代表它不是智能,只能說明通往智能的道路不止一條。人類的智能是為了生存、為了繁衍、為了在叢林裡不被吃掉而進化出來的;而 AI 的智能是從語言的海洋中湧現出來的。2026 年的今天,正如 Reddit 網友所熱議的那樣:“我們原本以為 AGI 會像《終結者》裡的天網,結果它更像是一個有些偏科、但智商爆表的‘外星圖書管理員’。”06 結語:別再試圖爬樹登月了在文章的結尾,作者引用了一個著名的舊日比喻。1965 年,哲學家休伯特·德雷福斯曾嘲諷早期的 AI 研究,說他們試圖通過“爬樹”來“登月”。意思是方向徹底錯了,爬得再高也離月球很遠。幾十年來,我們都以為他是對的。但今天,當我們抬頭仰望,卻發現我們真的爬上了月球。原來,只要樹足夠高,資料足夠多,結構足夠精妙,簡單的學習規則真的能湧現出理解世界的智慧。這是一個哥白尼式、達爾文式的時刻。哥白尼告訴我們,地球不是宇宙的中心;達爾文告訴我們,人類不是生靈的主宰;圖靈和今天的 AI 告訴我們,人類的大腦,也不是智慧存在的唯一形式。文章末尾寫道:“承認 LLM 為 AGI 是一個警鐘。這些系統不是“將要到來”,而是“已經存在”。用評估“窄工具”的框架來衡量 AGI 是遠遠不夠的。當涉及的不再是工具而是通用智能時,共存、責任、歸屬和治理等問題將進入全新的維度。”全文的最後一句振聾發聵:“機器不是正在趕來,它們已經到了。”(The machines aren't coming; they've arrived.)與其像鴕鳥一樣把頭埋在沙子裡,假裝這一切沒發生,不如抬起頭來,正視這個新夥伴(或者對手)。畢竟,在這個星球上,我們第一次不再是孤獨的智慧生物了。 (不懂經)
矽谷史上最大規模融資!輝達領投,擬向OpenAI注資 200 億美元
輝達(NVIDIA)即將達成一項歷史性協議,計畫向OpenAI 投資200 億美元(約合人民幣 1440 億元)。作為 OpenAI 新一輪高達 1000 億美元融資計畫的關鍵組成部分,這筆交易若順利完成,將成為輝達公司歷史上規模最大的一筆單筆投資。千億融資風暴:科技巨頭的資本圍獵據知情人士透露,OpenAI 目前正在推進的新一輪融資目標金額高達 1000 億美元,這一數字將刷新全球科技非公開市場的融資紀錄。除輝達外,亞馬遜公司(Amazon.com Inc.)和軟銀集團(SoftBank Group Corp.)等全球科技與資本巨頭也赫然在列,據悉也將參與本輪跟投。市場分析指出,此輪融資不僅將進一步推高 OpenAI 的市場估值,更為其在通用人工智慧(AGI)領域的持續研發和算力基礎設施建設提供了充足的“彈藥”。輝達有史以來最大的一筆投資針對此次投資傳聞,輝達首席執行長黃仁勳(Jensen Huang)在近日的公開活動中給予了積極回應。雖然他未直接確認最終成交金額,但他明確表示,輝達將深度參與 OpenAI 的下一輪融資。“這是一項非常好的投資(a very good investment),”黃仁勳對媒體表示,並補充道,這極有可能成為“輝達有史以來最大的一筆投資”。這一表態不僅打破了此前外界關於兩家公司高層關係緊張的傳言,更凸顯了輝達與 OpenAI 在 AI 生態系統中日益緊密的戰略捆綁關係。戰略解讀:算力與演算法的深度繫結行業觀察家認為,輝達此次巨額注資並非單純的財務投資,而是具有極強戰略意義的“生態鎖定”。資金回流機制: 考慮到 OpenAI 對高性能計算晶片的巨大需求,這筆 200 億美元的資金極有可能通過購買 GPU(圖形處理器)和建構資料中心的形式,大部分“回流”至輝達的營收帳目中。鞏固護城河: 通過持有 OpenAI 的大量股份,輝達進一步鞏固了其作為 AI 基礎設施壟斷者的地位,確保在未來數年內,OpenAI 的前沿模型訓練將優先且深度依賴輝達的硬體架構(如即將推出的 Rubin 平台)。市場反應儘管該投資被視為長期的戰略利多,但受科技股整體回呼及市場對巨額資本支出的消化影響,輝達股價在消息公佈後不漲反跌。截至發稿,股價跌幅超3%。目前,OpenAI 及輝達方面尚未就協議簽署的具體時間表發表正式評論。 (美股財經社)
輝達擬投資OpenAI 200億美金
據稱輝達將在OpenAI新一輪融資中投資200億美元,而OpenAI此輪融資目標高達1000億美元,亞馬遜、軟銀等科技巨頭均在投資者之列。輝達CEO黃仁勳對這筆投資給予高度評價,稱其是一項非常好的投資,且有可能成為輝達有史以來最大的一筆投資。事實上,輝達長期以來一直是OpenAI的深度合作夥伴,從2016年交付首台AI超級計算器到後續提供各類GPU,始終在算力上給予支援。2025年9月,雙方曾官宣一項最高達1000億美元的合作計畫,輝達支援OpenAI搭建算力基礎設施,OpenAI則鎖定GPU採購訂單。然而今年1月底,有媒體爆料雙方千億美元交易已擱置,黃仁勳私下對OpenAI的商業營運和競爭壓力表達了擔憂。隨後黃仁勳和OpenAI CEO山姆·奧特曼均出面否定傳聞,黃仁勳重申會參與OpenAI本輪融資並投入巨額資金。但很快又有爆料稱,OpenAI因對輝達部分晶片的推理性能不滿,曾尋求與其他初創公司合作,後因相關授權協議終止談判。雙方發言人再度出面澄清,強調彼此合作的重要性,但該消息仍導致輝達股價當日大跌2.89%。其實兩家巨頭的矛盾真實存在,核心分歧在於OpenAI的產品競爭力和對晶片的差異化需求,合作規模已出現縮水。這場博弈並非惡意攻擊,而是雙方爭取更有利合作條件的策略,也折射出AI行業從瘋狂擴張轉向理性發展的趨勢。(深科技)
完全取代Claude Code?OpenAI反擊來了,推出Codex app「限時免費使用」
多年來我一直是終端/Emacs 的忠實使用者,但自從使用 Codex 應用程式後,再回到終端就感覺像是回到了過去。這簡直是專為Agent打造的原生開發介面體驗這是OpenAI總裁Greg Brockman為剛剛推出的Codex App的彩虹屁,當然了好不好還要使用者說了算行業內的人應該有個基本共識,codex程式碼能力非常強,但是體驗比較差勁,基本上這一段時間讓Claude code 壓著打,終於OpenAI的反擊還是來了,還是搶在據傳Claude sonnet 5發佈前一天推出MagicPath CEO 說他最近幾周一直在使用 Codex 應用。  這已經成為在大型複雜程式碼庫中進行編碼的首選方法。  正因如此,他們才能在 MagicPath 中推出如此多的功能。  它完全取代了Cursor使用方式和 Claude Code這次OpenAI 推出的是macOS版Codex應用,這是一個全新的互動介面,旨在幫助開發者輕鬆管理多個AI Agents,支援平行運行任務,並與智能體協作處理長時間運行的複雜工作,通過skills擴展 Codex 的功能帶來的是旗艦級體驗。介面長這樣:一個好消息,在限定時間內,ChatGPT免費版和Go版使用者將能使用Codex。對於Plus、Pro、商業、企業和教育版使用者,速率限制將翻倍(這些更高的限制適用於所有使用Codex的場景——包括桌面應用、CLI、IDE以及雲端)OpenAI表示,Codex應用正在改變軟體的建構方式和建構者——從與單個編碼智能體配對進行有針對性的編輯,到在設計、建構、發佈和維護軟體的整個生命周期中,監督協同工作的智能體團隊。定位:Codex應用為Agent的指揮中心自2025年4月Codex發佈以來,開發者與智能體的工作方式發生了根本性變化。模型現在能夠端到端地處理複雜的長期任務,開發者則開始在項目中編排多個智能體:分配工作、平行運行任務,並信任智能體承擔可能跨越數小時、數天或數周的實質性項目。核心挑戰已從智能體能做什麼,轉變為人類如何大規模地指導、監督和與它們協作。現有的IDE和基於終端的工具並非為支援這種工作方式而建構。這種新的建構方式與新的模型能力需要一種不同的工具,因此OpenAI推出了Codex桌面應用,一個專為智能體打造的指揮中心1. 與多個智能體平行工作Codex應用提供了一個專注於與智能體進行多工處理的空間。智能體在按項目組織的獨立線程中運行,因此使用者可以在任務之間無縫切換而不會丟失上下文。使用者可以線上程中審查智能體的更改、對差異(diff)發表評論,甚至在編輯器中打開它進行手動修改。它還內建了對worktrees的支援,因此多個智能體可以在同一個程式碼倉庫上工作而不會產生衝突。每個智能體都在程式碼的隔離副本上工作,允許使用者探索不同的實現路徑,而無需追蹤它們對本地程式碼庫的影響。在智能體工作時,使用者可以在本地檢出(check out)其更改,或者讓它在不觸動本地git狀態的情況下繼續推進。該應用會自動同步使用者在Codex CLI和IDE擴展中的會話歷史和配置,因此使用者可以立即在現有項目上開始使用。2. 通過Skills超越程式碼生成Codex正在從一個編寫程式碼的智能體,演變為一個使用程式碼在電腦上完成工作的智能體。通過技能(skills),使用者可以輕鬆地將Codex的能力從程式碼生成擴展到需要收集和綜合資訊、解決問題、寫作等更多工。skill捆綁了指令、資源和指令碼,使Codex能夠可靠地連接到工具、運行工作流,並根據團隊的偏好完成任務。Codex應用包含一個專門用於建立和管理技能的介面。使用者可以明確要求Codex使用特定技能,或者讓它根據當前任務自動使用為了展示其能力,OpenAI讓Codex製作了一款賽車遊戲,一句話消耗700萬Token,從零手搓3D賽車遊戲!要求包含不同的賽車手、八張地圖,甚至還有玩家可以用空格鍵使用的道具,Codex利用一個圖像生成技能(由GPT Image驅動)和一個網頁遊戲開發技能,僅憑一個初始使用者提示,便獨立工作並消耗了超過700萬個token來建構這款遊戲。在此過程中,它扮演了設計師、遊戲開發者和QA測試員的角色,通過實際玩遊戲來驗證自己的工作以下是用於建立遊戲的、為清晰起見經過總結的初始提示:> 將Voxel Velocity實現為一款使用Three.js的3D體素卡丁車賽車遊戲,只設定一種模式:單人賽(固定3圈,1名人類玩家對7名CPU,所有8條賽道立即解鎖,無進度系統)。建構一個最簡化的賽前流程,僅包含:賽道(8個)、角色(8個)、難度(休閒/標準/困難)、可選的鏡像模式、可選的允許克隆角色,以及開始比賽按鈕。另外需要一個選項菜單和一個賽內暫停菜單(繼續/重新開始/退出)。> 建立一個街機風格的駕駛模型,具有響應靈敏的操控、對輕微撞牆的容錯、以有意義的漂移為主要技巧,以及一個能產生精確增壓等級的漂移充能系統(1級0.7秒,2級1.1秒,3級1.5秒),同時保持基礎速度“快但可讀”,並在寬闊的道路上保持持續的超車機會。> 實現8種道具,單道具容量,具有微妙的位置加權分佈和溫和的效果(最大失控時間≤1.2秒,最大轉向停用≤0.6秒),旨在創造有趣的混亂而非硬控。越野減速效果在增壓期間減少50%。> 定義8個角色的給定屬性和AI傾向,實現CPU難度預設和賽道編寫的賽車/變化樣條線、漂移區和障礙規避,以便AI能利用多車道寬度進行乾淨的超車。> 最後,交付HUD/音訊等基本要素(位置、圈數/最後一圈橫幅、小地圖、道具槽、計時器/分段時間、清晰的音效,以及每條賽道一個音樂循環)。隨後,Codex被從一個包含十個通用提示的列表中隨機抽取提示,進行持續的重新提示,以使其繼續解決問題。其中一個示例提示是:> 你的工作是加入新功能,使遊戲更接近原始設計。首先,玩遊戲並確定與原始設計相比缺少了什麼。然後選擇幾個缺失的功能並實現它們。每實現一個功能後,通過玩遊戲進行徹底測試,確認它能正常工作。如果在玩的過程中發現任何錯誤,也要優先修復它們。在OpenAI內部,團隊已經建構了數百個技能,幫助多個團隊將那些原本難以一致定義的工作放心地委託給Codex——從運行評估、監控訓練過程,到起草文件和報告增長實驗。Codex應用包含了一個技能庫,涵蓋了在OpenAI內部流行的工具和工作流,部分重點skill如下:實現設計:從Figma獲取設計上下文、資產和截圖,並將其轉化為具有1:1視覺保真度的生產級UI程式碼管理項目:在Linear中分類錯誤、跟蹤發佈、管理團隊工作量等,以保持項目推進部署到雲端:讓Codex將你建立的Web應用部署到Cloudflare、Netlify、Render和Vercel等流行的雲託管服務商生成圖像:使用由GPT Image驅動的圖像生成技能,建立和編輯用於網站、UI模型、產品視覺和遊戲資產的圖像使用OpenAI API建構:在建構時參考最新的OpenAI API文件建立文件:一套用於讀取、建立和編輯具有專業格式和佈局的PDF、電子表格和docx檔案的技能。當使用者在應用中建立一個新skill時,該技能可以在任何工作環境中使用:應用內、CLI或IDE擴展中。使用者還可以將技能檢入程式碼倉庫,使其對整個團隊可用。3. 通過自動化委託重複性工作借助Codex應用,使用者還可以設定自動化(Automations),讓Codex按照自動計畫在後台工作。自動化將指令與可選技能相結合,並按使用者定義的時間表運行。當自動化完成時,結果會進入一個審查佇列,以便使用者在需要時可以返回並繼續工作。在OpenAI內部,自動化已被用於處理重複但重要的任務,例如每日問題分類、尋找和總結CI失敗、生成每日發佈簡報、檢查錯誤等。4. 適配個人工作風格的個性開發者在與智能體協作時有不同的偏好。一些人想要一個直截了當、注重執行的夥伴;另一些人則更喜歡溝通性強、更具互動性的交流。Codex現在允許開發者在兩種個性之間進行選擇——一種是簡潔務實的風格,另一種是更健談、更具共情力的風格,兩者在能力上沒有差異。使用者只需在應用、CLI和IDE擴展中使用 /personality 命令即可切換。請參閱文件,瞭解更多關於如何設定和使用 Codex 應用的資訊https://developers.openai.com/codex/app默認安全,可配置設計OpenAI正在整個Codex智能體技術堆疊中整合設計即安全的理念。Codex應用使用與Codex CLI中相同的原生、開源且可配置的系統級沙盒。默認情況下,Codex智能體僅限於編輯其工作所在資料夾或分支中的檔案,並使用快取的Web搜尋。當需要運行網路訪問等需要提升權限的命令時,它會請求許可。使用者可以為項目或團隊配置規則,允許某些命令自動以提升的權限運行。下一步計畫企業和開發者越來越依賴Codex進行端到端開發。自去年12月中旬GPT-5.2-Codex推出以來,Codex的總體使用量翻了一番,在過去一個月裡,有超過一百萬名開發者使用了Codex。OpenAI表示將繼續擴展開發者可以使用Codex的場景和方式,包括在Windows上推出該應用、推動模型能力的前沿,並推出更快的推理速度。在應用內部,團隊將根據真實世界反饋繼續完善多智能體工作流,使其更容易管理平行工作並在智能體之間切換而不丟失上下文。同時,他們也在建構支援基於雲的觸發器的自動化功能,這樣Codex就可以在後台持續運行,而不僅僅是在電腦開著的時候。Codex建立在一個簡單的前提上:一切都由程式碼控制。一個智能體在推理和生成程式碼方面越出色,它在所有形式的技術和知識工作中就越有能力。然而,當今的一個關鍵挑戰是,前沿模型的能力與人們在實踐中輕鬆使用它們之間的差距。Codex旨在通過簡化指導、監督和將模型全部智能應用於實際工作的方式來縮小這一差距。OpenAI表示,他們專注於使Codex成為最好的編碼智能體,這也為它成為一個能夠處理超出編寫程式碼範圍的廣泛知識工作任務的強大智能體奠定了基礎。 (AI寒武紀)
OpenAI Codex桌面版深夜突襲!一人指揮Agent軍團,程式設計師徹底告別996
太帶勁了!搶先Claude 5,OpenAI深夜祭出了一個編碼殺器——Codex。它可以讓一人指揮多Agent平行協作,自帶Skills,編碼從此進入自動化時代。Claude 5的腳步聲越來越近,奧特曼終於坐不住了。就在剛剛,OpenAI毫無預警地拋出「王炸」——Codex正式進化為獨立的桌面App。這不僅僅是一個寫程式碼的窗口,更是一個能同時指揮千軍萬馬(多個Agent)的「全能指揮部」。Codex定位非常明確:要做Agent的「指揮中心」具體來說,Codex可以做到以下幾點:多工平行切換,毫不費力:同時呼叫多個AI智能體開展工作,並通過「工作樹」(worktrees)實現變更隔離,互不干擾;建立並呼叫Skills:將工具和開發規範封裝成可復用的能力;設定自動化流程:通過後台定時工作流,把那些重複性的瑣事統統交給Codex處理。假設想要為相簿裡的照片加入「拖曳」功能,選擇「工作樹」,即可讓AI在同一倉庫中各司其職。Codex的進化令人毛骨悚然,它不僅生成程式碼,還學會了利用程式碼作為「Skills」來操控電腦。比如想要解決項目中的Comment,直接呼叫安裝好的Skills,Codex立刻就把問題破解了。不僅如此,OpenAI僅憑一句話,就讓Codex消耗700萬 token,徒手搓出一個3D版賽車遊戲。這一次,Codex的誕生,並非是新瓶裝舊酒,更不是一次毫無誠意的「套殼」包裝。它標誌著AI程式設計正式從「對話助手」進化為「指揮中心」。奧特曼激動表示,「真是愛了愛了,它比我想像中還要驚喜」!「AI程式設計師就是不會耗盡多巴胺。他們不會感到沮喪,也不會耗盡能量。它們會一直堅持下去,直到解決問題」。OpenAI總裁Greg牆裂推薦——我多年來一直是終端和Emacs的鐵粉,但自從用了Codex之後,再回到終端簡直感覺像穿越回了過去,代差太明顯了。這種感覺,就像是一個專門為開發而生的AI智能體原生介面。OpenAI Codex代表著一種全新的AI Coding範式,極有可能重塑開發者與程式碼互動的邏輯。甚至,Codex還可與Claude Cowork狂飆能力,把雜亂桌面瞬間清理乾淨。目前,Codex正式在macOS上線,Windows版即將推出。OpenAI還放出了「限時福利」,ChatGPT免費使用者和Go版本也可用上Codex,Plus、Pro、Business、Enterprise和Edu計畫的使用者,速率直接翻倍。編碼殺器Codex APP震撼登場一人指揮所有AgentmacOS版Codex應用,是一個功能強大的新介面。它能讓開發者能輕鬆駕馭多個AI智能體,平行處理任務,並與AI協作搞定那些耗時的大活兒。過去一直以來,開發者和AI的關係是「結對程式設計」,你寫一段,它接一段。如今,Codex的出世將徹底改變軟體建構的方式——人類不再與AI緊密結對,直接給AI委派任務,貫穿於軟體設計、建構、發佈和維護的全生命周期。這一轉變的苗頭,實際上從2025年4月發佈Codex以來,便已初見端倪。開發者與AI的協作方式已發生了根本性轉變。現有模型可以端到端地處理複雜的、長流程的任務,開發者也開始在跨項目中指揮多個AI智能體:分派工作、平行跑任務,並放心地把耗時數小時、數天甚至數周的重大項目交給 AI 。核心挑戰已不再是AI能做什麼,而是人們如何大規模地指揮、監督並與它們協作——遺憾的是,現有的IDE和終端工具並非為此而生。這種全新的建構方式,加上模型能力的提升,呼喚著一種全新的互動載體。這正是OpenAI要推出Codex桌面應用的原因,主打「一個AI智能體的指揮中心」。多智能體平行,狂飆程式碼不亂套Codex為與AI智能體多工平行,建構了一個專注的空間。所有AI在按項目組織的獨立線程中運行,確保你無縫地在任務間切換,而不會丟失上下文。你可以在應用裡直接檢查AI的改動,在diff上寫評論,甚至用編輯器打開進行手動調整。它還內建了對Git worktree的支援,所以多個AI可以在同一個倉庫(repo)上開工而互不衝突。每個AI都在你程式碼的隔離副本上工作,讓你能探索不同的開發路徑,而無需操心它們會如何影響你的主程式碼庫。當AI智能體幹活時,可以把改動拉(checkout)到本地,或者讓它繼續推進,完全不動本地的git狀態。應用會自動從Codex CLI和IDE擴展中同步會話歷史和配置,這樣你馬上就能在現有項目中用起來。解鎖Skills外掛,手搓3D賽車遊戲Codex正從一個只會寫程式碼的AI,進化為一個能用程式碼在電腦上真正解決問題的AI。通過Skills(技能),可以輕鬆擴展Codex的能力。今後,Codex不再侷限於程式碼生成,還能處理資訊收集與整合、問題解決、寫作等任務。Skills就像是打包好的指令、資源和指令碼,讓Codex能可靠地連接工具、運行工作流,並按照團隊的習慣完成任務。Codex應用裡有一個專門的介面來建立和管理Skills。你可以明確要求Codex使用某個Skill,或者讓它根據手頭的任務自動呼叫。OpenAI舉了一個例子,曾讓Codex做一個賽車遊戲——要有不同的車手、八張地圖,甚至還有玩家能用空格鍵觸發的道具。利用圖像生成 Skill(由GPT Image驅動)和網頁遊戲開發Skill,Codex僅憑最初的一個使用者提示詞,就獨立工作並消耗了超過700萬個Token,把遊戲做了出來。它身兼數職,既是設計師、遊戲開發者,又是QA測試員,通過實際試玩來驗證成果。6萬Token可以看到,在只消耗了6萬token的這個版本裡,畫面非常粗糙。很窄的賽道中間,塞滿了撞上去會穿模的「障礙物」。技能箱可以吃,也可以發射,但好像沒有什麼效果。最尷尬的是,你會永遠在「第二圈」無限循環下去……80萬Token在80萬token的版本裡,畫面似乎好了一些,賽道也寬敞了不少,更接近大家平時玩的賽車遊戲了。但是箱子吃到的技能好像沒什麼用,發射出去之後,小車們還是各跑各的……而且依舊會在第二圈陷入循環,永遠跑不完。700萬Token最後這個700萬token的版本,畫質明顯好了很多。不僅有清晰的賽道,技能箱也更精緻了。這次,技能箱確實有用了。比賽剛開始,我們就吃了AI扔出的一個大招,沒有閃。於是,喜提倒數第一,不過,比起前兩個陷入無限循環的世界來說,這次至少能完賽了。從跑評測和盯著模型訓練,到起草文件和匯報增長實驗,OpenAI內部建構了數百個Skills,來幫助多個團隊自信地把以前很難統一定義的工作委派給Codex。Codex應用內建了一個Skills庫,涵蓋了OpenAI內部流行的工具和工作流,下面重點介紹幾個。實現設計:從Figma拉取設計上下文、資源和截圖,並將其轉化為視覺上1:1還原的生產級UI程式碼。管理項目:在Linear中處理Bug分類、追蹤發佈、管理團隊工作負載等,推動項目進展。部署到雲端:讓Codex把你做好的Web應用部署到流行的雲主機,如Cloudflare、Netlify、Render和Vercel。生成圖像:使用由GPT Image驅動的圖像生成Skill來建立和編輯圖像,用於網站、UI原型、產品配圖和遊戲素材。使用OpenAI API建構:在使用OpenAI API開發時,參考最新的文件。建立文件:一套用於閱讀、建立和編輯PDF、電子表格和檔案的Skills,排版佈局專業。使用Vercel和圖像生成Skills更新網站使用電子表格Skill建立表格以生成購物清單使用Linear管理你的Issue Backlog當你在應用中建立一個新Skill時,Codex可以在你工作的任何地方使用它:應用內、CLI或IDE擴展中。你也可以把Skills提交到程式碼倉庫,讓整個團隊都能用上。OpenAI分享的Agent Skills:https://github.com/openai/skills一鍵自動化,24h為你打工Codex可以設定Automations(自動化),按計畫在後台自動幹活。Automations將指令與可選的Skills結合,會按照你設定的時間表運行。當Automation完成時,結果會進入審查佇列,可以隨時切回來查看並根據需要繼續後續工作。設定自動化以定期建立新Skills在OpenAI,團隊一直用Automations來處理那些重複但重要的任務,比如每日Issue分類、尋找和總結CI失敗原因、生成每日發佈簡報、檢查Bug等等。雙人格模式,秒切換開發者在與AI合作時口味各不相同。有人喜歡直截了當、只講執行的搭檔;有人則喜歡話多一點、更有互動感的風格。Codex現在允許開發者在兩種個性間選擇——一種是簡潔務實風,另一種是更具對話感和同理心的風格。兩者的能力完全一樣,只為貼合你的喜好。只需在應用、CLI和IDE擴展中輸入/personality命令即可切換。默認安全,按需配置此外,OpenAI還將「設計即安全」(Security by Design)的理念融入了Codex AI智能體棧的方方面面。Codex 應用採用了原生的、開源且可配置的系統級沙箱(Sandboxing),這就跟在Codex CLI裡一樣。默認情況下,Codex AI 智能體只能編輯它當前工作的資料夾或分支裡的檔案,並使用快取的網頁搜尋。如果需要運行像聯網訪問這類需要更高權限的命令,它會先請求你的許可。你可以為項目或團隊配置規則,允許特定命令自動以提升的權限運行。一切皆由程式碼控制如今,企業和開發者正越來越依賴Codex進行端到端開發。自12月中旬發佈GPT-5.2-Codex以來,Codex的總使用量翻了一番,過去一個月裡有超過100萬開發者使用Codex。下一步,團隊繼續擴展Codex使用場景,包括上線Windows版應用、不斷突破模型能力邊界,以及實現更快的推理速度。OpenAI科學家感慨,過去幾周寫的程式碼比過去幾年還要多。而且,還用Codex修復了Prism多個bug和功能更新在應用內部,OpenAI還將根據實際反饋持續打磨多AI智能體工作流,讓管理平行任務和在AI間切換變得更容易,且不丟失上下文。他們還在為Automations開發基於雲端的觸發器支援,這樣Codex就能在後台持續運行——而不僅僅是在你電腦開著的時候。Codex建立在一個簡單的前提之上:一切皆由程式碼控制。一個AI智能體在推理和生成程式碼方面越強,它在各類技術和知識工作中的能力就越強。OpenAI全家桶然而,當今的一個關鍵挑戰在於,前沿模型的能力與人們在實際中輕鬆使用它們之間存在差距。Codex旨在縮小這一差距,讓人們更容易指揮、監督並將OpenAI模型的全部智慧應用到實際工作中。OpenAI致力於將Codex打造成最強的程式設計AI智能體,這也為它成為能處理程式碼之外廣泛知識工作的全能AI奠定了基礎。附錄在製作上面這款賽車遊戲時,Codex使用的初始提示詞如下(總結精煉版):使用Three.js實現Voxel Velocity作為一個3D體素卡丁車賽車遊戲,只有一種模式:單人比賽(總是3圈,1個人類對7個CPU,所有8條賽道立即在這個模式下可用,沒有進度限制)。建構一個最小的賽前流程,僅包括:賽道(8),角色(8),難度(輕鬆/標準/刻薄),可選的鏡像模式,可選的允許克隆,和開始比賽,加上一個選項菜單和一個賽中暫停菜單(恢復/重新開始/退出)。建立一個街機駕駛模型,具有靈敏的操控,寬容的擦牆碰撞,有意義的漂移作為主要技能,以及一個漂移充電系統,產生精確的加速等級(1級0.7秒,2級1.1秒,3級1.5秒),同時保持基準速度「快但可讀」,並且在寬闊的道路上保持持續的超車。實現正好8個道具,單道具容量,微妙的位置加權分佈,和溫和的效果(最大失控≤1.2秒,最大轉向停用≤0.6秒),創造滑稽的混亂而沒有硬眩暈,加上在加速期間減少50%的越野減速。定義8個角色及其給定的統計資料和AI傾向,實現CPU難度預設和賽道編寫的賽車/變化樣條線,漂移區和危險迴避,以便AI使用多車道寬度進行乾淨的超車,並行布HUD/音訊要素(位置,圈數/最後一圈橫幅,小地圖,道具槽,計時器/分段,可讀的音效,和每個賽道一個音樂循環)。隨後,Codex不斷地被從10個通用提示詞的隨機列表中重新提示,以繼續處理這個問題。其中一個提示詞的例子是:你的工作是加入新功能,使遊戲更接近原作。首先,玩遊戲並確定與原作相比缺少了什麼。然後挑選幾個缺失的功能並實現它們。在每個功能之後,徹底測試它,通過玩遊戲並確認它工作正常。如果你在玩的時候注意到任何錯誤,也要優先修復它們。 (新智元)