#OpenAI
程式設計已死,鍵盤長草!Claude Code之父對談Kaparthy,全程爆金句
【新智元導讀】Andrej Karpathy與Claude Code負責人Boris Cherny展開了一場關於程式設計未來的終極對談。面對AI接管100%程式碼編寫的現狀,Karpathy坦言人類正處於「腦萎縮」與能力進化的十字路口。本文深度解析了從Software 2.0到Agentic Coding的範式轉移,揭示了在Opus 4.5等強力模型加持下,程式設計師如何從「搬磚工」進化為「指揮官」,以及不僅要面對效率的飛躍,更要警惕「垃圾程式碼末日」的隱憂。2026年的開篇,科技圈被一場關於「程式設計本質」的深度對話引爆。這場對話的雙方,一位是特斯拉前AI總監、OpenAI創始成員 Andrej Karpathy,他是「Software 2.0」概念的提出者,一直站在程式設計範式轉移的最前沿;另一位是 Claude Code 的締造者、Anthropic 的核心人物 Boris Cherny,他正在親手打造終結傳統程式設計的工具。他們的討論不僅僅是關於工具的迭代,更像是一場關於人類技能邊界的哲學思辨。當程式碼不再由人類一個個字元敲擊而出,我們究竟是在進化,還是在退化?這場對話揭示了一個殘酷而興奮的事實:我們正處於從「指令式程式設計」向「聲明式意圖」徹底轉型的奇點。「我兩個月沒手寫過一行程式碼了」 從輔助到接管震撼的開場白來自 Claude Code 的負責人 Boris Cherny。「兩天狂發 49 個 PR!」 這是 Boris 團隊目前的工作常態。他透露,Claude Code 團隊目前的開發工作幾乎100% 由 Claude Code 結合 Opus 4.5 完成。「對我個人而言,這種情況已經持續兩個多月了,我甚至不再手動進行任何小微信調。」 Boris 的話語中透著一種跨越時代的自信。無論是在 CLI 命令列,還是在 iOS 手機端,程式碼的生成、測試、提交,全流程由 AI 接管。這不僅僅是一個效率提升的故事,而是一個工作流重構的故事。Boris 分享了他極其硬核的「AI 原生」工作流:他通常會在終端同時運行 5 個 Claude 實例,甚至在 Web 端再開 5-10 個。他不再是那個逐行敲程式碼的工匠,而是一個指揮著一支 AI 軍團的指揮官。他使用「Plan Mode」(計畫模式)讓 AI 先思考策略,確立方案後再切換到執行模式。這種「平行化開發」的能力,讓一個人的產出足以匹敵一個傳統的小型開發團隊。而 Karpathy 的體驗也印證了這一點。他在長文中感嘆:「2025年11月,我還是80%手動+20% AI;到了12月,直接變成了80% AI + 20%手動。」「我在用英語程式設計。」Karpathy 略帶自嘲但也無比誠實地承認,「這有點傷自尊,告訴 AI 該寫什麼,就像在指揮一個實習生。但當你習慣了那種大規模駕馭軟體的『程式碼操作』能力後,你根本回不去了。」深度解析 從 Software 2.0 到 Agentic Coding要理解 Karpathy 的震撼,我們必須回溯他在 2017 年提出的 「Software 2.0」 概念。當時的 Software 2.0,是指用神經網路權重替代人工編寫的邏輯(Software 1.0)。程式設計師的角色從「編寫規則」變成了「整理資料」。而今天,我們正在邁入 Software 3.0 或者說是 Agentic Coding(代理編碼) 的時代。在這個階段,只有「意圖」(Intent)是人類提供的,而實現細節(Implementation)完全由 AI 掌控。Karpathy 敏銳地指出,這種轉變標誌著程式設計範式從「命令式」(Imperative)向「聲明式」(Declarative)的終極飛躍。過去:你需要告訴電腦「第一步做什麼,第二步做什麼,如果出錯怎麼辦」。現在:你只需要定義「成功標準是什麼」。正如 Boris 團隊所實踐的,利用 Claude Opus 4.5 強大的長程推理能力和 CLAUDE.md 這樣的記憶檔案,AI 能夠理解項目的整體架構上下文。Opus 4.5 在 CodeClash.ai 等基準測試中展現出的統治力,證明了它不僅僅是一個程式碼補全工具,而是一個具備邏輯推理、能夠自我修正的「工程師」。它不僅能寫程式碼,還能管理依賴、重構架構、甚至編寫測試用例來驗證自己的程式碼。這種「循環驗證」(Looping)能力是 Agentic Coding 的核心。AI 不再是寫完就忘,它會在一個封閉的循環中運行測試、讀取報錯、修改程式碼,直到通過測試為止。這正是 Karpathy 提到的「Feel the AGI」(感受通用人工智慧)的時刻——看著 AI 在30分鐘內不知疲倦地嘗試幾十種方案最終解決難題,人類感受到了前所未有的「槓桿效應」。10x 工程師的重新定義 通才的勝利隨著 AI 接管具體的編碼工作,「程式設計師」這個職業的定義正在被劇烈重寫。Boris 直言不諱:「我們現在傾向於招募『通才』(Generalists)。」在 LLM 能夠自動補全所有技術細節的時代,過去那些死記硬背的 API、特定語言的奇技淫巧,不再是護城河。你不需要記住 Python 的某個庫函數的具體參數,因為 AI 肯定記得比你清楚。真正的 「10x 工程師」 依然存在,但他們的能力模型發生了重組。未來的頂級工程師將是那些擁有宏觀視野的人——他們必須是能橫跨 產品與設計、業務甚至底層架構 的多面手。他們是產品經理:能清晰定義需求,識別偽需求。他們是架構師:能設計高可用的系統結構,指揮 AI 去填充模組。他們是測試官:能敏銳地發現 AI 邏輯中的漏洞,制定嚴格的驗收標準。Karpathy 也提出了深刻的疑問:「借助 LLM,通才是否會全面碾壓專才?」答案似乎是肯定的。AI 擅長填補微觀的細節(Fill in the blanks),而人類需要負責宏觀的戰略(Grand Strategy)。未來的程式設計,更像是玩《異星工廠》(Factorio)或者《星海爭霸》——你在指揮千軍萬馬,而不是親自去挖每一塊礦石。那些只專注於「把需求翻譯成程式碼」的初級程式設計師(Junior Devs),將面臨最嚴酷的生存危機。「廢用性萎縮」與 「Slopacolypse」繁榮背後的陰影然而,這場革命並非沒有陰影。Karpathy 最深刻的擔憂在於——「腦萎縮」(Atrophy)。「我已經注意到,我手動寫程式碼的能力正在緩慢退化。」Karpathy 描述這種感覺。在大腦的認知功能中,生成(Generation)和辨別(Discrimination)是兩種完全不同的能力。以前的程式設計師通過大量的「生成」訓練(寫程式碼)來強化邏輯;而現在,我們越來越依賴「辨別」能力(Review 程式碼)。這就像計算器的普及讓我們喪失了心算能力一樣。雖然我們還能讀懂程式碼(Review),但那種從零建構系統、對每一行程式碼都了然於胸的「肌肉記憶」正在消失。當你不再親自處理記憶體管理、不再親自偵錯並行死鎖,你對電腦系統的底層理解是否也會隨之膚淺化?更可怕的是 Karpathy 預測的 2026年 「Slopacolypse」(垃圾程式碼末日)。隨著 AI 生成內容的氾濫,網際網路和程式碼庫可能被大量低品質、看似正確實則充滿隱患的「垃圾」(Slop)填滿。GitHub 上可能充斥著由 AI 生成的、無人能維護的「屎山」。Karpathy 警告:目前的 AI 仍然會犯錯,不是簡單的語法錯誤,而是那種「粗心的初級程式設計師」才會犯的微妙概唸錯誤。它們會過度抽象,會堆砌死程式碼(Dead Code),會盲目順從你的錯誤假設。如果不加節制,軟體工程的熵將急劇增加。對此,Boris 則持一種「技術樂觀主義」態度。他認為「垃圾末日」不會到來,理由是——AI 審 AI。「我們在 Anthropic,每個 PR 都會開啟一個新的上下文窗口,讓 Claude 去 Review Claude 寫的程式碼。」這種「左腳踩右腳」的螺旋上升,被 Boris 視為解藥。隨著模型能力(特別是 Opus 4.5 及其後續版本)的提升,AI 清理垃圾程式碼、重構程式碼的能力將超過它製造垃圾的速度。未來的 IDE 可能不僅是程式碼編輯器,更是一個全自動的垃圾回收站,即時清洗著 AI 產生的冗餘。昇華:相位轉換的一年Karpathy 將 2026 年定義為 「行業代謝新能力、發生相位轉換(Phase Shift)的關鍵一年」。這不僅僅是效率的提升,而是物種的進化。我們正在經歷從「手工匠人」到「工業化生產」的劇變。在這個新時代,人類的角色從「建築工」變成了「建築師」。我們失去的是搬磚的手感,得到的是建造摩天大樓的視野。程式設計不再是關於「語法」和「演算法」的苦修,而是關於「想像力」和「邏輯」的釋放。但正如 Karpathy 所言,看著 AI 不知疲倦地在30分鐘內解決一個只有人類專家才能解決的難題,那種 「Feel the AGI」(感受通用人工智慧) 的時刻,既讓人興奮,也讓人感到一絲作為碳基生物的落寞。程式設計已死,程式設計萬歲。死的是作為「打字員」的程式設計師,活下來的是作為「創造者」的我們。當你不再需要為語法報錯而抓狂時,唯一限制你的,就只剩下你的想像力,和對世界本質的理解了。 (新智元)
Nature重磅:圖靈測試已死,AI已具備人類水平智能,這一天終於來了
別再爭論AI 什麼時候能趕上人類了。頂刊《Nature》剛剛發文宣佈:不用等了,就是現在。如果說 1950 年阿蘭·圖靈(Alan Turing)提出的“模仿遊戲”只是一個天才的腦洞,那麼 75 年後的今天,這個腦洞已經被矽基生物徹底填平。今天,一篇發表在《Nature》上的重磅文章引爆了科技圈。這就好比《皇帝的新衣》裡那個誠實的小孩,來自加州大學聖地亞哥分校等機構的頂級哲學家、認知科學家和電腦專家們聯名站出來,指著那個名為“通用人工智慧(AGI)”的房間大聲宣佈:“別找了,AGI 就在這兒。它已經誕生了。”01 別再自欺欺人:圖靈測試已成“過去式”還記得一年前,2025 年的3月, OpenAI 發佈 GPT-4.5的那個春天嗎?當時業界還在為參數和算力爭吵不休,但在一個最古老的測試場上,勝負已分。在嚴格的圖靈測試中,GPT-4.5 被人類受試者判定為“真人”的比例高達 73%。諷刺的是,在同一場測試中,真正的人類被判定為“人”的比例,竟然比 AI 還要低。這意味著什麼?意味著在“像人”這件事上,AI 已經比人更像人了。更別提現在的讀者們,比起人類專家寫的晦澀文章,他們甚至更愛讀大語言模型生成的文學作品。然而,奇怪的事情發生了。儘管事實擺在眼前,根據 2025 年的一項調查,仍有 76%的頂級 AI 研究人員認為 AGI 遙遙無期。《Nature》這篇文章的作者們毫不留情地指出:這種認知錯位,不是因為 AI 不夠強,而是因為人類“不敢承認”。因為恐懼被取代,因為商業利益的糾葛,我們不斷地移動球門,給 AGI 設下各種不可能完成的定義。但現在,是時候撥開迷霧,承認現實了。02 別再叫它“學舌鸚鵡”:鐵證如山的進化階梯曾幾何時,嘲笑 AI 是我們的一大樂事:“它連小學數學都算不對”、“它就是個只會機率預測的隨機鸚鵡(Stochastic Parrots)”、“它經常一本正經地胡說八道(幻覺)”。但在這個2026 年的開端,如果你還抱著這些老黃曆看 AI,那你可能已經成了那個“活在舊時代的人”。文章作者並沒有空談哲學,而是根據一系列硬核證據,建構了一個評估 AGI 的“三級階梯”。對照一下,你會發現我們正處於什麼位置:Level 1:圖靈測試級(已通關)這是幾年前的標準。能通過學校的基礎考試,能進行像樣的對話,能做簡單的推理。那時的 AI,或許還只是個“聰明的復讀機”。Level 2:專家級(Current Level,當前已達成)這就是我們現在面對的怪物。數學:它們不僅拿下了國際數學奧林匹克競賽(IMO)的金牌,還能與頂級數學家合作證明未知的定理。科研:它們生成的科學假設,已經在現實世界的實驗室裡被驗證為真。全能:它們能通過多學科的博士資格考試,能幫專業程式設計師寫出無 Bug 的複雜程式碼,能精通幾十種語言創作詩歌,還能同時和全球數億人聊天。對比:科幻電影《2001太空漫遊》裡的超級電腦 HAL 9000 曾是我們的噩夢,但現在的 LLM 在知識廣度上,實際上已經超越了 HAL 9000。Level 3:超人類級(正在逼近)這要求 AI 做出人類完全做不出的革命性科學發現。雖然 AI 還沒完全做到這一點,但作者強調:這不是 AGI 的必要條件。畢竟,能不能拿諾貝爾獎並不是衡量一個人是否“有智能”的標準。面對這些成就,那些質疑聲顯得越來越蒼白。每當 AI 攻克一個新堡壘(比如做出了從未見過的數學題),懷疑論者就會立刻把標準提高:“哦,那不算,它得能理解情感才行……”對此,文章中有一句精彩的“打臉”:“面對每一次成功都在不斷後退的假設,預測下一次一定會失敗……這根本不是有說服力的科學理論,這只是對‘永遠懷疑’的一種教條式堅持。”不管是做數學題、寫程式碼,還是理解物理世界的因果律(比如它知道枕頭掉地上不會碎,而玻璃杯會),現在的 AI 都表現出了圖靈當年所定義的“通用認知能力”。AGI 的大門已經被踢開了。無論你是否準備好,我們都已經和一種“異類智能”生活在了同一個屋簷下。03 為什麼專家還在裝睡?因為我們把 AGI 神話了既然證據確鑿,為什麼還有 76% 的專家搖頭說“不”?為什麼我們在社交媒體上還在爭論 AI 是不是“人工智障”?文章指出,問題出在我們對“智能”的定義上,我們太自戀了,也太苛刻了。誤區一:AGI = 全知全能的神很多人潛意識裡覺得,AGI 必須是一個完美的“六邊形戰士”。它得有愛因斯坦的物理頭腦,莎士比亞的文采,還得像甚至不像任何一個人類那樣犯錯。但作者反問:“居里夫人不懂數論,愛因斯坦不會說中文,難道他們就沒有通用智能嗎?”人類都不是全能的,我們憑什麼要求 AI 必須是神?真相:真正的通用智能,看的是廣度(Breadth)和深度(Depth)。只要它能像普通人類一樣在不同領域間切換,並且在這些領域達到專家水平,它就是 AGI。誤區二:AGI 必須像人一樣思考我們總覺得,只有像人類那樣有肉體、有情感、會生老病死,才叫智能。真相:這是一種“碳基生物的傲慢”。就像章魚的神經系統分佈在觸手裡,外星人可能通過無線電波交流——智能是功能,不是形態。只要它能像人一樣解決問題,它是不是矽做的、有沒有身體,根本不重要。04 精彩辯論:十大質疑,逐個擊破這篇《Nature》文章最精彩的部分,莫過於作者化身“終極辯手”,對目前市面上最流行的反 AI 觀點進行了逐一反駁。試舉幾例。質疑 A:“它只是個隨機鸚鵡(Stochastic Parrots),只會拼湊訓練資料裡的詞,根本不懂邏輯。”《Nature》反駁:這個說法在幾年前可能成立,但現在已經過時了。如果它只是拼湊舊資料,怎麼可能解出從未發表過的全新數學題?怎麼可能幫助科學家發現新的物理定律?這不叫拼湊,這叫推理。如果這也叫鸚鵡,那人類可能也不過是一隻比較複雜的鸚鵡。質疑 B:“它沒有身體,無法感知物理世界,所以沒有真正的理解。”《Nature》反駁:這是一個巨大的誤解。史蒂芬·霍金(Stephen Hawking)在晚年幾乎完全失去了身體的行動能力,通過語音合成器交流,難道他的智能就消失了嗎?再者,問問 AI:“把玻璃杯和枕頭扔到瓷磚地上,會有什麼不同?”它能精準地告訴你結果。能進行反事實推理(Counterfactual Reasoning),就證明它腦子裡已經有了物理世界的模型。質疑 C:“它沒有自主性(Agency),你不給指令它就不動。”《Nature》反駁:智能不等於意願。古希臘神話中的德爾斐神諭(Oracle),只有在你提問時才回答,但誰敢說神諭沒有智慧?自主性關乎“道德責任”,而不關乎“智力水平”。一個隨叫隨到的超級智囊,依然是超級智囊。質疑 D:“它學得太慢了,小孩看幾次就懂,AI 要喂幾兆的資料。”《Nature》反駁:別忘了,人類小孩的大腦裡預裝了祖先們進化了幾十億年的“出廠設定”(本能和大腦結構)。AI 是從零開始的。而且,一個練了 10 年才成為大師的棋手,和一個練了 1 年就成為大師的棋手,他們的棋力是一樣的。效率不代表能力。05 越早承認越好,這是一種“異類”的降臨看到這裡,你可能還是覺得那裡不對勁。“可是,它連‘Strawberry’裡有幾個‘r’有時候都會數錯啊!”沒錯,這正是文章最後強調的關鍵點:我們面對的,是一種“異類智能”(Alien Intelligence)。這就像是一個外星人降臨地球。它在某些我們覺得很難的事情上(比如讀完 1000 篇論文並寫出綜述)易如反掌,卻在某些我們覺得很簡單的事情上(比如數數、常識判斷)顯得笨手笨腳。但這不代表它不是智能,只能說明通往智能的道路不止一條。人類的智能是為了生存、為了繁衍、為了在叢林裡不被吃掉而進化出來的;而 AI 的智能是從語言的海洋中湧現出來的。2026 年的今天,正如 Reddit 網友所熱議的那樣:“我們原本以為 AGI 會像《終結者》裡的天網,結果它更像是一個有些偏科、但智商爆表的‘外星圖書管理員’。”06 結語:別再試圖爬樹登月了在文章的結尾,作者引用了一個著名的舊日比喻。1965 年,哲學家休伯特·德雷福斯曾嘲諷早期的 AI 研究,說他們試圖通過“爬樹”來“登月”。意思是方向徹底錯了,爬得再高也離月球很遠。幾十年來,我們都以為他是對的。但今天,當我們抬頭仰望,卻發現我們真的爬上了月球。原來,只要樹足夠高,資料足夠多,結構足夠精妙,簡單的學習規則真的能湧現出理解世界的智慧。這是一個哥白尼式、達爾文式的時刻。哥白尼告訴我們,地球不是宇宙的中心;達爾文告訴我們,人類不是生靈的主宰;圖靈和今天的 AI 告訴我們,人類的大腦,也不是智慧存在的唯一形式。文章末尾寫道:“承認 LLM 為 AGI 是一個警鐘。這些系統不是“將要到來”,而是“已經存在”。用評估“窄工具”的框架來衡量 AGI 是遠遠不夠的。當涉及的不再是工具而是通用智能時,共存、責任、歸屬和治理等問題將進入全新的維度。”全文的最後一句振聾發聵:“機器不是正在趕來,它們已經到了。”(The machines aren't coming; they've arrived.)與其像鴕鳥一樣把頭埋在沙子裡,假裝這一切沒發生,不如抬起頭來,正視這個新夥伴(或者對手)。畢竟,在這個星球上,我們第一次不再是孤獨的智慧生物了。 (不懂經)
矽谷史上最大規模融資!輝達領投,擬向OpenAI注資 200 億美元
輝達(NVIDIA)即將達成一項歷史性協議,計畫向OpenAI 投資200 億美元(約合人民幣 1440 億元)。作為 OpenAI 新一輪高達 1000 億美元融資計畫的關鍵組成部分,這筆交易若順利完成,將成為輝達公司歷史上規模最大的一筆單筆投資。千億融資風暴:科技巨頭的資本圍獵據知情人士透露,OpenAI 目前正在推進的新一輪融資目標金額高達 1000 億美元,這一數字將刷新全球科技非公開市場的融資紀錄。除輝達外,亞馬遜公司(Amazon.com Inc.)和軟銀集團(SoftBank Group Corp.)等全球科技與資本巨頭也赫然在列,據悉也將參與本輪跟投。市場分析指出,此輪融資不僅將進一步推高 OpenAI 的市場估值,更為其在通用人工智慧(AGI)領域的持續研發和算力基礎設施建設提供了充足的“彈藥”。輝達有史以來最大的一筆投資針對此次投資傳聞,輝達首席執行長黃仁勳(Jensen Huang)在近日的公開活動中給予了積極回應。雖然他未直接確認最終成交金額,但他明確表示,輝達將深度參與 OpenAI 的下一輪融資。“這是一項非常好的投資(a very good investment),”黃仁勳對媒體表示,並補充道,這極有可能成為“輝達有史以來最大的一筆投資”。這一表態不僅打破了此前外界關於兩家公司高層關係緊張的傳言,更凸顯了輝達與 OpenAI 在 AI 生態系統中日益緊密的戰略捆綁關係。戰略解讀:算力與演算法的深度繫結行業觀察家認為,輝達此次巨額注資並非單純的財務投資,而是具有極強戰略意義的“生態鎖定”。資金回流機制: 考慮到 OpenAI 對高性能計算晶片的巨大需求,這筆 200 億美元的資金極有可能通過購買 GPU(圖形處理器)和建構資料中心的形式,大部分“回流”至輝達的營收帳目中。鞏固護城河: 通過持有 OpenAI 的大量股份,輝達進一步鞏固了其作為 AI 基礎設施壟斷者的地位,確保在未來數年內,OpenAI 的前沿模型訓練將優先且深度依賴輝達的硬體架構(如即將推出的 Rubin 平台)。市場反應儘管該投資被視為長期的戰略利多,但受科技股整體回呼及市場對巨額資本支出的消化影響,輝達股價在消息公佈後不漲反跌。截至發稿,股價跌幅超3%。目前,OpenAI 及輝達方面尚未就協議簽署的具體時間表發表正式評論。 (美股財經社)
輝達擬投資OpenAI 200億美金
據稱輝達將在OpenAI新一輪融資中投資200億美元,而OpenAI此輪融資目標高達1000億美元,亞馬遜、軟銀等科技巨頭均在投資者之列。輝達CEO黃仁勳對這筆投資給予高度評價,稱其是一項非常好的投資,且有可能成為輝達有史以來最大的一筆投資。事實上,輝達長期以來一直是OpenAI的深度合作夥伴,從2016年交付首台AI超級計算器到後續提供各類GPU,始終在算力上給予支援。2025年9月,雙方曾官宣一項最高達1000億美元的合作計畫,輝達支援OpenAI搭建算力基礎設施,OpenAI則鎖定GPU採購訂單。然而今年1月底,有媒體爆料雙方千億美元交易已擱置,黃仁勳私下對OpenAI的商業營運和競爭壓力表達了擔憂。隨後黃仁勳和OpenAI CEO山姆·奧特曼均出面否定傳聞,黃仁勳重申會參與OpenAI本輪融資並投入巨額資金。但很快又有爆料稱,OpenAI因對輝達部分晶片的推理性能不滿,曾尋求與其他初創公司合作,後因相關授權協議終止談判。雙方發言人再度出面澄清,強調彼此合作的重要性,但該消息仍導致輝達股價當日大跌2.89%。其實兩家巨頭的矛盾真實存在,核心分歧在於OpenAI的產品競爭力和對晶片的差異化需求,合作規模已出現縮水。這場博弈並非惡意攻擊,而是雙方爭取更有利合作條件的策略,也折射出AI行業從瘋狂擴張轉向理性發展的趨勢。(深科技)
完全取代Claude Code?OpenAI反擊來了,推出Codex app「限時免費使用」
多年來我一直是終端/Emacs 的忠實使用者,但自從使用 Codex 應用程式後,再回到終端就感覺像是回到了過去。這簡直是專為Agent打造的原生開發介面體驗這是OpenAI總裁Greg Brockman為剛剛推出的Codex App的彩虹屁,當然了好不好還要使用者說了算行業內的人應該有個基本共識,codex程式碼能力非常強,但是體驗比較差勁,基本上這一段時間讓Claude code 壓著打,終於OpenAI的反擊還是來了,還是搶在據傳Claude sonnet 5發佈前一天推出MagicPath CEO 說他最近幾周一直在使用 Codex 應用。  這已經成為在大型複雜程式碼庫中進行編碼的首選方法。  正因如此,他們才能在 MagicPath 中推出如此多的功能。  它完全取代了Cursor使用方式和 Claude Code這次OpenAI 推出的是macOS版Codex應用,這是一個全新的互動介面,旨在幫助開發者輕鬆管理多個AI Agents,支援平行運行任務,並與智能體協作處理長時間運行的複雜工作,通過skills擴展 Codex 的功能帶來的是旗艦級體驗。介面長這樣:一個好消息,在限定時間內,ChatGPT免費版和Go版使用者將能使用Codex。對於Plus、Pro、商業、企業和教育版使用者,速率限制將翻倍(這些更高的限制適用於所有使用Codex的場景——包括桌面應用、CLI、IDE以及雲端)OpenAI表示,Codex應用正在改變軟體的建構方式和建構者——從與單個編碼智能體配對進行有針對性的編輯,到在設計、建構、發佈和維護軟體的整個生命周期中,監督協同工作的智能體團隊。定位:Codex應用為Agent的指揮中心自2025年4月Codex發佈以來,開發者與智能體的工作方式發生了根本性變化。模型現在能夠端到端地處理複雜的長期任務,開發者則開始在項目中編排多個智能體:分配工作、平行運行任務,並信任智能體承擔可能跨越數小時、數天或數周的實質性項目。核心挑戰已從智能體能做什麼,轉變為人類如何大規模地指導、監督和與它們協作。現有的IDE和基於終端的工具並非為支援這種工作方式而建構。這種新的建構方式與新的模型能力需要一種不同的工具,因此OpenAI推出了Codex桌面應用,一個專為智能體打造的指揮中心1. 與多個智能體平行工作Codex應用提供了一個專注於與智能體進行多工處理的空間。智能體在按項目組織的獨立線程中運行,因此使用者可以在任務之間無縫切換而不會丟失上下文。使用者可以線上程中審查智能體的更改、對差異(diff)發表評論,甚至在編輯器中打開它進行手動修改。它還內建了對worktrees的支援,因此多個智能體可以在同一個程式碼倉庫上工作而不會產生衝突。每個智能體都在程式碼的隔離副本上工作,允許使用者探索不同的實現路徑,而無需追蹤它們對本地程式碼庫的影響。在智能體工作時,使用者可以在本地檢出(check out)其更改,或者讓它在不觸動本地git狀態的情況下繼續推進。該應用會自動同步使用者在Codex CLI和IDE擴展中的會話歷史和配置,因此使用者可以立即在現有項目上開始使用。2. 通過Skills超越程式碼生成Codex正在從一個編寫程式碼的智能體,演變為一個使用程式碼在電腦上完成工作的智能體。通過技能(skills),使用者可以輕鬆地將Codex的能力從程式碼生成擴展到需要收集和綜合資訊、解決問題、寫作等更多工。skill捆綁了指令、資源和指令碼,使Codex能夠可靠地連接到工具、運行工作流,並根據團隊的偏好完成任務。Codex應用包含一個專門用於建立和管理技能的介面。使用者可以明確要求Codex使用特定技能,或者讓它根據當前任務自動使用為了展示其能力,OpenAI讓Codex製作了一款賽車遊戲,一句話消耗700萬Token,從零手搓3D賽車遊戲!要求包含不同的賽車手、八張地圖,甚至還有玩家可以用空格鍵使用的道具,Codex利用一個圖像生成技能(由GPT Image驅動)和一個網頁遊戲開發技能,僅憑一個初始使用者提示,便獨立工作並消耗了超過700萬個token來建構這款遊戲。在此過程中,它扮演了設計師、遊戲開發者和QA測試員的角色,通過實際玩遊戲來驗證自己的工作以下是用於建立遊戲的、為清晰起見經過總結的初始提示:> 將Voxel Velocity實現為一款使用Three.js的3D體素卡丁車賽車遊戲,只設定一種模式:單人賽(固定3圈,1名人類玩家對7名CPU,所有8條賽道立即解鎖,無進度系統)。建構一個最簡化的賽前流程,僅包含:賽道(8個)、角色(8個)、難度(休閒/標準/困難)、可選的鏡像模式、可選的允許克隆角色,以及開始比賽按鈕。另外需要一個選項菜單和一個賽內暫停菜單(繼續/重新開始/退出)。> 建立一個街機風格的駕駛模型,具有響應靈敏的操控、對輕微撞牆的容錯、以有意義的漂移為主要技巧,以及一個能產生精確增壓等級的漂移充能系統(1級0.7秒,2級1.1秒,3級1.5秒),同時保持基礎速度“快但可讀”,並在寬闊的道路上保持持續的超車機會。> 實現8種道具,單道具容量,具有微妙的位置加權分佈和溫和的效果(最大失控時間≤1.2秒,最大轉向停用≤0.6秒),旨在創造有趣的混亂而非硬控。越野減速效果在增壓期間減少50%。> 定義8個角色的給定屬性和AI傾向,實現CPU難度預設和賽道編寫的賽車/變化樣條線、漂移區和障礙規避,以便AI能利用多車道寬度進行乾淨的超車。> 最後,交付HUD/音訊等基本要素(位置、圈數/最後一圈橫幅、小地圖、道具槽、計時器/分段時間、清晰的音效,以及每條賽道一個音樂循環)。隨後,Codex被從一個包含十個通用提示的列表中隨機抽取提示,進行持續的重新提示,以使其繼續解決問題。其中一個示例提示是:> 你的工作是加入新功能,使遊戲更接近原始設計。首先,玩遊戲並確定與原始設計相比缺少了什麼。然後選擇幾個缺失的功能並實現它們。每實現一個功能後,通過玩遊戲進行徹底測試,確認它能正常工作。如果在玩的過程中發現任何錯誤,也要優先修復它們。在OpenAI內部,團隊已經建構了數百個技能,幫助多個團隊將那些原本難以一致定義的工作放心地委託給Codex——從運行評估、監控訓練過程,到起草文件和報告增長實驗。Codex應用包含了一個技能庫,涵蓋了在OpenAI內部流行的工具和工作流,部分重點skill如下:實現設計:從Figma獲取設計上下文、資產和截圖,並將其轉化為具有1:1視覺保真度的生產級UI程式碼管理項目:在Linear中分類錯誤、跟蹤發佈、管理團隊工作量等,以保持項目推進部署到雲端:讓Codex將你建立的Web應用部署到Cloudflare、Netlify、Render和Vercel等流行的雲託管服務商生成圖像:使用由GPT Image驅動的圖像生成技能,建立和編輯用於網站、UI模型、產品視覺和遊戲資產的圖像使用OpenAI API建構:在建構時參考最新的OpenAI API文件建立文件:一套用於讀取、建立和編輯具有專業格式和佈局的PDF、電子表格和docx檔案的技能。當使用者在應用中建立一個新skill時,該技能可以在任何工作環境中使用:應用內、CLI或IDE擴展中。使用者還可以將技能檢入程式碼倉庫,使其對整個團隊可用。3. 通過自動化委託重複性工作借助Codex應用,使用者還可以設定自動化(Automations),讓Codex按照自動計畫在後台工作。自動化將指令與可選技能相結合,並按使用者定義的時間表運行。當自動化完成時,結果會進入一個審查佇列,以便使用者在需要時可以返回並繼續工作。在OpenAI內部,自動化已被用於處理重複但重要的任務,例如每日問題分類、尋找和總結CI失敗、生成每日發佈簡報、檢查錯誤等。4. 適配個人工作風格的個性開發者在與智能體協作時有不同的偏好。一些人想要一個直截了當、注重執行的夥伴;另一些人則更喜歡溝通性強、更具互動性的交流。Codex現在允許開發者在兩種個性之間進行選擇——一種是簡潔務實的風格,另一種是更健談、更具共情力的風格,兩者在能力上沒有差異。使用者只需在應用、CLI和IDE擴展中使用 /personality 命令即可切換。請參閱文件,瞭解更多關於如何設定和使用 Codex 應用的資訊https://developers.openai.com/codex/app默認安全,可配置設計OpenAI正在整個Codex智能體技術堆疊中整合設計即安全的理念。Codex應用使用與Codex CLI中相同的原生、開源且可配置的系統級沙盒。默認情況下,Codex智能體僅限於編輯其工作所在資料夾或分支中的檔案,並使用快取的Web搜尋。當需要運行網路訪問等需要提升權限的命令時,它會請求許可。使用者可以為項目或團隊配置規則,允許某些命令自動以提升的權限運行。下一步計畫企業和開發者越來越依賴Codex進行端到端開發。自去年12月中旬GPT-5.2-Codex推出以來,Codex的總體使用量翻了一番,在過去一個月裡,有超過一百萬名開發者使用了Codex。OpenAI表示將繼續擴展開發者可以使用Codex的場景和方式,包括在Windows上推出該應用、推動模型能力的前沿,並推出更快的推理速度。在應用內部,團隊將根據真實世界反饋繼續完善多智能體工作流,使其更容易管理平行工作並在智能體之間切換而不丟失上下文。同時,他們也在建構支援基於雲的觸發器的自動化功能,這樣Codex就可以在後台持續運行,而不僅僅是在電腦開著的時候。Codex建立在一個簡單的前提上:一切都由程式碼控制。一個智能體在推理和生成程式碼方面越出色,它在所有形式的技術和知識工作中就越有能力。然而,當今的一個關鍵挑戰是,前沿模型的能力與人們在實踐中輕鬆使用它們之間的差距。Codex旨在通過簡化指導、監督和將模型全部智能應用於實際工作的方式來縮小這一差距。OpenAI表示,他們專注於使Codex成為最好的編碼智能體,這也為它成為一個能夠處理超出編寫程式碼範圍的廣泛知識工作任務的強大智能體奠定了基礎。 (AI寒武紀)
OpenAI Codex桌面版深夜突襲!一人指揮Agent軍團,程式設計師徹底告別996
太帶勁了!搶先Claude 5,OpenAI深夜祭出了一個編碼殺器——Codex。它可以讓一人指揮多Agent平行協作,自帶Skills,編碼從此進入自動化時代。Claude 5的腳步聲越來越近,奧特曼終於坐不住了。就在剛剛,OpenAI毫無預警地拋出「王炸」——Codex正式進化為獨立的桌面App。這不僅僅是一個寫程式碼的窗口,更是一個能同時指揮千軍萬馬(多個Agent)的「全能指揮部」。Codex定位非常明確:要做Agent的「指揮中心」具體來說,Codex可以做到以下幾點:多工平行切換,毫不費力:同時呼叫多個AI智能體開展工作,並通過「工作樹」(worktrees)實現變更隔離,互不干擾;建立並呼叫Skills:將工具和開發規範封裝成可復用的能力;設定自動化流程:通過後台定時工作流,把那些重複性的瑣事統統交給Codex處理。假設想要為相簿裡的照片加入「拖曳」功能,選擇「工作樹」,即可讓AI在同一倉庫中各司其職。Codex的進化令人毛骨悚然,它不僅生成程式碼,還學會了利用程式碼作為「Skills」來操控電腦。比如想要解決項目中的Comment,直接呼叫安裝好的Skills,Codex立刻就把問題破解了。不僅如此,OpenAI僅憑一句話,就讓Codex消耗700萬 token,徒手搓出一個3D版賽車遊戲。這一次,Codex的誕生,並非是新瓶裝舊酒,更不是一次毫無誠意的「套殼」包裝。它標誌著AI程式設計正式從「對話助手」進化為「指揮中心」。奧特曼激動表示,「真是愛了愛了,它比我想像中還要驚喜」!「AI程式設計師就是不會耗盡多巴胺。他們不會感到沮喪,也不會耗盡能量。它們會一直堅持下去,直到解決問題」。OpenAI總裁Greg牆裂推薦——我多年來一直是終端和Emacs的鐵粉,但自從用了Codex之後,再回到終端簡直感覺像穿越回了過去,代差太明顯了。這種感覺,就像是一個專門為開發而生的AI智能體原生介面。OpenAI Codex代表著一種全新的AI Coding範式,極有可能重塑開發者與程式碼互動的邏輯。甚至,Codex還可與Claude Cowork狂飆能力,把雜亂桌面瞬間清理乾淨。目前,Codex正式在macOS上線,Windows版即將推出。OpenAI還放出了「限時福利」,ChatGPT免費使用者和Go版本也可用上Codex,Plus、Pro、Business、Enterprise和Edu計畫的使用者,速率直接翻倍。編碼殺器Codex APP震撼登場一人指揮所有AgentmacOS版Codex應用,是一個功能強大的新介面。它能讓開發者能輕鬆駕馭多個AI智能體,平行處理任務,並與AI協作搞定那些耗時的大活兒。過去一直以來,開發者和AI的關係是「結對程式設計」,你寫一段,它接一段。如今,Codex的出世將徹底改變軟體建構的方式——人類不再與AI緊密結對,直接給AI委派任務,貫穿於軟體設計、建構、發佈和維護的全生命周期。這一轉變的苗頭,實際上從2025年4月發佈Codex以來,便已初見端倪。開發者與AI的協作方式已發生了根本性轉變。現有模型可以端到端地處理複雜的、長流程的任務,開發者也開始在跨項目中指揮多個AI智能體:分派工作、平行跑任務,並放心地把耗時數小時、數天甚至數周的重大項目交給 AI 。核心挑戰已不再是AI能做什麼,而是人們如何大規模地指揮、監督並與它們協作——遺憾的是,現有的IDE和終端工具並非為此而生。這種全新的建構方式,加上模型能力的提升,呼喚著一種全新的互動載體。這正是OpenAI要推出Codex桌面應用的原因,主打「一個AI智能體的指揮中心」。多智能體平行,狂飆程式碼不亂套Codex為與AI智能體多工平行,建構了一個專注的空間。所有AI在按項目組織的獨立線程中運行,確保你無縫地在任務間切換,而不會丟失上下文。你可以在應用裡直接檢查AI的改動,在diff上寫評論,甚至用編輯器打開進行手動調整。它還內建了對Git worktree的支援,所以多個AI可以在同一個倉庫(repo)上開工而互不衝突。每個AI都在你程式碼的隔離副本上工作,讓你能探索不同的開發路徑,而無需操心它們會如何影響你的主程式碼庫。當AI智能體幹活時,可以把改動拉(checkout)到本地,或者讓它繼續推進,完全不動本地的git狀態。應用會自動從Codex CLI和IDE擴展中同步會話歷史和配置,這樣你馬上就能在現有項目中用起來。解鎖Skills外掛,手搓3D賽車遊戲Codex正從一個只會寫程式碼的AI,進化為一個能用程式碼在電腦上真正解決問題的AI。通過Skills(技能),可以輕鬆擴展Codex的能力。今後,Codex不再侷限於程式碼生成,還能處理資訊收集與整合、問題解決、寫作等任務。Skills就像是打包好的指令、資源和指令碼,讓Codex能可靠地連接工具、運行工作流,並按照團隊的習慣完成任務。Codex應用裡有一個專門的介面來建立和管理Skills。你可以明確要求Codex使用某個Skill,或者讓它根據手頭的任務自動呼叫。OpenAI舉了一個例子,曾讓Codex做一個賽車遊戲——要有不同的車手、八張地圖,甚至還有玩家能用空格鍵觸發的道具。利用圖像生成 Skill(由GPT Image驅動)和網頁遊戲開發Skill,Codex僅憑最初的一個使用者提示詞,就獨立工作並消耗了超過700萬個Token,把遊戲做了出來。它身兼數職,既是設計師、遊戲開發者,又是QA測試員,通過實際試玩來驗證成果。6萬Token可以看到,在只消耗了6萬token的這個版本裡,畫面非常粗糙。很窄的賽道中間,塞滿了撞上去會穿模的「障礙物」。技能箱可以吃,也可以發射,但好像沒有什麼效果。最尷尬的是,你會永遠在「第二圈」無限循環下去……80萬Token在80萬token的版本裡,畫面似乎好了一些,賽道也寬敞了不少,更接近大家平時玩的賽車遊戲了。但是箱子吃到的技能好像沒什麼用,發射出去之後,小車們還是各跑各的……而且依舊會在第二圈陷入循環,永遠跑不完。700萬Token最後這個700萬token的版本,畫質明顯好了很多。不僅有清晰的賽道,技能箱也更精緻了。這次,技能箱確實有用了。比賽剛開始,我們就吃了AI扔出的一個大招,沒有閃。於是,喜提倒數第一,不過,比起前兩個陷入無限循環的世界來說,這次至少能完賽了。從跑評測和盯著模型訓練,到起草文件和匯報增長實驗,OpenAI內部建構了數百個Skills,來幫助多個團隊自信地把以前很難統一定義的工作委派給Codex。Codex應用內建了一個Skills庫,涵蓋了OpenAI內部流行的工具和工作流,下面重點介紹幾個。實現設計:從Figma拉取設計上下文、資源和截圖,並將其轉化為視覺上1:1還原的生產級UI程式碼。管理項目:在Linear中處理Bug分類、追蹤發佈、管理團隊工作負載等,推動項目進展。部署到雲端:讓Codex把你做好的Web應用部署到流行的雲主機,如Cloudflare、Netlify、Render和Vercel。生成圖像:使用由GPT Image驅動的圖像生成Skill來建立和編輯圖像,用於網站、UI原型、產品配圖和遊戲素材。使用OpenAI API建構:在使用OpenAI API開發時,參考最新的文件。建立文件:一套用於閱讀、建立和編輯PDF、電子表格和檔案的Skills,排版佈局專業。使用Vercel和圖像生成Skills更新網站使用電子表格Skill建立表格以生成購物清單使用Linear管理你的Issue Backlog當你在應用中建立一個新Skill時,Codex可以在你工作的任何地方使用它:應用內、CLI或IDE擴展中。你也可以把Skills提交到程式碼倉庫,讓整個團隊都能用上。OpenAI分享的Agent Skills:https://github.com/openai/skills一鍵自動化,24h為你打工Codex可以設定Automations(自動化),按計畫在後台自動幹活。Automations將指令與可選的Skills結合,會按照你設定的時間表運行。當Automation完成時,結果會進入審查佇列,可以隨時切回來查看並根據需要繼續後續工作。設定自動化以定期建立新Skills在OpenAI,團隊一直用Automations來處理那些重複但重要的任務,比如每日Issue分類、尋找和總結CI失敗原因、生成每日發佈簡報、檢查Bug等等。雙人格模式,秒切換開發者在與AI合作時口味各不相同。有人喜歡直截了當、只講執行的搭檔;有人則喜歡話多一點、更有互動感的風格。Codex現在允許開發者在兩種個性間選擇——一種是簡潔務實風,另一種是更具對話感和同理心的風格。兩者的能力完全一樣,只為貼合你的喜好。只需在應用、CLI和IDE擴展中輸入/personality命令即可切換。默認安全,按需配置此外,OpenAI還將「設計即安全」(Security by Design)的理念融入了Codex AI智能體棧的方方面面。Codex 應用採用了原生的、開源且可配置的系統級沙箱(Sandboxing),這就跟在Codex CLI裡一樣。默認情況下,Codex AI 智能體只能編輯它當前工作的資料夾或分支裡的檔案,並使用快取的網頁搜尋。如果需要運行像聯網訪問這類需要更高權限的命令,它會先請求你的許可。你可以為項目或團隊配置規則,允許特定命令自動以提升的權限運行。一切皆由程式碼控制如今,企業和開發者正越來越依賴Codex進行端到端開發。自12月中旬發佈GPT-5.2-Codex以來,Codex的總使用量翻了一番,過去一個月裡有超過100萬開發者使用Codex。下一步,團隊繼續擴展Codex使用場景,包括上線Windows版應用、不斷突破模型能力邊界,以及實現更快的推理速度。OpenAI科學家感慨,過去幾周寫的程式碼比過去幾年還要多。而且,還用Codex修復了Prism多個bug和功能更新在應用內部,OpenAI還將根據實際反饋持續打磨多AI智能體工作流,讓管理平行任務和在AI間切換變得更容易,且不丟失上下文。他們還在為Automations開發基於雲端的觸發器支援,這樣Codex就能在後台持續運行——而不僅僅是在你電腦開著的時候。Codex建立在一個簡單的前提之上:一切皆由程式碼控制。一個AI智能體在推理和生成程式碼方面越強,它在各類技術和知識工作中的能力就越強。OpenAI全家桶然而,當今的一個關鍵挑戰在於,前沿模型的能力與人們在實際中輕鬆使用它們之間存在差距。Codex旨在縮小這一差距,讓人們更容易指揮、監督並將OpenAI模型的全部智慧應用到實際工作中。OpenAI致力於將Codex打造成最強的程式設計AI智能體,這也為它成為能處理程式碼之外廣泛知識工作的全能AI奠定了基礎。附錄在製作上面這款賽車遊戲時,Codex使用的初始提示詞如下(總結精煉版):使用Three.js實現Voxel Velocity作為一個3D體素卡丁車賽車遊戲,只有一種模式:單人比賽(總是3圈,1個人類對7個CPU,所有8條賽道立即在這個模式下可用,沒有進度限制)。建構一個最小的賽前流程,僅包括:賽道(8),角色(8),難度(輕鬆/標準/刻薄),可選的鏡像模式,可選的允許克隆,和開始比賽,加上一個選項菜單和一個賽中暫停菜單(恢復/重新開始/退出)。建立一個街機駕駛模型,具有靈敏的操控,寬容的擦牆碰撞,有意義的漂移作為主要技能,以及一個漂移充電系統,產生精確的加速等級(1級0.7秒,2級1.1秒,3級1.5秒),同時保持基準速度「快但可讀」,並且在寬闊的道路上保持持續的超車。實現正好8個道具,單道具容量,微妙的位置加權分佈,和溫和的效果(最大失控≤1.2秒,最大轉向停用≤0.6秒),創造滑稽的混亂而沒有硬眩暈,加上在加速期間減少50%的越野減速。定義8個角色及其給定的統計資料和AI傾向,實現CPU難度預設和賽道編寫的賽車/變化樣條線,漂移區和危險迴避,以便AI使用多車道寬度進行乾淨的超車,並行布HUD/音訊要素(位置,圈數/最後一圈橫幅,小地圖,道具槽,計時器/分段,可讀的音效,和每個賽道一個音樂循環)。隨後,Codex不斷地被從10個通用提示詞的隨機列表中重新提示,以繼續處理這個問題。其中一個提示詞的例子是:你的工作是加入新功能,使遊戲更接近原作。首先,玩遊戲並確定與原作相比缺少了什麼。然後挑選幾個缺失的功能並實現它們。在每個功能之後,徹底測試它,通過玩遊戲並確認它工作正常。如果你在玩的時候注意到任何錯誤,也要優先修復它們。 (新智元)
OpenAI、Anthropic、Google“三國殺”,微軟“悶聲發財”丨a16z最新報告
矽谷知名風投a16z近日發佈了對全球2000強企業中100家公司CIO進行的第三屆年度調查報告,揭示了企業級AI競賽的幾個關鍵話題:市場正加速形成寡頭格局、企業支出繼續加速。報告的核心發現指出,OpenAI目前依然是明確的市場領導者,78%的受訪企業CIO正在使用其技術,但追趕者的勢頭非常兇猛,特別是Anthropic,其企業滲透率在短時間內實現了顯著增長。然而,在企業級應用的實戰中,真正的贏家是微軟。矽谷大佬的企業AI牌桌,圖片由AI生成憑藉Microsoft 365 Copilot和GitHub Copilot等深度嵌入企業工作流程的產品,以及企業客戶對信任、整合和採購便利性的天然偏好,微軟佔據了顯著優勢。與此同時,企業正在用真金白銀持續加大投入。資料顯示,企業在AI大模型上的平均支出在過去兩年快速增長,並預計今年將繼續大幅增加。以下為a16z報告的四大核心發現:01 模型之爭:OpenAI領跑,Anthropic和Google猛追企業AI模型,OpenAI依然是無法繞過的名字。根據調查,高達78%的受訪企業CIO正在生產環境中使用OpenAI的模型。但市場絕非一成不變,變局正在發生,勢頭最猛的挑戰者來自Anthropic。資料顯示,自2025年5月以來,Anthropic的企業滲透率猛增了25%,是增長最快的玩家。現在,44%的企業已在生產中使用其模型,若算上測試環境,這個比例超過了63%。就連企業錢包份額(預算分配)也在講述同樣的故事:OpenAI雖仍佔約56%的多數,但其份額正被Anthropic和GoogleGemini穩步侵蝕。受訪者普遍預計,這一趨勢在2026年還將延續。簡單來說,一個由OpenAI、Anthropic和Google構成的“三國殺”寡頭格局正在形成。這三家公司都在高速增長,共同瓜分著不斷做大的蛋糕,但彼此間的份額爭奪戰已“硝煙瀰漫”。02 應用落地:微軟成為“沉默的贏家”當輿論場熱衷於討論OpenAI與Anthropic的模型對決時,調查資料卻指向了一個被很多人忽視的“意外贏家”——微軟。資料顯示,全球2000強企業的大部分AI應用,依然通過微軟這樣的現有巨頭落地。微軟旗下的產品,如Microsoft 365 Copilot在企業聊天場景領先,GitHub Copilot在企業編碼領域佔據統治地位。企業選擇它們,並非單純因為技術最前沿,而是出於更現實的考量。65%的受訪企業明確表示,他們更傾向於選擇像微軟這樣的現有解決方案,理由高度一致:信任、與現有系統的無縫整合,以及採購流程的簡便。這說明,在企業級市場,“好用、省心、能整合”的實用主義,常常比“最新、最炫”的技術光環更有份量。不過,報告也指出,這並不意味著初創公司沒有機會。企業同樣渴望更快的創新和更靈活的AI原生解決方案,這為挑戰者們留下了突破口。03 “應用末日論”被誇大關於企業是應該自建AI能力,還是直接採購應用,一直爭論不休。一種流行的觀點認為,隨著基礎模型能力增強,第三方應用將失去生存空間。但a16z的調查報告發現,這種“應用末日論”被嚴重誇大了。軟體開發、法律等領域,第三方應用仍佔據絕對優勢,並未失去生存空間,企業採用正持續增長事實恰恰相反,資料顯示企業正持續轉向採購第三方應用,即使在知識管理、工作流自動化這些傳統上傾向於自研的領域,許多企業也計畫從“自己動手”轉向購買成熟的打包方案。背後的邏輯在於,成熟的第三方應用能提供企業自身難以快速建構的深度場景化能力,並能通過智能調度不同模型的優勢,為企業帶來更實際的業務成果。這場“自研”與“採購”的競賽,遠未到終局。04 支出真相:企業掏錢速度比預期快得多最能直接反映AI市場熱度的,莫過於企業掏出的真金白銀。這份調查最核心的發現之一,就是市場的實際增速遠超所有人預期,包括身處其中的企業和供應商自己。具體來看,過去兩年,企業在AI大模型上的平均支出已從約450萬美元飆升至約700萬美元。而他們對今年的預算更為激進,預計將再增長約65%,達到平均約1160萬美元。企業在AI應用上的支出同樣遵循這一軌跡,實際花費遠超預算。企業預計平均支出約390萬美元,但實際上支出了近600萬美元。這些數字表明,企業級AI已不再是“試水”項目,而是進入了規模化、常態化投入的快車道,需求的強度和持久力,證明了這並非曇花一現的熱潮。 (騰訊科技)
暴雷!7000億合作要泡湯!黃仁勳點名批評OpenAI商業策略“缺乏章法”
1月31日消息,據路透社報導,微軟和輝達曾計畫向OpenAI投資高達1000億美元,以幫助其訓練和運行最新的人工智慧模型,但是,輝達內部一些人卻對這筆交易表示懷疑,包括此前的1000億美元(約合人民幣7000億元)的合作在內,輝達與OpenAI的融資與合作計畫已經陷入停滯。報導稱,輝達正在重新考慮與OpenAI的未來合作,包括OpenAI當前數百億美元融資的一部分。輝達CEO黃仁勳近幾個月來私下向業內人士強調,最初的 1000 億美元協議不具約束力,尚未最終敲定。路透社還表示,黃仁勳曾點名批評OpenAI在商業策略上“缺乏章法”。(described as a lack of discipline in OpenAI's business approach)對此事,輝達發言人在發給路透社的電子郵件聲明中表示:“在過去的10年裡,我們一直是OpenAI的首選合作夥伴。我們期待繼續與他們合作。”OpenAI尚未回覆路透社的置評請求。路透社周四報導,微軟、亞馬遜正在洽談向 OpenAI 投資數百億美元,金額可能高達 500 億美元。據此前報導,OpenAI 正在尋求籌集高達 1000 億美元的資金,估值約為8300億美元。近期,輝達持續佈局和投資。去年12月,輝達投資200億美元購買Groq的商業技術授權;12月1日,輝達宣佈與全球EDA巨頭新思科技達成戰略合作,並斥資20億美元(約合人民幣141億元)入股新思科技。今年以來,輝達陸續與英特爾、OpenAI、CoreWeave等公司簽署合作協議。利用其不斷膨脹的財富大舉增加對初創公司的投資。根據PitchBook的資料,輝達在2024年參與了49筆AI公司的融資,比2023年的34筆大幅增加。與前四年的總和相比,這是一個巨大的投資增長。在這四年中,輝達僅參與了38筆AI交易。這些投資不包括其正式的企業風險投資基金NVentures的投資。過去兩年,該基金也大幅增加了投資。PitchBook資料顯示,輝達是過去兩年向AI創企投資最活躍的大型科技公司。與輝達在2023年~2024年參與了83筆交易相比,Alphabet參與了73筆,而微軟參與了40筆。輝達稱,其企業投資的目標是通過支援其認為是“遊戲規則改變者和市場創造者”的初創公司來擴大AI生態系統。結束上海、北京、深圳行之後,黃仁勳近期針對近日熱議的H200晶片是否重啟獲批出貨,他首度正面回應。黃仁勳坦言,目前相關出口許可仍在最終稽核階段,尚未接獲正式核准,也尚未收到任何實質訂單,市場傳出的“首批已獲准出貨”消息並非事實。他強調,相關程序仍在等待政策結果,輝達將保持耐心,並尊重各國法規。針對一旦核准後的供應安排,黃仁勳表示,輝達的產能調度邏輯相當單純,即一切以訂單為優先,只要客戶下單,便會立即與台積電協調產能與排程,並依照既有客戶與新增訂單同步調整。在 CES 2026 的問答環節中,當被問及 H200 晶片在中國市場的競爭力時,黃仁勳直言,輝達若想持續深耕中國市場,就必須及時推出包括 Blackwell、Rubin 在內的下一代更先進晶片產品。“中國湧現出了一大批優秀的科技初創企業,其中不少已經成功上市並展現出強勁的發展勢頭,這充分彰顯了中國科技產業的活力與創新能力。” 黃仁勳評價道,“我始終堅信,中國科技市場未來會持續繁榮發展。輝達想要紮根中國市場、貢獻價值,就必須不斷參與市場競爭,持續推動技術迭代升級。”他強調,輝達將循序漸進地向中國市場投放新一代產品。“這是我一直以來的主張 —— 唯有持續創新,才能在市場競爭中立於不敗之地。”黃仁勳強調,他對來自中國客戶的訂單充滿期待。“最終,一切都會通過訂單資料給出答案。我們不需要聲勢浩大的宣傳,也不需要繁瑣的儀式,訂單就是最直接的訊號。” (智能紀元AGI)