#0程式碼 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#0程式碼

Karpathy深夜炸場：開源630行程式碼“AI研究員”，5分鐘完成一次訓練，單卡就能跑，自我進化

曾幾何時，前沿AI研究還靠著一群"碳水化合物電腦"——他們在吃飯睡覺摸魚的間隙，偶爾通過"組會"儀式用聲波互相吼兩嗓子，就這麼推進著人類的技術邊界。那個年代已經一去不返。如今，研究完全被AI智能體接管，它們成群結隊地在雲端巨型計算叢集裡狂奔。據說程式碼已經迭代到了第10205代，但這數字真偽已無從考證——那些程式碼早已進化為能自我修改的二進制生命，遠遠超出了人類的認知範疇。這個程式碼倉庫，正是這一切故事的起點。——@karpathy，2026年3月以上是Karpathy為新項目撰寫的序言。就在剛剛，AI大神Andrej Karpathy發佈並開源了一個名為autoresearch的新項目，一句話來說Karpathy開源了一個自主AI研究員，它會在你睡覺的時候運行100個實驗，任何人只要擁有一塊GPU，就能在一夜之間運行一個研究實驗室。這個項目的核心想法很簡單：給AI Agent一個雖小但真實的LLM訓練環境，讓它通宵達旦地自主進行實驗研究人類的新工作是編寫一個提示（Prompt），用來指導Agent如何去思考和進行研究。這個Agent會徹夜不休地循環執行以下任務：編輯程式碼、訓練一個小型語言模型（每次精確到五分鐘）、檢查得分、根據結果決定保留還是放棄，整個過程完全無需人工干預。5分鐘是真正的精妙之處。這個設計有兩個好處：首先，無論AI代理如何修改模型大小、批次大小或架構，實驗結果都可以直接比較。其次，這意味著自主研究將在固定的時間預算內，為你的特定平台找到最優的模型。其缺點是，你的運行結果將無法與其他人在不同計算平台上得到的結果進行比較具體來說是這樣的：他將這個項目打包成一個獨立的迷你程式碼庫，方便大家上手體驗。這個項目本質上是nanochat大模型訓練核心的精簡版，被壓縮成一個約630行的單檔案程式碼，並且能在單GPU上運行。整個程式碼庫被刻意設計得非常小巧，核心只有三個檔案：prepare.py - 這個檔案包含固定的常數、一次性的資料準備工作（如下載訓練資料、訓練BPE分詞器）以及執行階段工具（如資料載入器和評估）。此檔案不會被修改。train.py - 這是AI Agent唯一會編輯的檔案。它包含了完整的GPT模型、最佳化器（Muon + AdamW）和訓練循環。從模型架構、超參數、最佳化器到批次大小，一切都可以被AI修改。program.md - 這是為單個AI代理準備的基線指令。人類研究員通過編輯和迭代這個檔案來指導AI。項目的核心機制是，無論你的計算平台性能如何，單次訓練的執行階段長都固定為5分鐘（不包括啟動和編譯時間）。評估指標是val_bpb，即每字節的驗證位元數，這個指標越低越好。由於它與詞彙表大小無關，因此可以公平地比較不同模型架構的變更效果。項目的核心工作流分為兩個部分：人類負責迭代提示詞，即.md檔案。AI智能體則負責迭代訓練程式碼，即.py檔案。Karpathy指出，該項目的目標是設計出能夠無限期、無需任何人工干預，並以最快速度取得研究進展的AI智能體。在實際運行中，智能體在一個Git的特性分支上自主循環工作。每一次完整的模型訓練運行恰好持續5分鐘，在Karpathy分享的圖片中，每一個點都代表一次這樣的訓練。當智能體發現能讓驗證損失更低的更好配置時，比如調整神經網路架構、最佳化器或各項超參數，它就會將這些改進以Git提交的形式累積到訓練指令碼中。通過這種方式，研究人員可以比較不同提示詞或不同智能體帶來的研究進展速度。Karpathy本人形容這個項目是程式碼、科幻和一絲瘋狂的結合體。他還透露，自己仍在nanochat的生產環境中運行一個規模更大的版本。這個加強版智能體正在一個更大的模型上工作，並部署在8塊H100 GPU上。Karpathy表示他會一直讓這個系統持續運行下去。除了PyTorch和少數幾個小包外，沒有其他外部依賴。沒有分佈式訓練，沒有複雜的配置檔案。一塊GPU，一個檔案，一個指標，構成了整個實驗環境。項目地址：https://github.com/karpathy/autoresearch快速上手指南環境要求：一塊輝達GPU（已在H100上測試），Python 3.10+，以及uv包管理器。第一步：安裝uv項目管理器（如果尚未安裝）curl -LsSf https://astral.sh/uv/install.sh | sh第二步：安裝依賴uv sync第三步：下載資料並訓練分詞器（一次性操作，約2分鐘）uv run prepare.py第四步：手動運行一次訓練實驗（約5分鐘）uv run train.py如果以上命令都能正常工作，說明你的環境已經準備就緒，可以進入自主研究模式了。如何運行AI代理你只需在這個程式碼倉庫中啟動你選擇的AI代理，例如Claude或Codex（並停用所有權限），然後可以發出類似這樣的指令：你好，請看一下program.md檔案，我們來啟動一個新的實驗吧！先從設定開始。這個program.md檔案本質上是一種超輕量級的技能指令。平台支援目前，該項目程式碼要求使用單塊輝達GPU。雖然原則上可以支援CPU、MPS等其他平台，但這會增加程式碼的複雜性。Karpathy表示，他目前不確定是否會親自進行這方面的擴展。這個項目主要是一個概念演示，未來會提供多少支援還是未知數。如果需要更廣泛的平台支援，使用者或其AI代理可以參考父項目nanochat，那裡展示了各種解決方案，如Flash Attention 3的備用核心實現、通用裝置支援和自動檢測等。 (AI寒武紀)

OpenClaw創始人：Vibe Coding已經是貶義詞了！Meta軟體工程師爆料：矽谷Agentic Engineering五大支柱！要給Agent寫程式碼，而不是寫給人！

進入2026以來，許多 AI 圈的大神和大佬們都在提一個新概念：“agentic engineering”，智能體工程。先是前 OpenAI 聯合創始人、大神 Karpathy 表示：Agentic Engineering 會是下一個階段。然後 OpenClaw 的創始人 Peter Steinberger 在加入 OpenAI 之後的一次播客中則給出了更為激進的說法：現在提 Vibe Coding，已經是一個侮辱性詞語了。那麼，大佬們為什麼會這樣說？智能體工程究竟都做那些呢？近日，Meta資深工程師John Kim分享了內部的實踐做法。John表示，agentic engineering和vibe coding完全不同，這兩個概念之間的差距，遠比想像中大。有人給ChatGPT 或 Gemini 輸入一個提示詞，複製一段程式碼，部署在本地localhost 上，截圖發圈，說“我做了一個產品”。這種熱情值得鼓勵，但這不是工程。但他並不是在否定這些嘗試。他表示，很多人嘗試用AI程式設計、探索新工具是非常棒的事情。但把“vibe coding”和“AI 程式設計”劃等號，其實是對整個行業的傷害。所有做AI程式設計的人都被歸為“vibe coding”，這並不是一個合理的做法。“工程意味著系統設計、上下文管理、驗證閉環、工具建構，以及長期演進的能力。工程是可持續的，是可復用的，是可積累的。”非常有“α含量”的是，John 還給出了 agentic engineering 的五大支柱：context engineering（上下文工程）、agentic validation（Agentic驗證）、agentic tooling（Agentic工具化）、agentic codebase（Agentic程式碼庫）、compound engineering（複合式工程）。John 在介紹這五大支柱的同時，也爆料了許多前沿公司，如OpenAI、Anthropic、Google、Meta等頂尖工程師的“黃金做法”。下面是更詳細的觀點整理，各位enjoy：上下文工程才是王道！“第二大腦”會成為重要的工程真正決定Agent上限的，並不是模型參數規模，而是它所處的資訊環境。John表示，上下文是最關鍵的一點，輸入垃圾就會輸出垃圾。John表示，在工作中經常會被問道這樣的問題：現在模型的上下文窗口非常大，直接把所有內容都喂進去不就好了？還需要最佳化嗎？”在他看來，即使上下文窗口很大，也不意味著要堆砌資訊，而是精準篩選。因為模型的本質是基於統計機率生成輸出。它會根據你輸入的資料，計算某種機率分佈，生成一個最可能的輸出結果。因此，在做上下文工程時，你必須認真思考：到底需要給模型多少、什麼樣的上下文，才能讓它把事情做好。此外，他還提出了“第二大腦（second brain）”的概念，即那些不直接屬於程式碼本身，但圍繞程式碼存在的領域資訊，比如產品資訊、產品規格、配置決策、領域規則等這些原本存在於工程師腦海裡的知識，應該存放在那裡，才能讓 AI 輕鬆獲取？談到實現方式，以ClockCode 為例，他給出了聯眾解法：一是，可以在本地維護一個.cloud 檔案，把不適合直接寫進程式碼庫的內容放進去，二是，直接提交到程式碼倉庫中。對於提交到程式碼倉庫這一方法，John提到OpenAI 做了一個實驗，並在一篇名為《Harness Engineering》的文章中提及，正在把越來越多的資訊推入程式碼庫，目的是給AI 提供更多上下文。他們實際上是在為 AI 最佳化程式碼庫，而不僅僅是按照人類開發者的習慣去組織程式碼。John認為，“第二大腦”會成為一個重要的工程領域，它早在 RAG 系統中就已經出現，而現在它只是疊加在 agentic engineering 之上的又一層能力結構。Agentic驗證：沒有驗證閉環，輸出只是機率猜測當Agent開始承擔真實工程任務時，生成能力不再是瓶頸，驗證能力才是關鍵。John 明確提到，讓Agent能夠自我驗證，是讓其輸出質量顯著提升的關鍵因素之一。他引用Boris Chen的實踐經驗強調，是否具備驗證機制，是“生成糟糕輸出”和“真正可用且經過驗證的結果”之間的巨大差異。在John看來，驗證可以嵌入多個維度，比如，在後端任務中加入整合測試或單元測試；在前端任務中，讓Agent自己操作 Chrome 瀏覽器、截圖並進行自我驗證；在移動端場景下，甚至可以使用 ADB 來模擬互動，無論採用什麼驗證方式，這將是創造性工程大量湧現的地方。此外，他特別指出，驗證極具挑戰尤其是UI驗證。比如，目前在沒有成熟視訊模型進入Agent解碼循環的情況下，我們如何確認介面互動的真實效果？”截圖是一種方法，但並不完美。領域特定語言（DSL）、模擬器控制邏輯、可觀測資料分析，都是可能的替代路徑。再比如，在日誌層面，Agent在驗證過程中能“觀察”到那些可觀測資料？這些資料能否幫助它完成自我驗證？諸如，OpenAI 開始使用 LogQL，在驗證循環中記錄大量記錄檔，讓Agent在執行過程中攜帶日誌資料，從而判斷資料是否真實正確，而不是只依賴測試結果。“沒有驗證循環，Agnet只是一次性推理工具；有驗證循環，Agent才具備自我修正與質量保證能力。”Agentic工具化：凡是需要人手操作的地方，都是摩擦當Agent執行流程頻繁被打斷時，問題通常不在模型，而在工具層。John引用Peter Steinberger 的觀點，將這種阻礙稱為“摩擦”。他也發出了這樣的疑問：“什麼在阻礙Agent？Agent循環中有那些步驟必須由人類接手？”如果每次遇到邊界條件都需要人工干預，那麼自動化永遠無法形成穩定結構。反觀Agent技術越來越成熟，他也承認，有越來越多的公司開始建構Agentic工具，比如ChatGPT和Gemini引入搜尋功能、深度研究、多模態能力、任務系統等能力，這些本質上都可視為Agentic工具。在John看來，OpenClaw是Agentic工具最成功的案例。他指出，OpenClaw成功的重要原因並非模型能力更強，而是建構了大量 CLI 工具，讓Agent能夠完成原本需要人工處理的任務。“工具化的本質，是將一次性的人類操作轉化為可復用的自動能力。當Agent無法完成任務時，與其手動接管，不如建構一個工具。”凡是需要登錄網站修改配置、手動觸發指令碼、重複執行命令的地方，都意味著潛在的工程機會。Agentic程式碼庫：程式碼的結構，決定了Agent的理解深度你的程式碼庫是否為AI Agent做過最佳化？John給出的回答是：大多數老項目幾乎完全沒有為Agent做過最佳化。目前有多少是死程式碼或糟糕的設計模式？有多少相互競爭的框架共存於其中？他強調道，清理程式碼庫、提升工程質量非常重要。因為每一次“糟糕的上下文”進入你的Agent循環，本質上都在污染Agent。Agent本質上是機率性的，如果你的程式碼中存在奇怪的、相互衝突的模式，就必須主動清除它們。在John看來，OpenAI在這方面做的更好，OpenAI最佳化檔案結構時始終讓AI能夠穩定、持續地生成一致的內容。此外，他們還加入了面向Agent的日誌系統，讓Agent可以讀取日誌資料。建立的文件不僅服務於人類開發者，也服務於Agent，以便Agent能夠掌握領域知識。“OpenAI將所謂的“黃金原則”直接編碼進程式碼倉庫。規則非常明確、風格高度統一，這種一致性是為未來的Agent而設計，而不僅僅是為未來的人類工程師。”John補充道。“我們必須意識到，我們不再只是為下一位工程師寫程式碼，而是在為下一位Agent寫程式碼。”複合式工程：當能力開始疊加John表示，“複合式工程”的思維方式，是團隊成功的關鍵。”何為複合式工程？John做了詳細的拆解：如果把‘上下文工程、Agentic驗證、Agentic工具化、Agentic程式碼庫最佳化’全部結合起來；如果把所有知識都放入程式碼庫，讓Agent能夠看到、共享；如果整個團隊都真正認同 agentic engineering 的理念，就會產生一種新的行為模式：隨著時間推移，不斷複利增長。“簡言之，每當最佳化一個工作流、加入一個新技能；每當建構一個新的 MCP；每當把這些能力納入程式碼庫與共享庫中，這一切都會產生複利效應,這就是複合式工程。”在五大支柱中，John把複合式工程放在了最後，原因在於這些理念必須被真正內化，並在團隊中傳播。同時,他也道出了目前大部分團隊存在的問題：每個人都有自己的工作流，每個人都在本地做最佳化，但團隊內部缺乏統一理念。Jonh認為，未來的團隊應該向OpenAI團隊學習，因為他們集體認同這一理念，共同復合地積累知識、工具和工作流，讓Agent隨著時間推移越來越強大，能夠自我驗證、持續運行，甚至讓程式碼在很大程度上“自我建構”。 (51CTO技術堆疊)

Anthropic 聯創 Jack Clark：AI 開始幹活，企業該改什麼？

AI 將以多快的速度重塑經濟？2026 年 2 月 25 日，Anthropic 聯合創始人 Jack Clark 在接受《紐約時報》採訪時給出了直截了當的回答。他透露，在 Anthropic 內部，絕大多數程式碼已由 AI 完成，工程師的核心職責已從敲擊程式碼轉變為管理 AI。在 Jack Clark 看來，AI 已跨越了“說話者”的階段，正式成為“行動者”。然而，技術演進的速度，已經將企業常規的組織調整節奏遠遠甩在身後。這預示著一個必然的結局：當 AI 深度介入核心業務流程，企業所面臨的挑戰已不再是單純的降本增效，而是底層邏輯的全面重構。第一節｜AI 開始幹活了這種重構具體是什麼樣？Jack Clark 在採訪中分享了 Anthropic 內部正在發生的三件事：1、工程師寫程式碼的方式徹底變了。Jack Clark 自己就體驗過這種變化：他想做一個物種模擬器。如果放在過去，他自己手寫可能要花上幾天。但現在，他只需把想法告訴 Claude Code，十分鐘就跑出了結果，程式碼、環境、依賴包全部自動配置妥當。這是一種全新的工作模式：過去是人寫程式碼，現在是人提需求，AI 負責執行。2、一個人就能帶一支 AI 團隊。在 Anthropic，一位工程師日常工作時，往往會同時開著五六個 Claude。有的負責寫程式碼，有的負責改 bug，有的負責跑測試。一個人同時指揮多個 AI，就像在帶一支小型研發團隊。Jack Clark 明確表示：這就是他們公司現在的工作常態。3、AI 開始主動調整策略。在執行任務時，Claude 甚至會主動說：“這個方法可能不行，我換條路試試。”它能自主判斷問題、調整方向、尋找新的解決路徑。這意味著 AI 已經具備獨立推進任務的能力，而且這個變化來得比預期更快。Anthropic 內部的情況很能說明問題：就連 Claude Code 這個產品本身，也幾乎是 Claude 自己寫的。Jack Clark 提到，如果進展順利，到今年（2026）年底由 AI 完成的程式碼比例可能接近 99%。這三個變化，加上這組資料，指向了一個清晰的方向：AI 現在能獨立完成任務，能與其他 AI 協同，還能在執行中自我調整。當幹活的“人”變了，企業原有的組織架構和運轉邏輯必然要重構。第二節｜分工方式要重新劃線“AI 帶來的衝擊，不會直接從裁員開始，而是從重新分配工作開始。”這是 Jack Clark 在採訪裡反覆強調的一點。相比裁員，這聽起來可能沒那麼可怕，但這要求企業重新設計整套分工方式。1、初級工作正在快速消失過去企業的分工是：新人做基礎任務，中層推進項目，高層定方向。現在這套體系的基礎開始動搖。那些原本交給新人的瑣碎工作，交給 AI 之後完成得更快、出錯也更少。Anthropic CEO Dario 曾預測，AI 可能在幾年內取代一半的初級白領崗位。Jack Clark 自己的判斷更謹慎一些：三年後大學畢業生的失業率會更高，但不會高太多。具體多少崗位會消失，目前還說不清楚，但趨勢已經很明確。2、能給方向的人開始變得稀缺這帶來第二層變化：企業越來越看重一個人能不能把目標定義清楚，而不是只看執行能力。Clark 在採訪中說，真正有價值的人，能把任務說清楚，讓 AI 知道該做什麼。這種能力差異正在企業內部形成新的分化：會指揮 AI 幹活的人變得稀缺，而只會完成安排好的任務的人，發展空間越來越小。3、成長路徑正在改變年輕人該如何成為那種稀缺的人？傳統的路徑是從基礎任務開始積累經驗，但現在這些任務正在消失。Clark 觀察到，在 Anthropic 內部，成長最快的年輕人，正是那些從入行起就習慣與 AI 一起工作的人。他們從一開始就學會指揮 AI、與 AI 配合，在 AI 的輔助下完成更複雜的工作。企業未來的核心人才，可能就是最早掌握這種協作能力的年輕人。這場變革已經開始了。企業要不要裁員，那都是後面的事，當下更緊迫的是重新劃好人與 AI 的分工邊界。第三節｜組織運轉要跟上 AI 節奏當人和 AI 的分工邊界重新劃定後，下一個問題是：在這個新環境下，組織本身該怎麼運轉？1、加速的代價是失控Clark 發現，當工程團隊把大量執行環節交給 AI 後，最先改變的不是產能，是管理層對工作的掌握度。過去層層傳遞的流程，現在被 AI 自動完成，許多中間步驟不再需要人工確認。流程跑得更快了，但人能掌握的部分反而變少了。被問到是否擔心技術債累積、網路安全漏洞、對程式碼理解下降時，Clark 回答得很直接：擔心，而且整個社會都得面對這個問題。AI 寫的程式碼越多，工程師能直接掌握的就越少。過去企業靠繁瑣的流程保證質量，每個環節都有人把關，出問題能及時發現。但現在 AI 的執行速度太快，這種人工檢查的方式已經跟不上了。Clark 說，企業必須重新設計流程：讓 AI 把關鍵決策記錄下來，讓人隨時能看到 AI 在做什麼、為什麼這麼做。否則，組織會完全失去對自身流程的掌控。2、管理方式必須改變以前管理者的日常工作是什麼？協調團隊開會、跟進每個人的任務進度、催促延期的項目、整理匯報材料。這些事情佔據了管理者大部分時間。現在這些 AI 都能自動完成。它會自動提醒該開會了、自動發現某個任務卡住了、自動修正小問題，甚至自動生成進展報告發給所有人。那管理者還要做什麼？Clark 認為變成了三件事：一，確定優先順序。當 AI 提出五個方案時，那個最重要？這需要人的判斷。二，講清目的。AI 只能根據指令執行，但為什麼要做這件事、要達成什麼效果，必須人來說清楚。三，在關鍵節點做出取捨。比如產品該按時上線還是再打磨一周？這種權衡 AI 做不了。Clark 舉了個例子：有團隊專門訓練了一個監督 AI，它的工作就是盯著其他 AI 的輸出，檢查有沒有明顯錯誤。這樣一來，人不用再盯著每一行程式碼、每一個步驟，只需要在幾個關鍵決策點介入就夠了。組織的運轉邏輯變了：以前是人盯人，現在是人盯方向、AI 盯過程。3、真正的挑戰是速度差組織轉型真正難的地方在於速度跟不上。AI 的現在迭代是以“周”為單位的，一個新功能可能兩周就上線了。而傳統企業的組織架構調整往往是以“季度”甚至“年”為單位，改個流程、調個部門，半年過去了。這裡有三種速度在拉開差距：個人適應的速度：員工需要時間學習怎麼用 AI，怎麼和 AI 協作，這個過程可能要幾個月。企業和政策響應的速度：企業要開會討論、制定規則、調整考核，政府要研究、立法、監管，這個過程往往要一年甚至更久。AI 進步的速度：模型每幾個月就升級一次，能力不斷增強。過去的技術變革，時間往往站在人類這邊，給了緩衝期。蒸汽機出現後，工廠有幾十年時間慢慢適應。但這一次不一樣，等企業調整好組織架構，AI 可能已經又進化了好幾代，速度差只會讓衝擊變得更嚴重。這個速度差還在擴大，因為 AI 進化的速度在不斷加快。Clark 透露，Anthropic 正在監測“AI 開發 AI”的比例。什麼意思？就是 AI 不再只是幫人類寫程式碼，而是開始寫改進自己的程式碼。一旦 AI 開始大規模這麼做，它的迭代速度就不再受人類開發速度的限制了，會進入一個自我加速的循環。正因為看到了這種技術優勢，Anthropic 撤銷了 OpenAI 使用 Claude Code 的權限，不想讓競爭對手也快起來。速度，已經成為 AI 時代最關鍵的競爭力。這就是為什麼企業必須重構組織架構：不重構，就會永遠慢一拍。而 AI 的發展，只會越來越快。結語｜重新擺清人和 AI 的位置AI 已經開始幹活。在 Anthropic 內部，絕大多數程式碼已經由 AI 完成，如果一切順利，年底這個比例可能接近 99%。這帶來三層變化：第一，AI 正在接管執行層的工作。第二，企業的分工方式要重新劃線。第三，組織的運作節奏要跟上 AI 的速度。AI 的進化速度超過了企業的適應速度。那些會指揮 AI、能做出正確判斷的團隊，會佔據優勢。而堅持舊流程、舊分工的組織，會越來越被動。企業該改什麼？只有一件事：重新定義人該做什麼，AI 該做什麼。 (AI深度研究員)

瑞芯微，栽了!

瑞芯微栽了，栽在了最容易被忽視的開源合規上。作為國內知名晶片設計企業，近日它被推上了行業風口浪尖。其相關程式碼庫被GitHub平台緊急凍結，核心原因是涉嫌侵犯開放原始碼專案FFmpeg的版權。這起事件，再次把開放原始碼軟體合規問題，拉回了所有人的視線。據悉，瑞芯微的違規操作，並不複雜卻觸碰了開源協議的紅線。在自身產品開發過程中，它使用了FFmpeg的核心元件libavcodec程式碼。但瑞芯微沒有遵守開源協議，反而做了兩件致命操作。一是擅自刪除了原作者的資訊及版權聲明，抹去了程式碼的來源痕跡。二是將原程式碼的LGPL許可證，私自改成了Apache協議，篡改了授權規則。很多人可能不清楚這兩種協議的區別，這裡簡單說清楚。LGPL協議雖允許商業使用，卻有明確的底線要求。必須保留原作者版權聲明、提供原始碼，且要保持許可證的一致性，不能隨意更改。瑞芯微的一系列操作，顯然完全違反了這些核心規定。其實這起侵權行為，早在2024年初就被開發者發現了。事件曝光後，瑞芯微工程師HermanChen曾公開道歉，承諾會盡快整改。可令人失望的是，這份道歉更像是權宜之計，沒有任何實質性動作。整整近兩年時間，瑞芯微始終未落實整改承諾，敷衍了事。忍無可忍之下，FFmpeg項目方採取了法律手段。他們依據《數位千禧年著作權法案案》（DMCA），向GitHub平台發起了正式投訴。GitHub核實後，迅速作出反應，凍結了瑞芯微的相關項目程式碼庫。截至目前，瑞芯微暫未就程式碼庫凍結事件，發佈新的回應或整改方案。作為A股上市的晶片設計企業，瑞芯微此次侵權風波，影響不容小覷。其最新股價顯示，近期雖有小幅波動，但長期來看，合規風險或進一步影響市場信心。更值得警惕的是，瑞芯微的案例，從來不是個例。有資料統計，當前97%的程式碼庫都包含開源元件，開源已成為科技研發的常態。但與之對應的是，63%的項目都存在開源許可證衝突問題。這背後，是很多企業和開發者對開源協議的認知盲區。業內專家直言，不少人存在一個致命誤解，認為開放原始碼就是“免費可用、隨意修改”。殊不知，開源不等於無版權，每一份開放原始碼，都有明確的協議約束。GPL、MIT、Apache、LGPL等不同開源許可證，各自有不同的使用規則。一旦違反，就可能面臨版權投訴、程式碼凍結，甚至巨額賠償的風險。中國信通院的調研也顯示，超過六成企業缺乏嚴格的開源合規管理流程。很多企業允許開發人員隨意引入開源元件，忽視協議約束，埋下合規隱患。這些隱患，隨時可能爆發，成為企業發展的“定時炸彈”。對科技企業而言，尤其是晶片設計這類技術密集型行業，開源是助力，而非捷徑。合理使用開放原始碼，能節省研發成本、加快產品迭代速度。但前提是尊重智慧財產權，嚴格遵守開源協議，守住合規底線。 (1 ic芯網)

一夜變天？Claude出手，網路安全股集體「血洗」！全球百億市值已蒸發

【新智元導讀】剛剛，Anthropic發佈程式碼安全工具Claude Code Security，直接讓安全股一夜蒸發百億市值！網路安全龍頭CrowdStrike的股價直接原地跌超6.5%，市場陷入極度恐慌：傳統安全工具，從此全涼了？過年期間，AI圈接連不斷的地震還沒停。昨天的Gemini 3.1 Pro剛剛亮相，緊接著就又來新炸彈了——剛剛，Anthropic發佈了一個程式碼安全工具Claude Code Security，能高效掃描程式碼庫漏洞並自動生成針對性補丁，遠超傳統工具。聽起來，是不是只是一條平平無奇的技術更新？結果，消息一出，美股網路安全類股立刻集體跳水。CrowdStrike、Cloudflare、Okta等安全股瞬間暴跌超5%，總市值蒸發逾100億美元，一夜就蒸發了百億市值！仔細看，網路安全龍頭CrowdStrike一度暴跌6.5%，Cloudflare重挫超6%，SailPoint大跌6.8%，Okta下挫5.7%，Zscaler跌3.5%，Global X網路安全ETF下跌3.8%，年內累計跌幅擴大至14%一條AI功能更新，直接讓一個千億級的行業類股原地失血。這不是波動，這是恐慌！外媒火速發文：網路安全公司的股價周五暴跌，原因僅僅是因為，Anthropic在Claude新模型中引入一項安全功能安全股全線飄紅，巨頭市值縮水百億Anthropic新殺器一發佈，網路安全市場就嘗到了血腥。網路安全龍頭CrowdStrike的股價跌超6.5%，Cloudflare和Okta等隨之跟跌，總市值一夜蒸發超100億美元。全球投資者陷入大恐慌：AI將直接蠶食專業安全廠商的市場份額！Cybersecurity ETF下跌了4.9%，收盤時達到自2023年11月以來的最低點。就在2026開年的這幾周，市場的焦慮情緒不斷升溫。iShares擴展科技軟體ETF今年已下跌超過23%，有望創下自2008年金融危機以來最大季度跌幅！而且諷刺的是，Cloudflare一度被視為Anthropic崛起的受益者代表；今年1月底，一款基於Claude模型的開源AI助手採用率上升後，其股價還曾大幅上漲。然而，市場瞬息萬變。要知道，現在YC裡的創業公司有一半是做安全方向的，Anthropic這個新工具一發佈，他們還有活路嗎？每當Claude出一個新版本，SaaS企業主的內心都是這樣的：A正I以摧枯拉朽之勢，直接把我們原地掀翻！Claude變身最強白帽駭客為什麼Claude Code Security會造成全球安全股的崩塌？原因就在於，它不僅是一個工具，更是對傳統安全防禦體系的一次徹底顛覆。就在安全團隊還在對著堆積如山的漏洞工單發愁時，Claude已經化身「最強白帽駭客」，拿著剛剛發佈的Claude Opus 4.6，一頭紮進開放原始碼庫中。結果讓人驚掉下巴：它一口氣揪出了500多個潛伏了十幾年的史詩級Bug！要知道，這些漏洞可是經歷過無數個人類頂級專家逐行審查，依然大搖大擺活在程式碼裡的「漏網之魚」。降維打擊，傳統掃描工具大翻車？一直以來，安全圈的痛點極其刺骨：漏洞永遠修不完，安全專家永遠不夠用。大家都在用傳統的靜態分析工具（SAST），但這些工具往往基於死板的規則匹配。找找硬編碼的密碼還行，一旦遇到複雜的業務邏輯缺陷或是越權漏洞，直接抓瞎。而Claude Code Security的出現，徹底改變了遊戲規則。它不搞死板的模式匹配，而是像一個擁有十年經驗的人類安全大牛一樣，真正去「讀懂」和「推演」你的程式碼！它能深度理解各個元件之間是如何相愛相殺的，順藤摸瓜追蹤資料在應用中的流轉路徑。規則掃描工具看不到的複雜漏洞，在它那如同開掛般的邏輯推理面前，根本無處遁形。絕不瞎改！自我驗證防幻覺AI寫程式碼大家都怕幻覺，那AI查漏洞修Bug呢？Anthropic這次穩得可怕。為了過濾掉讓人頭疼的「假陽性」（誤報），每一個被揪出來的漏洞，都要經歷一場極其嚴苛的「內部多階段驗證」。Claude會強迫自己扮演紅藍雙方，拚命地證明或推翻自己的發現。最終脫穎而出的那些真·高危漏洞，會被推送到安全儀表盤上。不僅自動生成帶評級的修復補丁，還附贈一個詳細的「信心指數」。最關鍵的是，Claude秉承「只建議，不代勞」的克制。找出問題、提供解法，但最終按下合併按鈕的，永遠是人類開發者。戰績赫赫，紅隊親測這套系統的強大，並非一蹴而就。在過去的一年多里，Anthropic的Frontier Red Team（前沿紅隊）簡直把Claude按在地上瘋狂高強度拉練。不僅把它丟進CTF安全大賽上去跟人類駭客卷，甚至還和太平洋西北國家實驗室合作，用AI去防禦國家關鍵基礎設施。實戰出真知，正是這種「地獄級」特訓，才讓本月早些時候發佈的Claude Opus 4.6擁有了如此恐怖的防禦力。那500多個被連根拔起的隱藏漏洞，就是最好的軍功章。連Anthropic自己都承認：「我們日常也用Claude來審查自家程式碼，效果好得驚人！」AI攻防戰：核威懾級軍備競賽打響毫無疑問，這是一個極具歷史意義的轉折點。在不久的將來，世界上絕大部分的程式碼都將被AI一遍遍地掃描。駭客們必定會瘋狂使用AI來大規模挖掘可利用的薄弱環節。但正所謂魔高一尺道高一丈，動作更快的防守團隊，完全可以用同款甚至更強的AI魔法，把漏洞扼殺在搖籃裡。目前，Claude Code Security已經向企業和團隊（Enterprise and Team）客戶開放了限量研究預覽版！而開放原始碼專案的維護者們，更享受「一路綠燈」的加急通道。誰能最先掌握AI安全這張底牌，誰就能在這場算力與智力的生死角逐中，立於不敗之地。AI吞噬中間層，資本市場最怕的來了！過去兩年，AI寫程式碼，已經讓程式設計師們神經緊繃了。但大家還在安慰自己：AI只是能寫程式碼、補bug，安全這種高度專業化的領域，它不可能替代人類。結果，現在，Claude直接開始動手掃漏洞了。這就意味著，AI不再是生成內容，而是進入企業安全的核心工作流，它直接瞄準了企業級安全服務的天價利潤池！資本市場最怕的是什麼？不是技術，而是定價權被動搖。網路安全公司之所以長期擁有高估值，就是因為攻防對抗複雜，安全專家稀缺，這就讓他們的服務高度專業化。結果，現在Claude Code Security一出，一個AI模型就能完成80%的漏洞掃描和修復建議，企業只需要少量安全工程師就夠了。那麼，企業還需要支付高昂的訂閱費用給安全廠商嗎？這也就是為什麼，Claude現在還不能替代CrowdStrike，就已經引起了市場的拋售。當投資人開口問「五年後還需要這麼多安全公司嗎」，股市就開始崩塌！Anthropic用Claude引發一兆美元拋售的情況，彷彿還在昨天回顧從去年底Claude Code引發的一系列核爆級事件，就可以發現：這一類AI革命最殘酷的地方在於，它優先吞噬的是中間層。一旦模型精準率足夠高，SaaS溢價會被壓縮，服務費會被重估，估值邏輯會被打穿！更可怕的是，別忘了，Anthropic說了，這項功能還只是「limited research preview」，還沒全面開放，也沒有商業化規模驗證。但是股價已經一路暴跌，這說明，當前AI的進化速度，已經遠遠快於傳統軟體公司的產品迭代速度。這是一個危險的訊號彈——接下來，恐怕還要發生更恐怖的事。 (新智元)

OpenClaw 帶來的「非線性狂飆」，程式碼正在成為新世界的基礎設施

2026 年初，AI 圈瀰漫著一種奇異的撕裂感。最近 Founder Park 密集組織了兩場 OpenClaw 閉門交流。在現場，我能明顯感覺到創業者和開發者那種複雜的情緒：興奮又焦慮，確定又迷茫。Claude Code 的負責人 Boris Cherny 在 X 上坦言，已經兩個月沒親手寫過、甚至改過一行程式碼了。Andrej Karpathy 也公開了他的工作流變化：從 80% 手寫程式碼，迅速倒置為 80% 由 AI 生成。他在 2023 年 1 月的那條置頂推文也成了預言：「最熱門的新程式語言是英語」。沒人再手寫程式碼了。與此同時，作為「容器」的軟體，也正在變形。一邊是 AI 的瘋狂溢出，OpenClaw 在 GitHub 狂攬 18.7 萬星標，還在飆升；Anthropic 發佈了 11 個專業外掛，將 Claude Cowork 直接升級為自主執行的「數字員工」。另一邊是舊模式的崩塌，SaaS 遭遇「SaaSpocalypse」（SaaS 末日），軟體股數千億美元市值說沒就沒。這一切變化太快，快到我們甚至來不及形成穩定的觀點。但有一點是確定的：我們正處在一個巨大的「範式斷裂」時刻。01 人類與程式碼，是一部漫長的「馴化史」我曾經多次走訪矽谷的電腦博物館，認真探尋了下我們人類與程式碼的關係，發現這其實是一部漫長的「馴化史」，大致可以分為三個階段，但這三個階段的底層邏輯，其實是同一個：提升「人」的生產力。第一階段，是「馴化期」（1950s - 1990s）這個時候，我們像是鐵匠，把程式碼鍛造成一個個「標準零件」。無論是 FORTRAN 的數學庫，還是 Windows 的動態連結庫（DLL），核心思想都是「復用」。我們把通用的邏輯封裝起來，下次用的時候直接拿來裝配，不用再費力重鑄。這時的程式碼，是一個聽話、可靠、毫無意外的工具。人類寫一行，機器執行一行。第二階段，是「培育期」（1990s - 2020s）隨著更智能的整合開發環境（IDE）成熟普及，程式碼開始變得有點「靈氣」了。它不再只是被動地等待指令，而是會「猜」你想做什麼，幫你自動補全、提示錯誤。人類依然是主導者，但程式碼不再是完全被動的字元——它在學習、在適應、在與開發者形成默契的對話。這是「夥伴化」的萌芽。第三階段，是「爆發期」（2020s - 2025）以 GitHub Copilot 為代表的大模型工具，把這種默契推向了極致。它不再是幫你補全一行程式碼，而是能寫出整個函數甚至整個模組。它像一個能力超強的「副駕駛」，你只要告訴它目的地，它就能幫你處理大部分常規操作。我們與它的關係，變成了飛行員與智能副駕。從「工具」到「夥伴」再到「副駕」，這條路走了七十年。它看起來在不斷進化，但背後有一個從未改變的根本前提：這一切都是在放大「人」的生產力。無論程式碼多智能，它始終是我們思想的延伸，是我們意志的執行者。方向盤始終握在我們手裡。我們是那個生產者，程式碼是那個最高效的生產工具。而在近期發生的一切，不再是關於如何讓副駕更聰明，而是關於副駕突然對你說：「你到後座去吧，接下來我來開。」02 過去一年裡，程式碼開始「非線性狂飆」真正的轉折點，發生在過去這短短的一年多時間裡。程式碼的進化突然從線性增長，變成了一場「非線性」的溢出。當程式碼開始擁有我們無法完全預期的「自主性」時，它就像一種被注入系統的新能量，開始不可阻擋地溢出我們為它設定的所有「容器」。這個溢出，導致了一環扣一環的連鎖反應。首先，撐破了「人機協作」的框架，生產關係被重構。當 Claude Code 團隊可以做到兩個月內 100% 由 AI 完成開發時，意味著程式碼的自主性已經強大到可以「承包」整個生產環節。一個深刻的轉變發生了：「執行」這個環節，正在迅速地商品化。過去，一個優秀程式設計師的價值，很大程度上體現在他能用多麼優雅和高效的方式，把一個模糊的想法，翻譯成精確的、機器可以穩定執行的程式碼。這個「翻譯」過程，就是「執行」，它本身是有價值的。但現在，這個價值正在被 AI 稀釋。我們不再需要手把手地教機器「怎麼做」，而只需要清晰地定義「做什麼」和「為什麼做」。這不僅僅是「生產者」到「質檢員」的角色變化，這是一種「認知價值」的遷移。人類的價值，正被迫從「如何實現」這個技術層面，上移到「意圖定義」和「品味判斷」這兩個更抽象的層面。什麼是好的產品？什麼是值得解決的問題？AI 給出的十個方案裡，那一個才符合我們對美、效率和人性的最終追求？這是一種新的認知分工：AI 負責不知疲倦地「執行」，而我們，必須成為更優秀的「思考者」和「決策者」。那個曾經由「執行力」定義的價值容器，已經被撐破了。其次，撐破了「生產協同」的容器，程式碼產能正在瘋狂增殖。當程式碼的自主性足以「承包」執行環節後，它必然不滿足於只待在我們的編輯器裡。它會溢出，去重構整個數字世界的形態。今年爆火的 OpenClaw 就是一個訊號。它本質上已經不是一個「程式設計工具」了，而是一個能接管你整個作業系統的「AI 智能體框架」，是一支可以被賦予任務、在你的數字世界裡主動穿行、調動資源來完成目標的「小分隊」。讓 OpenClaw 幫你整理檔案，這只是表層任務。更「嚇人」的是，如果它在整理中發現一種無法處理的檔案格式，它可能不會立刻放棄選擇報錯，而是會自己去搜尋推斷、尋找解法、調度工具，甚至創造工具。並且，OpenClaw 還具備自主迭代工具本身的能力。這就是更本質的變化：程式碼的生產，正在從一種由人類規劃的、目標明確的「建造行為」，變成一種由 AI 驅動的、為了達成被給定的目標而進行的「生態演化」。開放原始碼專案裡開始湧入大量 AI 貢獻的程式碼，其數量和速度，都遠超人類貢獻者。這就給人類帶來了一個前所未遇的、更棘手的問題：當程式碼的生產力被拉滿甚至溢出，我們該如何管理和協同？當一個大型項目中，有無數個 AI Agent 在同時提交程式碼，我們如何保證它們的目標是一致的？如何進行程式碼審查？如何整合這些甚至連我們都未曾規劃過的、由 AI 即興創造出來的「新功能」？所以，這裡被撐破的，不僅僅是「應用」的邊界。更是我們過去對於「生產」和「協同」的認知邊界。它把生產力推到了一個我們自己都不知道該如何運用的境地。03 從工具到土壤：程式碼正在成為新世界的基礎設施當我們意識到，人的價值正在從「執行」向「定義」遷移，而程式碼產能正在瘋狂增殖時，一幅全新的圖景正在展開。程式碼，以及承載程式碼的軟體，也在經歷一次深刻的「質變」。第一層質變，軟體正在從「為人服務」的應用層，下沉為「為 AI 服務」的基礎設施層。軟體股的暴跌，以及「SaaSpocalypse」（SaaS 末日）概念的出現，就是一個例證。過去，我們使用軟體的方式是打開一個圖形介面（UI），去點選、輸入、操作。軟體的價值很大程度上體現在它的使用者體驗（UX）上。但未來，你的主要互動對像是 AI 智能體。你不會再打開 Excel，而是直接對 AI 說「分析一下上個季度的銷售資料，做成圖表」；你也不會再登錄 CRM，AI 會自動幫你同步所有客戶資訊。軟體的終端使用者會從「人」變成「AI」。這意味著，傳統軟體的「殼」（UI/UX）價值在迅速降低，而它內在的「核」（API 介面）變得至關重要。軟體本身並沒有消失，而是變成了被 AI 呼叫的基礎能力，像水和電一樣，融入了整個智能生態的底層。這是 SaaS 公司商業模式面臨的根本性挑戰。第二層質變，程式碼正在從「人類智慧的產物」，變成「AI 的母語」，人類放手建造的細節工作。過去，程式碼是人類與機器溝通的中間語言。但現在，當 Anthropic 的 Opus 4.6 擁有 1M 上下文和自適應思考能力，能對整個程式碼庫保持長程規劃；OpenAI 的 GPT-5.3-Codex「可以在幾天時間內從零開始建構功能高度複雜的遊戲和應用程式」。這些模型不再需要人類把需求拆成逐行指令，它們直接用程式碼思考、用程式碼協作、用程式碼驗證彼此的產出。在這個過程中，人類正在從「施工現場」退到「設計室」。我們只負責提出目標（「我想要一個什麼樣的應用」），而不再關心具體的實現過程。這是自電腦發明以來，人類第一次在數字世界裡，主動退出了數字世界的施工環節。第三層質變，人的價值正在從「技術實現」，遷移到「價值定義」。當 AI 包攬了從程式碼生產、測試、部署，到軟體呼叫、維運監控的全流程，人類還剩下什麼？不只是程式設計師的職業轉型，而是關乎未來世界裡，人類作為一個物種的核心競爭力。我們不再是「建築工人」，甚至不只是「建築師」，我們必須成為那個提出「我們為什麼要建一座操場，而不是一座雕像？」的「定義者」。我們的價值，在於我們的意圖、我們的審美、我們的道德判斷，以及我們定義一個值得追求的目標的能力。04 我們被自己的造物，拽著向前跑把這一切串起來，我能感受到一種強烈的反差感。我們花了七十年，一步步地把程式碼這個工具打磨得越來越先進，期待著用它去解決我們提出的問題。但今天，我們親手創造的這個技術環境，這個生產力被無限放大的新現實，正在反過來，瘋狂地拉扯著我們向前跑。過去，我們向技術要答案；現在，是技術在向我們提問。這不再是一個關於「工具」的故事，這是一個關於「關係」的故事。我們與我們創造物之間的關係，正在發生倒置。我們不再是那個唯一推著石頭上山的人，石頭自己開始滾動，甚至反過來催促我們去為它尋找新的、更陡峭的山坡。這其中有焦慮，有失控感，但更多的，是一種前所未有的機遇。因為商業的本質，最終還是關於人。而這個新環境，正在以前所未有的力量，迫使我們去思考更本質的問題，去成為更純粹的「價值定義者」。程式設計已死，程式設計萬歲。作為「打字員」的程式設計師會消逝，但會誕生更多作為「定義者」的人類。 (Founder Park)

沒寫一行程式碼，38歲文科生用AI做出爆款App！這4個“外行”的逆襲，藏著普通人最大的機會

就在跨年之際，馬斯克的“舊世界1000天倒計時”宣言，又給AI恐慌狠狠地加了一把柴。巨頭和寓言，離普通人太遠，也只是AI時代水面上的冰山一角。我們關注的是普通人能夠複製的成功經驗。最近，我們找到了4位“吃螃蟹的人”，他們的共同點是，不太專業，甚至都是文科生。但是，都抓住了AI帶來的時代紅利。AI的爆發對王博源來說，更多的不是“被替代”的焦慮，而是終於等到了能夠讓他“創造宇宙”工具的興奮。在2025年最後一天，這個完全沒有IT背景的38歲前媒體記者，自己用AI做出來的杜比全景聲音樂APP“全景新聲”上線App Store的TestFlight 。根本不會畫畫的連續創業者，用AI創作了品質相當不錯的職場諷刺短片，創造出了深受網友認可的“牛馬”IP。還有成熟的商業廣告導演，借助AI，讓作品更具特色，成為AI創業公司喜歡的廣告合作商。但他也會在深夜悲傷，因為他引以為傲的、幾十年訓練出來的創作風格，“在未來的AI時代裡面可能只是一顆種子。”他們有著相似的經歷，那就是主動去瞭解，把AI融入自己的日常生活或者工作環境。於是一些東西被重塑了。這些案例或許能夠給我們啟發。在面對AI時，籠統的恐慌或者無視，是沒有建設意義的。不管是宏觀，還是圍觀層面的個人，我們都可以想辦法通過AI而受益。38歲文科生用AI寫了11萬行程式碼王博源今年38歲了。英文專業畢業後，他十多年都在做科技報導，跟文字打交道。但十幾歲就拆過電腦的王博源，冥冥中一直在等一個機會，一個不被程式語言束縛、自由“創造”的機會。他終於等到了。王博源是一個狂熱的杜比全景聲音樂愛好者。當Apple Music在2021年推出杜比全景聲功能時，128個聲道的聽覺震撼，讓他第一次發現聽過無數遍的林肯公園《混合理論》，竟然有那麼多新細節。但Apple Music無法批次查詢杜比格式的音樂，於是他用Notion做了一個華語杜比全景聲音樂資料庫網頁，手動錄入了足足7333首曲目。這樣王博源在音樂發燒友圈子逐漸有了認知度。但網頁功能有限，無法搜尋，且隨著曲庫的補充越來越卡頓。他諮詢碼農好友，把這個網頁做成一個APP有沒有戲。朋友善意地勸阻他，“最好想明白再做”。但是AI是這麼鼓勵他的——“這個東西可以實現！”然後建議他一步一步從註冊伺服器，到怎麼去部署，到下載AI程式設計開發工具。一開始他把Cursor等幾個工具交替使用，但Cursor太貴了，逐漸地CodeBuddy成為主要平台。王博源就這樣闖進了vibe coding的新世界。開局反而是更容易的。一開始跟AI聊需求，AI會大包大攬，提供一個特別完整的東西。但跑起來王博源才發現，不是出錯，就是不符合想像。他就在這個程式碼地基上，翻看AI的深度思考記錄，用跟AI聊天的方式最佳化程式碼——搜尋結果要全部顯示、顯示圖示要對齊、自動抓取資料……AI有時像一個只懂悶頭幹活的打工人。AI修改程式碼，時不時會把原本穩定的功能，連帶給改掉了。最讓他挫敗的場景是，錯誤資訊一直存在，他不斷跟AI聊，它總是告訴你改好了，但問題依然在，“非常崩潰”。但當王博源連續“命中”時——用自然語言提需求，AI修改，運行成功，他感覺自己“進入一種心流模式，非常爽！有一種錯覺，好像擁有了超能力。”就這樣程式設計了10天，“全景新聲”小程序在2025年6月9日上線。雖然功能很簡單，主要是資料檢索和展示，但體驗流暢，互動完整。半年下來，小程序在業內圈子有不少反饋。有人用自己廠牌介面的截圖去給投資人看，有混音師用全景新聲資料頁面去提交月報。還有人在小紅書群裡評價說，“匠人作品，太難得了，對杜比真的是如數家珍”，讓王博源感動不已。朋友誇他，“有程式設計師思維了”。王博源感慨，“我所有的朋友，包括我自己都很驚訝。”誰曾想，一個至今仍看不懂程式碼的中年文科生，竟然靠自己一個人10天就成功開發出了一個小程序。他甚至能自主發現bug，還指揮AI，按照他的邏輯成功debug了。在第一版小程序載入巨慢時，他想了想問題可能在那，直接命令CodeBuddy把第一次打開到第一次載入完的所有步驟梳理一遍，發現3個tag的內容都預載入了。實際上只需要載入首頁。“那是我第一次質疑AI，我說這個肯定不對。AI回覆說，你說得很對。”改了之後，速度馬上正常了。就在2025年最後一天，王博源在TestFlight上線了全景新聲IOS APP，非常有紀念意義。這是一個比小程序的資料、互動、介面、合規更複雜的項目，還加上了音樂收聽的功能，完成了一個使用者行為邏輯的閉環。iOS APP介面這依舊是王博源獨立跟CodeBuddy聊出來的。而這背後，也是因為AI程式設計工具的進步極其迅速，越來越聰明，更能理解需求，不需要專門的prompt。以他的主力平台CodeBuddy為例，功能越來越多，支援MCP後可以直接偵錯，skills上線後IOS效果程式設計更簡單了，慢慢地更有一站式的感覺。這半年多，他投注了極大熱情在程式設計創造上，遊戲都幾乎不玩了，每天刷自己APP用於debug，APP日均時長超過8小時。“我不是要跟別人競爭，我只是想做一個自己滿意的APP。”這種親自創造的成就感，跟做媒體時完全不一樣，是一種層次更複雜的互動。工具清單：CodeBuddy，作為一站式開發平台，主要用plan模式進行自然語言程式設計，用skills進行IOS效果程式設計。多選用DeepSeek3.2或混元模型。Xcode，作為iOS運行模擬器。0繪畫基礎用AI做動漫IP 讓打工人深深共鳴朱旭2016年來到北京，進了網際網路行銷、培訓行業，當時的朝陽行業。在大廠待過幾年後，他在前輩的帶領下走上了創業之路。一開始，朱旭真人出鏡，教人怎麼整合資源做短影片，但他發現自己的鏡頭表現力不夠。他也跟朋友合夥創業做陪診師教學項目，但隨著平台對醫療金融等監管升級，涉醫療內容也不好做了。朱旭前兩次的創業經歷，更多基於過往已有的經驗。當2024年5月，朱旭看到身邊的朋友用AI花幾分鐘生成的視訊，效果完全不遜於以前他拉一堆機器、燈光、演員、服化道做出來的鏡頭，他對行業的認知被顛覆了——這是一次劃時代的生產力躍升，“一瞬間覺得，應該去搞！”這次朱旭選擇了職場賽道，因為這類話題是他最熟悉的領域，多年的職場經歷讓他積累了很多選題靈感。“第一個成稿還沒發出去時，我就覺得，這個事好像能成。”很快，《午夜公司怪談》一炮而紅。在這個小短片裡，穿著T恤的牛，在公司加班，公司斷網，網線沒插好，但“想插這個網線得先立項，總監三天後做了批覆，需要連夜開會商量……預算不夠，人事提議加個內部headcount，小李兼顧插網線……”網友被深深戳中內心了，“我一直覺得這種形式主義只在體制內流行呢”，“我們公司就是這樣的，採購兩個蓄電池，供應商五個起售，公司就說找新的供應商，價格還不能比以前的高……快半個月了還沒有結果……”“朱牛馬”IP就這麼立住了。朱旭慢慢拓展團隊，開始穩定輸出扎心內容。一開始，海外軟體效果更好，朱旭用ChatGPT生詞，用runway、Luma生成視訊。幾次AI應用大爆發後，朱旭多次遷徙，逐漸形成了穩定的工作流。如今朱旭會用元寶生成歌詞。元寶有資料夾方便團隊工作化運轉。給定一個話題和故事走向，再給定一個韻腳，讓它以黑色幽默的風格去拓展場景和故事，結尾要有反轉。用元寶創作的工作流當選題不夠明確，AI還能給予靈感。比如《顛倒歌》就是元寶做了核心的創意，“老鼠給貓繫鈴鐺，鸚鵡在會議室演講……”現象描述和諷刺，甚至比人還要犀利。生成歌曲，則多用Suno。朱旭自認“五音不全”，抽卡的曲子就常常選旋律說唱。這麼多曲子，人還是要承擔最終的“裁判”職責。他的第一判斷標準就是吐字要清晰，第二是節奏要快——因為後台資料反饋給出了演算法的偏好，抒情慢歌資料差，資訊量要密集，要有反轉。而Suno能力也迅速進化，能明顯聽出隨著時間推進，“朱牛馬”作品的rap節奏和flow變化，越來越有水平。視訊生成這步，朱旭最能感受到技術躍遷的影響。朱旭一開始為了避免恐怖谷效應，選了2D動漫形式。最早他多用Midjourney和大段風格化提示詞去控一致性。後來Vidu推出“多主體參考”，算是一個巨大的迭代，解決了“主體一致性”這個根本難題，後來變成各平台的常規化功能。現在動作遷移、推拉搖移複雜鏡頭調度等功能也有了，讓朱牛馬動畫的“PPT感”越來越弱。整個工作流跑順了，朱旭工作室的商業化也有所斬獲。“朱牛馬”被朱旭作為一個展示AI內容的窗口，一方面去連結B端的非標業務訂單，比如廣告製作、帳號代營運；另一方面則是嘗試C 端的業務，比如製作“AI短影片組合技”這類標準化課程。在朱旭看來，AI在相當程度上是起到“平權”的作用。對他這樣一個不會畫畫、不會作曲唱歌的創作者，降低了創作門檻，讓他能夠做出“朱牛馬”這樣的綜合性作品。它能讓很多人的短板得到彌補，讓他們的想像力，進一步地擴大。但這可能需要一個前提，那就是作為個體，需要展現行動力，去學習新興事物。工具清單：元寶：選題策劃+生成歌詞+指令碼分鏡Suno：生成音樂Midjourney：生成靜態畫面Vidu：生成視訊開發一個AI創作工具輔助人類表達主體性對於大多數網際網路使用者，AI時代彷彿一夜之間突然降臨。也有極少數人，雖然不在行業內，但在ChatGPT、Deepseek等節點到來之初，就清楚AI技術的演進路線。這些人的選擇也許更有啟發。王依然就是這樣的人，他是B站Up主“圖靈的貓”，從2019年開始做AI科普內容，而且做到了頭部，2024年已經成為B站百大。在AI浪潮更廣泛到來時，他會做些什麼呢？最容易想到的就是，能不能用大模型來助力自己生產內容。但一直到2024年，他都完全拒絕使用大模型生產內容。王依然認為，大模型生成內容的過程是一個黑盒。你給一些提示詞，馬上就會有一篇看上去還行的內容。實在太容易了，於是這種批次化生產的AI內容，在全球網際網路氾濫。這些由AI批次生產的低品質內容，被《韋氏詞典》稱為“Slop”，列入2025年度熱詞。其實這種幾秒鐘就能出一篇的內容，對於電商等行業需要的一些說明類的文稿，也不是不能用。但一定達不到B站百大Up主的要求。AI無法提供“獨家洞見”或是“萬里挑一的有趣靈魂”。對於王依然來說，這不是大模型的問題，而是如何使用大模型的問題。作為科普Up主，他一直在跟蹤大模型的能力成長，在大模型迭代幾輪後，他認為大模型已經具備作為工具，幫助生產內容的能力。2024年，王依然的團隊開始搭建用AI幫助創作的工作流，具體來說，就是把黑盒拆開，讓創作者可以參與進去。經過一段時間的研發，他們最終把創作過程拆分成五個環節。選題：AI幫忙把模糊想法具體化，形成選題；調研：讓AI幫你看看，這個選題在各平台的資料表現；大綱：AI幫你形成一個你滿意的寫作框架；寫作：AI熟悉你的寫作風格後，寫出和你的風格很接近的文字；素材：配圖配音以及視訊，通過API自動連接市場上所有主流生圖、音訊、視訊大模型。工作流搭好後，團隊自己先試用，而後又小範圍找人試用，王依然說，效果還可以。既然能幫助自己，為什麼不把這個工具產品化，推向更多的使用者呢？於是Creaibo創伴誕生了。王依然很快就意識到，這類垂直應用，不只是在國內市場，在海外市場也可以找到足夠的付費使用者。Creaibo在2025年11月率先於海外上線，目前處於內測階段，全平台已有千萬曝光。Creaibo在海外的種草階段，還曾拿到Product Hunt網站的Product of the Day第一名的成績。從B站Up主到AI創業，王依然的業務拓展很絲滑。一方面，團隊確實有一定的技術實力，另一方面，他也有對於內容創作的深刻理解。同時，現在AI創業的基礎設施也非常完善，支援像王依然這樣的創業者去挑選，來搭建產品、實現功能。Creaibo的核心功能靈感畫布，可能是很多自媒體同學想要的功能。就是當你有了一個模糊的想法時，只要輸入一段話一個連結，就可以獲得符合你個人風格的選題。甚至完全沒有靈感的時候，“靈感盲盒”可以根據你的個人風格來推薦靈感。這是怎麼做到的呢？當然不是魔術，底層工具是騰訊雲ES所提供的AI搜尋引擎，簡單來說，就是把你之前的作品以及你日常常用的各種資料來源上傳後，大模型就能根據你的風格特點，把搜尋和分析結果推薦給你。而使用者的“個人風格DNA”，實際上是被拆分為一系列特徵的向量或文字標籤，搜尋引擎可以基於相似性，匹配計算不同靈感內容與使用者個人風格的相似度。實際上，要完成靈感畫布的基本功能，根據市面上現有的產品，王依然有眾多路線選擇。在比較了主流的搜尋引擎、向量資料庫、以及更多的技術堆疊，綜合多方因素，他最終選型了騰訊雲ES。這其中最重要的考量是，騰訊雲ES可以通過統一技術堆疊來解決文字搜尋、向量搜尋、聚合分析、AI整合等全部需求，它避免了混合技術堆疊帶來的系統複雜度、成本開銷、偵錯追蹤、維運投入等挑戰。ES 是當前業內最流行的搜尋引擎，在AI時代廣泛用於多模態搜尋和知識庫建構，它獨特的文字和向量混合搜尋，兼顧召回率和搜尋精準度。騰訊雲ES自研了文字和向量融合排序、量化裁剪、平行檢索和 GPU 推理等能力，大幅提升了混合搜尋的功能和性能。舉個例子，Creaibo支援你把“使用者畫像偏好”、“內容熱度和新鮮度”等業務指標作為條件來最佳化結果，這就是基於騰訊雲ES的獨特能力。更重要的是，騰訊雲提供的是一站式服務，對於開發者來說，等於是提供了一個技術底座，所有功能都可以在這個底座上完成，不需要另外搭配技術堆疊。例如，Creaibo 通過靈感畫布生成多個靈感後，你可以針對B站或小紅書進行一下市場分析，預測一下這個選題最終的閱讀量。這就需要資料聚合分析能力，而ES本身就有開箱即用的聚合分析能力，完全可以支援這個需求的實現。而且，整個產品搭載在騰訊雲TKE上面，也可以非常方便地快速迭代。借助這套系統，Creaibo的定位是AI輔助創作，可以讓AI寫的沒有那麼AI味，真正言之有物，讓整個過程中包括從靈感到編輯，都變得更高效。“AI輔助創作，跟抄襲、洗稿的界限在那裡？”王依然會時不時地被問到這個問題。王依然希望Creaibo成為“創作夥伴”，而非單純的效率工具，批次生產網際網路垃圾。內容水平、特色，核心還是要看使用者本身的創作能力。王依然認為，身處技術變革大潮中，短期的焦慮是無意義的，因為你無法控制技術浪潮的方向。真正能讓你立於不敗之地的，是長期積累的“資產”，這個資產指的是是對於AI的認知。至於人與AI的關係，王依然認為，人的主體性才是最堅固的護城河。他所說的主體性是指每個人對世界的獨特理解、判斷和價值偏好。作為熟悉AI技術全景地圖的人，王依然的選擇是面對AI浪潮，將技術進步視為人類的增強工具。其實這是一種相對樂觀的態度，曾經賈伯斯對科技的願景，也是將其作為人類大腦的自行車。工具清單：騰訊雲ES：騰訊雲提供的雲託管Elasticsearch服務，核心是開箱即用的AI搜尋引擎。騰訊雲ES在AI時代廣泛用於文字搜尋、向量搜尋、RAG建構等領域，已經成功支援了騰訊IMA、微信視訊號、微信讀書等產品來服務海內外數以億計的客戶。Creaibo網站支援國內主流AI生成模型，海外版支援Sora 2、Nano banana Pro等模型。國內版：www.creaibo.com/海外版：https://creaibo.io/All in AI帶來機會但長跑沒有盡頭王文楷使用AI，是一件命中註定的事。差不多2021年，他已經開始接觸AI了，最初是用Stable Diffusion做工作流測試。那時王文楷還是風格抽象的影像藝術家，畢業於紐約大學電影學院的他發現，Stable Diffusion生成圖像的超現實風格，和自己的作品很有契合點，能帶來靈感。比如，王文楷曾生成了“蝴蝶翅膀裡面流出石油”這樣的場景，傳統三維場景很難做，也超出一般人的想像邊界。後來成為廣告片導演，王文楷也不排斥AI進入他的工作流，“我的攝影本身就有很多後期合成和PS的成分在裡面”。2023年之後，王文楷已經開始用AI來做特效輔助視覺。2025年，王文楷稱之為爆炸的一年。一方面，AI在視訊方向上的發展速度越來越快，精細度越來越高，最重要的進步就是可控性；也正因為可控，AI視訊能夠商用了，客戶對於AI工具的接受度越來越高，甚至大品牌甲方，也能接受全篇使用AI。尤其是Nano Banana出來後，王文楷感覺看到了智能的存在。他要求Nano Banana生成公元前一百年某事件圖片。完成這個要求，AI必須理解時間、空間、人文歷史處理程序。結果，出來的視訊真的是那麼回事。王文楷的很多作品，都使用了AI介入後期，甚至在拍攝階段就需要為AI效果進行前期調度。比如給某電商平台做的短片中，在模特實拍之後，王文楷再用AI生成宇宙背景、漂浮的星雲寶石等等。片子的真實、虛幻元素渾然一體，質感很高。這個片子使用了騰訊混元大模型。可能是由於公司有遊戲背景，混元中有很多高品質的三維資產。王文楷還用AI生成很多項目的效果預覽，能更好地跟客戶溝通想法，展示藝術創作能力，獲得客戶信任。王文楷因此在業界也頗有“擅做AI效果”的口碑。比如，奔馳的AMG GTXX概念車的短片項目，就直接找上王文楷。概念車用了很多內部新技術，要做宣傳片卻缺乏真實素材。王文楷用AI做出了概念車極速奔馳的效果，反響“蠻炸裂的”。隨著市場對AI接受度的提升，他的大客戶也越來越多。此外，他的工作室能夠接一些預算很低的單子。時尚大刊配合明星封面做的幾分鐘時長的推廣視訊，只有簡單的物料，預算也很低，但是給導演團隊的製作空間很大，他就大比例採用AI來做畫面，低成本製作但成片出來也很有質感。擁抱AI，給王文楷帶來了很多優勢。因此，王文楷非常積極地去學習AI的任何新進展。因為AI還在高速發展中，每一個新工具出來，都會有一部分過去經驗完全失效。這幾年他有一半時間，都all in AI，跟蹤新的工具，去學習、試用以及思考如何融入工作流裡面去。王文楷很好地融入了AI時代，雖然他說有時候可能在深夜還是會有一點悲傷，“我們引以為傲的、甚至花了幾十年訓練出來的時代風格，在未來的AI時代裡面可能只是一顆種子。”一些規模更大的廣告和影視公司，已經有了高度流水線式的AI視訊製作團隊，把每個工作流都拆分得非常細，生圖師就是一天八小時都在生圖，成為AI時代的螺絲釘，不需要對整個製作有什麼瞭解。王文楷還是希望從個人的靈感出發，以類似“一人公司”的模式對外合作，堅持“手搓AI”。因為這樣才能做出有趣的東西。他堅持在作品中保留人的創意。目前王文楷只是把AI生成的內容混合進最終的作品中，可能是30%，或是70%。接下來市場的變化也許會比技術來得更猛烈。王文楷發現，越來越多他的大客戶，都在內部成立了AI創作團隊。他的客戶也許會越來越少，因為客戶自己幹是他無法阻止的趨勢。不想“倒在AI的春天裡”，王文楷已經開始計畫做AI視訊培訓業務。AI是這個時代最好的老師，但是長期積累的經驗也同樣有價值。工具清單：Midjourney，文生圖，訓練專屬的個人高辨識度風格系統，作為可以復用的種子。混元，圖生3D，世界模型，骨骼驅動功能。Nano Banana，生圖性能好。Lovart，AI工具整合平台。尾聲這是4個在AI時代吃螃蟹的故事。機會到來時，不是每一個人都在當下就清楚意識到，AI到底給普通人帶來了什麼？往小裡說，“AI是這個時代最好的老師”，普通人有機會填平技術鴻溝；往大裡說，一個重寫人生敘事的機會。AI會改變各行各業，反過來說，每一個人都有機會用AI逆襲。關鍵是我們如何看得見、看得起、看得懂、跟得上，把AI帶來的混亂變成階梯。 (創業邦)

GPT-5.3-Codex 發佈：首個自我訓練的模型

今天，可算是又炸了一輪啊……讓不讓人睡覺了！就在過去一小時內，OpenAI 發佈了 GPT-5.3-Codex，Anthropic 發佈了 Opus 4.6（100萬 context）Claude Opus 4.6 發佈，跑分霸榜，價格不變。兩顆重磅炸彈，幾乎同時落地。建立在這些模型之上的 Agent 們，接下來怕是要起飛了。而就在 Anthropic 放出 Claude Opus 4.6 的同一天，OpenAI 緊跟著扔出了 GPT-5.3-Codex，號稱迄今為止最強的 agentic coding 模型。Sam Altman 本人也第一時間發了推：GPT-5.3-Codex 來了！最強編碼性能（57% SWE-Bench Pro，76% TerminalBench 2.0，64% OSWorld）。任務執行中可即時引導，工作過程中提供即時更新。更快！相同任務的 token 消耗不到 5.2-Codex 的一半，每個 token 的速度還快了 25% 以上！電腦使用能力也很強。那這個 GPT-5.3-Codex 到底強在那呢？且往下看。自己訓自己GPT-5.3-Codex 有一個很「離譜」的特點：它參與了自己的創造過程。OpenAI 團隊在訓練過程中，就用早期版本的 GPT-5.3-Codex 來 debug 自己的訓練、管理自己的部署、診斷測試結果和評估。換句話說，這個模型幫著把自己「生」出來了。OpenAI 的研究團隊用 Codex 來監控和偵錯這次發佈的訓練過程。它不僅能排查基礎設施問題，還能追蹤訓練過程中的模式變化，對互動質量做深度分析，提出修復建議，甚至為研究員建構可視化應用來精確理解模型行為的差異。工程團隊也在用 Codex 最佳化和適配 GPT-5.3-Codex 的運行環境。當出現影響使用者的邊界情況時，團隊成員直接讓 Codex 去定位 context 渲染的 bug，排查快取命中率低的根因。在發佈期間，GPT-5.3-Codex 還在幫團隊動態擴縮 GPU 叢集以應對流量高峰，保持延遲穩定。有一位資料科學家用 GPT-5.3-Codex 建構了新的資料管道，做出了比標準儀表盤工具豐富得多的可視化結果，然後和 Codex 一起分析，三分鐘內就從數千個資料點中提煉出了關鍵洞察。全面屠榜GPT-5.3-Codex 在多個基準測試上刷新了紀錄：SWE-Bench Pro 拿下 56.8%，這是一個衡量真實世界軟體工程能力的嚴格評估。和只測 Python 的 SWE-Bench Verified 不同，SWE-Bench Pro 覆蓋了四種程式語言，更抗資料污染，也更貼近工業場景。GPT-5.2-Codex 是 56.4%，GPT-5.2 是 55.6%。Terminal-Bench 2.0 達到 77.3%，遠超 GPT-5.2-Codex 的 64.0%。這個基準測試衡量的是 coding agent 所需的終端操作能力。OSWorld-Verified 拿下 64.7%，而 GPT-5.2-Codex 只有 38.2%。OSWorld 是一個在視覺桌面環境中完成生產力任務的 agentic 電腦使用基準，這個提升幅度可以說是「斷崖式領先」了。GDPval 上以 70.9% 的勝率或平局率持平 GPT-5.2。GDPval 是 OpenAI 在 2025 年發佈的評估，衡量模型在 44 個職業的知識工作任務上的表現，包括做簡報、處理電子表格等。網路安全 CTF 挑戰達到 77.6%，GPT-5.2-Codex 是 67.4%。SWE-lancer IC Diamond 拿到 81.4%，超過 GPT-5.2-Codex 的 76.0%。而且值得注意的是，GPT-5.3-Codex 完成這些任務所消耗的 token 比任何之前的模型都要少。又強又省，這才是真本事。不只是寫程式碼GPT-5.3-Codex 的定位已經不僅僅是一個程式碼生成工具了。OpenAI 稱：從寫程式碼的 agent，變成了幾乎能做開發者和專業人士在電腦上做的一切事情的 agent。軟體工程師、設計師、產品經理、資料科學家做的遠不止寫程式碼。GPT-5.3-Codex 被設計為支援軟體生命周期中的所有工作：debug、部署、監控、寫 PRD、編輯文案、使用者研究、測試、指標分析等等。它的 agentic 能力甚至超越了軟體領域，能幫你做幻燈片、分析電子表格中的資料。OpenAI 結合了前沿編碼能力、美學改進和壓縮能力，做出了一個能在數天內從零建構高度功能化的複雜遊戲和應用的模型。為了測試長時間運行的 agentic 能力，他們讓 GPT-5.3-Codex 建構了兩款遊戲：一個賽車遊戲的第二版和一個潛水遊戲，使用的只是通用的跟進提示，比如「fix the bug」或「improve the game」，GPT-5.3-Codex 就在數百萬 token 的互動中自主迭代。在網頁開發方面，GPT-5.3-Codex 也比前代更懂你的意圖。簡單或不夠詳細的提示，現在會默認生成功能更完善、預設值更合理的網站，給你一個更強的起點去實現想法。比如讓兩代模型分別建構一個落地頁，GPT-5.3-Codex 會自動把年度方案顯示為折算後的月價格讓折扣更直觀，還會做一個自動輪播的使用者評價元件，而不是只放一條。開箱即用的完成度明顯更高了。邊幹活邊對話隨著模型能力越來越強，瓶頸已經從「agent 能做什麼」轉移到了「人類如何方便地與多個平行工作的 agent 互動、指導和監督」。GPT-5.3-Codex 在這方面做了一個關鍵改進：互動式協作。以前你給 Codex 一個任務，然後等它給你最終結果。現在不一樣了，GPT-5.3-Codex 會在工作過程中頻繁給你更新，讓你即時瞭解關鍵決策和進展。你可以隨時提問、討論方案、調整方向，而不會丟失上下文。它會告訴你它在幹什麼，回應你的反饋，從頭到尾都讓你參與其中。更像是和一位同事協作，而不是給一台機器下命令。在 Codex 應用中可以通過 Settings > General > Follow-up behavior 開啟這個功能。首個「高能力」安全評級GPT-5.3-Codex 是 OpenAI 在 Preparedness Framework 下首個被評為網路安全相關任務「高能力」的模型，也是他們首個直接訓練來識別軟體漏洞的模型。雖然沒有確鑿證據表明它能端到端地自動化網路攻擊，但 OpenAI 採取了預防性措施，部署了迄今最全面的網路安全安全端，包括安全訓練、自動化監控、高級能力的可信訪問以及包含威脅情報的執行管道。因為網路安全天然是雙重用途的，OpenAI 採取了「基於證據、迭代推進」的方法，加速防禦者發現和修復漏洞的能力，同時減緩濫用。具體措施包括：推出 Trusted Access for Cyber 試點項目，加速網路防禦研究。擴大 Aardvark（安全研究 agent）的私有 beta 測試，作為 Codex Security 產品套件的首個產品。與開源維護者合作，為 Next.js 等廣泛使用的項目提供免費程式碼庫掃描，上周就有安全研究員用 Codex 發現了 Next.js 的漏洞並已披露。在 2023 年發起的 100 萬美元網路安全資助計畫的基礎上，OpenAI 還承諾投入 1000 萬美元的 API 額度，用於加速網路防禦，特別是針對開放原始碼軟體和關鍵基礎設施系統。可用性GPT-5.3-Codex 現已向所有 ChatGPT 付費使用者開放，覆蓋 Codex 可用的所有平台：應用、CLI、IDE 擴展和網頁端。API 訪問正在安全地推進中。速度方面，比 GPT-5.2-Codex 快了 25%，token 消耗則不到前代的一半。GPT-5.3-Codex 是與 NVIDIA GB200 NVL72 系統協同設計、訓練和部署的。方向變了OpenAI 在文章最後說到：GPT-5.3-Codex 讓 Codex 從「寫程式碼」走向了「用程式碼作為工具來操作電腦、端到端地完成工作」。最初聚焦於成為最好的 coding agent，現在已經演變成了一個更通用的電腦協作者，擴展了誰能建構以及用 Codex 能做什麼的邊界。同一天，Anthropic 發 Opus 4.6，OpenAI 發 GPT-5.3-Codex。兩家在 agentic coding 這條賽道上的軍備競賽，已經進入白熱化了。cli 中也已經能用了：而方向也越來越清晰：不是讓模型寫更多程式碼，而是讓模型用程式碼去搞定一切。而另一個值得注意的是：GPT 5.3 Codex 今日正式發佈，而數小時前同時發佈的還有人工智慧代理平台 Frontier。這種發布周期的縮短意味著什麼呢？OpenAI 在近 6 個月內發佈了 5 個主要版本/更新，而此前 15 個月總共才只發佈了 7 個版本。對於日益複雜的模型，根據 OpenAI 自己的發佈公告，越來越多地使用#AI生成的程式碼來建構，這要麼是因為真正的功能程式碼開發改進而帶來的速度提升，要麼是因為在競爭壓力下通過更多的質量保證而實現的加速。這次的 GPT-5.3-Codex，可還是參與了自己的訓練過程的……有意思。 (AGI Hunt)