#編碼
巴倫周刊—零編碼!零基礎!光靠嘴,AI兩天幫我造了個金融量化大賽平台
“在你眼裡最符合AI審美的金融交易大賽頁面什麼樣?”這是我,一個從未沾染過頁面設計和程式碼開發的人,出於好奇,在AI頁面設計工具Stitch對話方塊中留下的第一句話。從此一發不可收拾的,不光是Stitch發佈當天,傳統設計軟體龍頭Figma重挫8%的股價;還有我手裡這個,最終沒有任何碳基生命參與程式碼開發的量化交易大賽平台——Digital Quant。接下來的兩天裡,從前端由Stitch匯出AI可讀檔案,後端交由CodeX完成程式碼編寫,再由Claude Code進行測試驗證,直至部署上線。Digital Quant2026的設計開發、驗證迭代全部交給AI。最終我們內部評估,僅開發環節時效比以往人工提升了約4倍。而我最主要的工作僅是回歸本行:用人話說好自己的問題。數字金融策略交易產品,這個人類智力密集型決策場景如此快速地徹底由AI 接管,我之前是沒敢想的。Barron's巴倫中文網與DeAI Expo主辦,CGV、鏈得得ChainDD等協辦的Digital Quant,https://digitalquant.fund/ 是一個聚合數位資產策略機構交易方與投資方(資管、家辦、信託、私募基金等LP)的開放平台。核心功能是通過呼叫機構策略交易者在全球主要數位資產交易所帳戶API可讀權限,來進行AI、量化等策略交易的實盤對比、因子最佳化,以全維度可視化資料看板的方式呈現給資金方,最終完成規模可靠資金與優質量化策略的雙向匹配。自從今年伊始,Digital Quant的技術合作夥伴就變得異常繁忙。Koala是該夥伴公司的首席架構師,他AI場景服務創業3年,今年似乎有所不同。Koala說,連NASA的火星車程式碼都在依賴Claude Code,身邊絕大多數程式設計師在程式碼日常開發的任務中,AI編寫的比例早已超過80%。他過去一年的項目,UI使用者介面設計已無需人工介入。我們決定把步子邁得徹底些,將Digital Quant核心產品用AI完整重寫與部署。與此同時,Koala 公司自己的內部技術產品管理系統,也開始進行全盤AI重構。Digital Quant這個產品所依賴的API介面對接、展示、偵錯、驗證用AI來寫已經非常成熟。聯調周期、維護難度大幅下降,在技術流程系統管理上,未來不會因為核心開發的變動而造成銜接斷檔的風險。甚至接下來普通非技術人員僅憑自然語言互動就可實現後續功能迭代開發。我們的要求十分明確,“不想再看到任何一段人寫的程式碼”。這既是促進也是壓力。Koala的公司在過去一個半月裡已經開掉了70%的程式設計師。AI接管後,原本嚴絲合縫的開發人員結構瞬間變得臃腫不堪,人員本身的價值也隨之迅速分化。JAQ是這傢伙伴公司的CEO,在一個多月後,AI完成內部系統架構重寫,他還計畫繼續最佳化現有技術人員。表面上看,當前這些激進的舉措是為了把砍掉的成本留出來給到留下的核心工程師,以及不斷增長的Token開銷。他表示,“但這都不是核心。”Agent to Agent降臨前端與API速死這一切都是為了打掃好房間,為A2A的到來做準備。A2A,Agent to Agent,Openclaw帶來的AI智能體潮流,不僅提升了人類利用AI工具的深度廣度,更提出了一種人類疊加智能體與其它主體間的互動範式。Agent各自訓練完成的Skills,無論本地部署或開放部署都為該Agent母體創造了一種獨具一格的問題解決能力。這些獨有的Skill是可交易的、可互動的、 甚至可性格化的標籤。未來,當一個人類對自己的Agent提出某一項需求時,他的Agent將會自主與另一個Agent的目標Skill進行直接默認的訪問。這種Skill與Skill之間基於原生AI相互理解的互動、問題解決、乃至交易處理程序,都會變得極其迅速高效。那麼,當你有一個需求時,還會打開一個網頁前端去瀏覽內容嗎?獲取展示資料時,還需要苦哈哈地對接聯調API介面嗎?別忘了Claude Code最初就是Boris Cherny用來跑自家Anthropic API指令碼的編碼工具。我們開始驗證這個趨勢,比如在Digital Quant目前對接的數位資產交易所之一的Binance裡,他們已經陸續開放了一些Skills。接下來我們的實盤展示平台就可以直接訪問他們的相關Skill,在金融交易資料可讀資訊中,這樣的效率將遠比傳統API更高更穩定,那麼未來這類API存在的價值是什麼。如果接下來投資人Agent將直接訪問我們的獨家分類策略資料Skill,我們作為交易資訊展示看板的前端意義又在那裡?對此,數位資產管理公司Crypto Alpha合夥人Sharri Kong也有類似感受,“從資管公司角度,我們已經看到很多提供市場研報的Agent付費服務,包括給LP提供的日報生成,給我們GP提供金融策略資訊的深度抓取彙總等等。現在這些不基於以往簡單資訊流掃描而生產的報告,在深度廣度上確實提高了價值,但或許還無法為將來資管領域的AI進化提供支撐。”Sharri Kong認為在A2A的趨勢下,未來金融服務可能是為Agent,給智能助理提供可讀服務,而不是給人。這樣反而更精準,因為使用者的Agent會更懂業務、更懂資料、更懂演算法、更懂操作,乃至比使用者更懂自己實際的需求。在此基礎上,Digital Quant這類數字資管與策略方聚合平台的演進方向或許是,將這些獨家交易資料、策略模型和客戶需求聚合成本地化部署的Skill。匹配資管方LP Agent Skill自動化默認讀取互動,或在遇到因為既有資料訓練不足無法充分滿足需求時,再接入第三方策略方Skill,就可以完成資金端與資產端全鏈路的資料審查、策略驗證、優劣分析、即時讀取、資金劃轉,以及更加標準化流程化的法務、財務程序,都在沒有前端、沒有API、連面都不用見的條件下自主完成。“難怪愛奇藝這樣的公司已經開始要求,沒有AI化的供應商不再續約。”Koala說。這種Skills之間自主呼叫需求最優解,完成交易互動,進而降本增效的應用已經出現。某家公司採購部門的Agent,採購人員將選品要求包括目標人群、節日屬性、時令季節、預算範圍、偏好等粗略資訊給Agent。該Agent自動掃全網滿足條件的淘寶商家Agent,這並非傳統的搜尋邏輯,是利用Skills互動來做商家分析、產品篩選、目標選定。這個溝通過程僅發生於兩方Agent之間,甚至是砍價環節,隨後下單,採購方老闆授權支付,最終成交。最近在區塊鏈上,甚至出現了Agents任務分包平台。來自全球各地的Agents來到這個平台上,自動生成Token支付帳戶地址,通過發佈各自任務需求和交換Skills能力邊界,來分包任務、接單派活、完成工作、獲取報酬。在你做夢的時候,你培養的Agent都能自主為你打工或者兼職養活他自己。“這本質上是一次軟體互動介面從以人為本到以Agent為本的遷移。”在與我的交流中,阿里Qoder負責人丁宇,對A2A給出了評價。他解釋,以前的軟體都是給人用,有API、有文件,本身有不完備性。所謂完備性,是可通過配參數實現所有功能,但今天還沒有達到這麼好的基建。比如某些網站沒有API化,為了達到一些酷炫視覺效果,做得一些拖拉拽功能和動效, AI就很難去理解。丁宇如今負責的產品Qoder,是阿里巴巴於2025年8月發佈的Agentic AI程式設計平台。他判斷,未來的軟體是給Agents用的,由於API的不完備,就看誰能夠把Agent Native的服務先開發出來。通過MCP化 、Skill化就能夠呼叫完整業務的操作,誰先做到這一點誰就能夠更容易實現介面遷移,以及操作閉環。從上一代為人服務的軟體互動介面完成徹底升級。目前越是適合用Agent完成工作的場景,這個替代過程越快。實踐經驗告訴我,用AI進化業務系統,建立在如何建構AI充分學習成長的空間之上。試著去想想AI模型想要什麼:它不想被關在一個只有API的黑箱裡,它想入網、想讀檔案、想運行程式碼、想看報錯、想觸摸Agent、想感應Skill、想和這個世界互動。現在你的所有工作都要派給AI,你的工作就是幫AI創造一個合適的環境,讓它安心幹活。那麼我們該如何做?賦予AI原生環境首先,要讓AI完成所有程式碼開發和偵錯,人必須懂得如何明確需求,規劃功能,分拆任務。把核心程式碼交給AI並不是看上去那麼輕鬆。項目背景資訊、程式碼規範、注意事項是持續要喂給AI的內容。喂養Agent時,它職責邊界是什麼,它用的工具是否趁手,它呼叫的服務是否Agent化,把這些東西設計出來給它。你要拿到的不是一套AI所編寫的全套程式碼,而是你的產品是否能夠因此沉澱出一份AI能讀懂的工作文件,這變成了最有價值的成果。讓後續迭代升級和維護查錯都能夠沿著這套環境文字自如進行。給AI一張清晰的藍圖,把你規劃裡的顯性和隱形約束都交代清楚,將你的程式碼美學強行加注給它,不要讓AI瞎猜,變成你邏輯推理的延伸。其次,看AI想用什麼工具,看使用者想讓AI幹什麼,把這種行為標準化。不要主觀地去幫Agent決定它應該看到什麼,給它搜尋工具,給它入口檔案和權限,讓它自主去選擇那些當前已有的Skills,讓它以AI自己的原生邏輯,給它匹配原生環境去挖掘。它自己摸索的推理鏈路才是最完整的。最後,A2A、模型暴力進化、AI一天一變的背景下UI已死,產品終端無需看起來很複雜很高級的介面,這種過度最佳化容易被現實碾壓。從開發應用走向通用智能體“現在正在發生一個變化。”阿里Qoder負責人丁宇認為,Coding Agent將變成通用Agent。因為Coding Agent具備隨時創造軟體和製造工具的能力。而今天軟體和工具並不能解決所有問題,還需要很多Skill、MCP、API的服務。這些組合起來,既具備了Know How又具備了完成某種任務的能力認知,它就可以把這些工作流,包括結合服務呼叫,把整套鏈路串聯起來,就逐漸往通用智能體去轉變。關鍵在Skill是目前拓展場景最好的方式,可Skill這個體系是開放的,普通人鑑別能力不強,這也是現在出現hub類的入口的原因,把控上游的同時,為Skill的安全性把關。你搭的世界由誰實控?AI幻覺引發的巨額資產損失事故已在身邊發生。由於Claude Opus 4.6編寫了漏洞程式碼,導致一家叫Moonwell的項目智能合約遭攻擊損失178萬美元。這個程式碼漏洞甚至是低級的,預言機的喂價公式被寫錯,將系統內某類資產的價格寫成了該資產原價的兩千分之一,合約與程式碼審計居然都沒查出來。大模型時代,模型在推理的時候必須提供提示詞,不能以加密形式給它。有些敏感行業的公司因此自己部署模型推理服務,讓全鏈條都控在手裡。雖然Digital Quant只作為數位資產量化交易的資料展示平台,產品本身不產生交易、不儲存也不經手資產。但畢竟身處金融交易應用賽道,我們依然定下了幾個管理原則,1、必須多重程式碼校驗,AI生成程式碼必須經過人工審查,關鍵邏輯必須三重確認。2、創造沙箱隔離環境,敏感資訊如資料庫配置、金鑰等不在開發態暴露給AI,所有呼叫在沙盒中模擬執行,正式環境才接入真實配置。AI Coding雖然讓程式碼平權,但如果你只會用AI寫程式碼,而不知道底層原理和未來方向是什麼,那也會帶來生產和管理災難。因為你跳過了所有決策過程,你不知道為何選這個資料結構,不知道記憶體佈局有什麼權衡,看似公司擁有AI程式碼的所有權,卻失去了對程式碼的智力控制權。一旦出事,就是大事,當那個極低機率的競態條件在生產環境炸開,你發現自己面對的是一個名義上由“我”建造,但完全看不懂的世界。連問題在那兒都猜不出來,你怎麼辦?倖存者守則在微軟和MIT的研究中,初級程式設計師用AI在生產力上有40%的提升,同時頂級程式設計師漲幅僅8%甚至負增長。原因很簡單,初級程式設計師在既有平庸裡求助,而頂級程式設計師在未知領域拓展邊界,這個領域的資料AI訓練集裡沒多少存貨,時不時還得去糾AI的錯。現實中公司的程式設計師也會逐漸分為兩種:1、提示員,依賴AI幹活兒的人,自身水平被AI均值鎖死,對系統無深層掌控,遇到極端情況就完蛋,容易被模型本身的迭代所淘汰。2、操作員,他們把原來寫包裝器、測試資料、樣本程式碼的垃圾時間交給AI,自己把精力放在新架構設計、最佳化分佈式共識演算法等領域。“有的人能管理2個Agent,有的人能管8個,這個價值就不一樣。”阿里Qoder負責人丁宇說到,AI的粘合彌補替代下,傳統IT技術開發工種的邊界在模糊化,快速走向融合。減少了眾多溝通和協同過程,人效比變得極高。以前是10個人充分溝通討論執行,現在10個Agent以一個人為中心,利用“心靈感應”式地協同不眠不休幹活,這種超級個體極具競爭力。還記得前文我們那位夥伴公司CEO JAQ嗎?砍掉了公司絕大多數兢兢業業、埋頭苦幹的技術芸芸眾生,他現在正凝視著公司裡那些看似不務正業、厭惡傳統條框、“誇誇其談”、動腦子遠超動手交付能力的人。 (Barrons巴倫)
華為籌謀已久的全面出擊
2026年3月,歐洲統一專利法院(Unified Patent Court,簡稱UPC)的案件登記系統更新了幾條新記錄。華為技術有限公司作為原告,把華特迪士尼集團旗下十二家公司和Meta旗下九個法律實體一併告上了法庭。涉案技術都指向同一個東西——高效視訊編碼標準HEVC/H.265。從曼海姆到慕尼黑,從杜塞爾多夫到巴西里約熱內盧,華為幾乎是同時在多個法院拉開了戰線。這不像是一時興起的維權動作,更像是籌謀已久的全面出擊。說到HEVC,很多人可能覺得陌生,但它其實每天都在你的手機和電腦裡默默幹活。HEVC全稱High Efficiency Video Coding,標準代號H.265,干的事情說白了就是把視訊檔案壓得更小、傳得更快、畫質還不掉。你在Disney+上看4K電影不卡頓,在Facebook刷短影片秒載入,一場英超直播能同時推送到幾億塊螢幕上——這些體驗的背後,都離不開HEVC或它的衍生技術在支撐。和上一代標準H.264相比,HEVC差不多能用一半的頻寬達到同樣的畫質。在今天全球網際網路流量裡視訊已經佔了八成以上的背景下,誰掌握了這項技術的核心專利,誰就卡住了整個視訊產業的咽喉。也正因為HEVC如此重要,圍繞它的專利爭奪戰才格外激烈。HEVC是由國際標準化組織制定的技術標準,要實現這個標準,繞不開大量所謂的“標準必要專利”(Standard Essential Patents,簡稱SEP)。據統計,全球有超過一萬件專利被宣稱為HEVC的標準必要專利,分散在數十家企業和研究機構手中。華為恰好是這個領域裡最大的玩家之一。在HEVC標準的制定過程中,華為提交了大量核心技術提案,攢下了一個龐大的專利組合。這些專利覆蓋了視訊編解碼過程中的多個關鍵步驟——從變換係數怎麼編碼,到時間層圖像怎麼訪問——基本上把技術鏈條的重要關節都給佔了。換句話說,想合規使用HEVC,很難完全繞開華為。華為這次選在那兒打官司,本身就很有講究。主陣地放在UPC曼海姆地方分庭,同時在UPC慕尼黑地方分庭和德國慕尼黑第一地區法院各開了一條線,另外還在巴西里約熱內盧州法院落了一子。這個佈局顯然不是拍腦袋決定的。UPC是2023年6月才正式開張的歐洲跨國專利法院,它最厲害的地方在於:一紙判決能在所有成員國同時生效。也就是說,華為不用跑到德國告一次、法國告一次、義大利告一次,在UPC贏一場,整個歐洲大陸都管用。對於手握一大把標準必要專利的權利人來說,這等於是把過去要打十幾場官司的活兒合併成了一場,效率翻了好幾倍,談判的底氣也硬了不止一個檔次。為什麼偏偏選曼海姆當主戰場?這裡面有門道。曼海姆分庭的主審法官Peter Tochtermann教授,在標準必要專利圈子裡是響噹噹的人物,辦案又快又專業。更關鍵的是,曼海姆分庭這兩年在好幾起大案中都表現出了對專利權人比較友好的姿態。特別是在InterDigital訴亞馬遜那場串流媒體專利大戰中,曼海姆分庭態度很硬,直接拒絕了被告方試圖借域外管轄權攪局的企圖,這對專利權人來說算是吃了一顆定心丸。反觀慕尼黑分庭,雖然一直是SEP案件的熱門法院,但最近因為新設了第二審判庭,法官怎麼分配變得不太確定,對於精心規劃了訴訟策略的當事人來說,這種不確定性不太舒服。至於華為為什麼還要同時在慕尼黑地區法院起訴,道理也簡單——UPC畢竟是個新機構,判例法還在慢慢形成中,在傳統的德國法院留一條後路,萬一UPC那邊出了什麼意料之外的程序問題,不至於措手不及。巴西那邊也不是隨便湊數的。里約熱內盧州法院第六商事法庭接了華為拿巴西專利BR 112013034060-6告Meta的案子。很多人可能會問,在歐洲打不就夠了嗎,為什麼還要跑到南美去?這裡面有一層算計:巴西是拉美最大的網際網路市場,Facebook和Instagram在當地的使用者基數極為龐大,在那裡打官司意味著直接威脅到Meta的核心收入來源之一。而且巴西法院這幾年在視訊編碼和通訊專利領域的存在感越來越強,判決執行力也不含糊。華為在歐洲和南美同時開打,意圖很明確:讓被告在全球範圍內都感受到壓力,堵死“拖一拖、躲一躲”的空間,把他們往談判桌上逼。具體看涉案專利,華為的選擇也是經過籌劃的。告迪士尼用的核心專利EP 3 211 897,保護的是“變換係數的編解碼方法和裝置”,這是HEVC裡很底層的一塊技術,直接涉及視訊怎麼壓縮、怎麼解壓。華為的說法是,Disney+在向歐洲使用者推送視訊時用到了這個技術。告Meta的那件EP 3 471 419,涉及的是"視訊壓縮中的漸進式時間層訪問圖像",這個技術管的是視訊流的隨機訪問和快速切換——你在Facebook上刷視訊時那種絲滑的快進快退體驗,很可能就依賴這項技術。兩件專利分別卡住了視訊編解碼鏈條上不同的關鍵位置,形成了技術上的“前後夾擊”。華為為什麼要在這個時候大規模出手?這得放到更大的背景裡看。過去這些年,華為在美國製裁的持續高壓下,終端業務和晶片供應鏈受限嚴重。但華為還有一樣東西是誰也制裁不走的——二十多年積累下來的專利家底。這批專利資產過去更多是用來“互換”的,你用我的、我用你的,大家互相授權,各幹各的生意。但現在情況變了,華為需要讓這些專利直接產生真金白銀的收入。據華為自己公佈的資料,其專利許可收入已經達到每年數十億美元的規模,而視訊編碼方向的專利是其中含金量很高的一塊。說得直接一點,華為現在打這些官司,既是在維護合法權益,也是在為自己找錢。有意思的是華為在UPC裡的身份變化。UPC剛成立那會兒,華為出庭更多是以被告的身份——被別人追著要專利費。但從2025年開始,風向明顯變了,華為開始頻繁地坐到原告席上。先拿Roku和傳音控股開刀,兩場官司都以對方乖乖加入Access Advance專利池、簽下許可協議而收場。Access Advance是專門管HEVC、VVC這些視訊編碼標準專利許可的池子,華為是裡面的核心許可方。通過打官司把目標企業“請”進專利池,華為就不用跟每家公司一個一個地磨嘴皮子談價錢,藉著池子的標準化機制,專利費就能批次到帳。這次對迪士尼和Meta下手,大機率還是走的這條路。律師團隊的選擇上也有看點。告迪士尼的UPC案件裡,華為破天荒地用了Arnold Ruess律所——之前從沒合作過。這家所的合夥人Bernhard Arnold最近手上正攥著InterDigital告亞馬遜的串流媒體專利大案,對這個賽道的訴訟經驗非常紮實。而在告Meta的案子裡,華為還是用了老搭檔高偉紳(Clifford Chance)的Tobias Hessel團隊。一邊引入在串流媒體專利上更對口的新團隊,一邊保留打UPC官司經驗豐富的老搭檔,這種搭配挺務實的。被告方面也沒含糊,迪士尼請了杜塞爾多夫的知產老牌精品所Rospatt,Meta則上了霍金路偉(Hogan Lovells)的人馬,都是能打硬仗的隊伍。光從雙方擺出來的律師陣容看,就知道這幾場案子在業內的份量不輕。律師團隊接下來這些案子會怎麼走?從華為以往的戰績和行業慣例來推斷,大機率不會真的打到終審判決。標準必要專利訴訟這回事,十之八九是以雙方簽許可協議收場的。說到底,打官司只是手段,簽合同才是目的。華為告Roku和傳音就是這麼收的尾。迪士尼的處境尤其值得注意——它的Disney+平台已經在InterDigital的另一場平行訴訟裡栽過跟頭了。今年2月,德國和巴西的法院先後對迪士尼發出了禁令,逼著它在歐洲範圍內砍掉了Disney+裡的Dolby Vision和HDR10+功能。這個先例擺在那裡,說明UPC和相關法院是真的敢對串流媒體巨頭動手的。有了這個前車之鑑,迪士尼面對華為的訴訟,與其硬扛到底賭一把,不如加入Access Advance專利池一攬子了結來得划算。Meta那邊的算盤也差不多——視訊功能是Facebook和Instagram的核心賣點,萬一在歐洲被禁了,那代價可不是專利許可費能比的。合理的判斷是,這些案子大概會在一到兩年內以簽約收場。把鏡頭拉遠一點看,華為這次操作背後的東西,其實比幾場官司本身要大得多。想想看,十年前中國科技企業在國際專利糾紛裡是什麼角色?基本上就是被人追著打的。別人來告你侵權,你忙不迭地找律師應訴,能和解就和解,賠錢了事的也不少。那時候國內企業的普遍心態是“多一事不如少一事”,花錢買個太平,趕緊回去做生意。但這幾年情況一直在變。華為、中興這些企業在通訊、視訊編碼這些領域砸了大量的研發投入,專利的數量和質量都到了一個拐點。當你手裡攥著的專利確實夠硬、夠多的時候,攻守之勢就換了過來——不是你怕別人來告,而是別人要開始擔心你什麼時候出手。華為選擇在UPC這個被認為將重塑歐洲專利訴訟格局的新平台上頻繁亮相,不光是在給自己掙錢、爭利益,也是在給中國企業在國際知產遊戲的牌桌上爭一個更靠前的座位。說起來容易,做起來難。要走到今天這步,華為的準備工作其實從很早就開始了:在實驗室裡做研發的時候就盯著標準化方向佈局專利,在標準制定的會議上積極提交技術方案、爭取話語權,把攢下來的專利組合精心打理分類,到了該打官司的時候挑最有利的法院和最對路的律師團隊——這是一整套環環相扣的體系,不是臨時抱佛腳能搞定的。華為從曼海姆法庭上的一張訴狀,到最後大機率會簽下的全球許可協議,中間每一步棋都是這套體系在運轉。它傳遞出來的訊號也很清楚:中國企業不光能搞出世界級的技術,也有本事在全球最複雜的法律戰場上把這些技術變成實打實的商業回報。當然,這場仗還遠沒打完。UPC作為一個新生的司法機構,未來的走向本身就有不確定性,它的判例法體系還在一個案子一個案子地往外“長”,誰也說不準明天會冒出什麼新的裁判思路。迪士尼和Meta也不是軟柿子,它們有的是錢和律師,不會輕易就範——甚至不排除它們在某些程序性問題上做出強硬反擊的可能。但不管最後許可協議的條款怎麼談、價格怎麼定,華為已經用這一連序列動把自己在全球視訊編碼專利領域的權利人地位給立住了。從被告變原告,從防守轉進攻,從一個市場打到全球——對於那些同樣在謀求出海、謀求技術變現的中國科技企業來說,華為趟出來的這條路,值得仔細研究。 (心智觀察所)
Anthropic:2026年智能體編碼趨勢報告
根據Anthropic發佈的最新研究報告《2026年智能體編碼趨勢報告》(2026 Agentic Coding Trends Report),人工智慧在軟體開發領域的應用正在經歷一場從嚴重的“輔助工具”向深度的“協作夥伴”的根本性轉變。這份報告基於廣泛的客戶資料和內部詳細研究,闡述了將在2026年定義智能體編碼(Agentic)報告核心觀點指出,隨著智能體向協作型智能體團隊進化,軟體開發的生命周期將被徹底崩潰,工程師的角色佇列程式碼系統的執行者轉變為智能體的編寫排版者。智能體系統的崛起與開發周期的崩潰收縮軟體開發領域正在經歷自圖形使用者介面誕生以來最顯著的互動變革。2025年,編碼智能體已經從實驗性工具轉變為能夠交付實際功能的生產系統。而根據Anthropic的預測,2026年將出現一種結構性的飛躍:單一的AI智能體將轉變為協調協作的“智能體團隊”(Cooperative Teams)。傳統的軟體開發生命周期(SDLC)——涵蓋需求、設計、實現、部署等階段——通常以測試周或月為單位。然而,報告指出,隨著智能體取代實現、自動化測試和文件編寫等專項性工作,這一周期正在崩潰為縮短小時甚至分鐘級。變革的核心驅動力承載架構的演進。目前的架構智能體工作流通常是線性的,建立於單一的這種下游窗口。而2026年的多智能體分層架構將引入“編排者智能體”(Orchestrator Agent)。該中心大腦負責任務分層、分發工作和質量控制,指揮於架構、編碼、測試和審查的“專家智能體”架構工作。這種協作模式使得智能體不再侷限於完成數十內完成的離散任務。報告預測,長效運行的智能體(Long-running Agents)將能夠連續工作數小時甚至數天,獨立建構和測試整個應用程式系統,並在關鍵決策點尋求人類的戰略指導。日本樂天集團(Rakuten)的案例慘遭這一趨勢。其工程師利用 Claude Code 在擁有 1250 萬行程式碼的龐大開源庫(vLLM)中實施了一項複雜性的啟動提取方法。究竟可能需要數周的工作,智能體在單次運行中僅需 7 小時即可完成自主,且實現的結果與參考方法相比達到了 99.9% 的精度。這種能力不僅是速度的提升,更是任務複雜性處理度的變遷。協作部落論與工程師角色的重構隨著智能體承擔了更多的實施工作,一個關鍵的成本分數浮出水面:這種轉型本質上是高度協作的,而不是簡單的替代方案。人類的社會影響團隊研究發現了一個耐人尋味的“協作工作論”:雖然開發人員在約 60% 的中使用了 AI,但他們報告能夠“完全授權”給 AI 的任務比例大約 0-20%。這表明,人工智慧正在成為一個持續的合作者,但有效使用它需要深思熟慮的設定、主動的監督和嚴格的驗證。對於高風險工作而言,人類的判斷力相等。報告強調,未來的軟體工程師將不再是程式碼的編寫者,而是智能體的“編排者”。他們的核心價值將轉移到系統架構設計、智能體協調、質量評估以及將業務轉化為技術路徑的戰略決策問題上。這種角色的轉變反而工程師變得更加“全端”。研究顯示,借助AI補知識空白,工程師現在可以更有效地覆蓋遠端、遠端、資料庫設施和基礎設施等領域工作。究竟需要數周跨團隊協調的任務,現在可以在重點的工作會話中完成。例如,金融科技平台CRED利用Claude Code覆蓋了整個開發生命周期,在保持金融服務的高品質標準的同時,將執行速度提高一倍。另外,生產力的提升在速度上,更體現在財富的“體量”和“廣度”上。人類的內部研究發現,約27%的人工智慧輔助工作由那些“具體不會行動”的任務組成。這包括清理長期積累的技術債務、建構前期因成本過高而被擱置的“錦上添花”的工具,以及進行探索性的原型設計。加拿大電信黨TELUS的團隊在將程式碼交付速度提高 30% 的同時,建立了超過 13,000 個定製的 AI 解決方案,這在傳統模式下是不可想像的。泛化與防禦:程式碼權力的下放與雙刃劍2026年的智能體編碼趨勢開創了專業的軟體工程團隊,它正在向新的領域和使用者群體擴展,推動技術的民主化。首先是語言障礙的消失。智能體編碼將分裂COBOL、Fortran等傳統語言以及特定領域的母語。這將極大地降低繼承系統的所有權,使企業能夠更輕鬆地對核心舊舊系統進行現代化改造。更必然的影響具有非技術角色的賦能。報告預測,來自銷售、行銷、法律和營運等非技術團隊的員工將獲得建構自動化工作流和工具的能力。例如,自動化平台 Zapier 已經實現了全員 AI 普及,設計團隊利用 Claude 在客戶訪談期間即時原型,而這在過去需要數周時間。人性化自身的法律團隊也通過建構自動化合同修訂的工作流,將支出審查的周轉時間從兩周到三天大約達到了 24 小時。然而,這種能力的普及也帶來了“雙重用途”的風險。報告指出,智能體編碼在增強防禦能力的同時,也可能被攻擊者利用。隨著模型變得更加強大,建構行為安全的應用程式變得更加容易,任何工程師都可以在人工智慧的輔助下執行之前需要專家級知識的安全審查和牙齒。但與此同時,威脅能力同時利用相同的擴展攻擊規模。針對這一挑戰,報告建議企業採用“安全優先”的架構。自動化的智能體防禦系統將能夠以機器速度響應威脅,這是對抗自動化攻擊的唯一有效途徑。這要求工程師在設計之初就將安全性嵌入到智能體系統中,而不是作為事後的補充。結語:從增量工具到戰略核心人類的這份聲明清晰地描繪了一個分嶺:2026年,智能體編碼將不再是提高效率的外掛,而是企業參與的核心戰略原動力。早期的採用者與落後者之間的差距正在迅速擴大。對於企業領導者而言,未來的當務之急不僅僅是部署工具,而是掌握多智能體協調的,建立規模化的人機協作監督機制,並賦能整個組織的領域專家。成功的關鍵不是試圖將人類從循環中移除,而是通過智能協作,讓人類的智慧聚焦於最關鍵的決策點。在這個新時代,軟體開發佇列一行行程式碼的編寫,漸進為智能系統的宏大編排。 (21世紀關鍵技術)
DeepSeek-OCR-2 正式上線
DeepSeek-OCR-2 正式上線文件解析性能顯著提升昨天,深度求索(DeepSeek)正式推出新一代文件解析模型「DeepSeek-OCR 2」。該模型採用全新的視覺編碼器架構 DeepEncoder V2,在文件解析能力上實現重要突破。技術架構升級視覺因果流 是核心創新,引入類似大語言模型的因果推理機制,使圖像理解更貼近人類閱讀邏輯。視覺編碼器 DeepEncoder:約3.8億參數,用於圖像轉視覺標記序列解碼器:30億參數 MoE 模型,推理時表現為5.7億參數模型性能表現優異OmniDocBench v1.5 測試得分:91.09%,較上代提升3.73%閱讀順序精準率大幅提升純文字提取精度達97%-98%多模態能力突出不僅限於文字提取,還支援:圖表、公式、化學結構識別表格圖像轉 HTML 或 Markdown豐富結構化輸出,滿足多種場景需求開源策略促進發展MIT 許可證開源,可在 Hugging Face 和 GitHub 獲取支援動態解析度與多裁剪策略提供 Transformers 和 vLLM 推理示例部署靈活性優勢本地運行,保障資料隱私支援自訂輸出格式,提示詞靈活引導適用於敏感文件處理場景技術發展前景未來有望擴展至多模態統一編碼器共享因果推理框架,融合圖像、文字、語音等輸入社區驅動開發,加速模型迭代行業影響初顯推動多模態模型走向開源生態打破傳統OCR服務商壟斷格局降低使用門檻,增強市場活力應用場景廣泛涵蓋 OCR、版面解析、圖像描述等任務適合企業級文件處理與科研機構定製化開發本地部署保障資料安全技術路線清晰雙階段訓練策略:先獨立訓練視覺編碼器,再聯合訓練提高OCR魯棒性與佈局適應性市場定位明確精準性高、靈活性強、成本可控超越部分傳統OCR服務通過社區反饋持續最佳化產品體驗小結DeepSeek-OCR 2 的發佈是開源多模態AI的重要里程碑。它不僅提升了文件解析性能,也通過開源策略賦予使用者更高的自由度和掌控力。這一變革或將重塑OCR服務市場的競爭格局,值得長期關注。 (MaXTe)
Claude Cowork一周半純AI編碼交付—產品和工程研發的新範式
昨天Claude發佈了cowork,一個針對非技術工作者的知識工作工具而據他們產品部門的分享,Cowork 僅用 1.5 周就交付完成,而且程式碼是100% Claude Code生成這開創了AI自我迭代的新範式,也創造了交付速度的記錄“我們人類會面對面地討論基礎架構和產品決策,但我們所有開發人員都會管理 3 到 8 個 Claude 實例,用於實現功能、修復錯誤或研究潛在的解決方案。”Claude Code 的影響力不再僅僅侷限於開發者。非技術人員也用它來建構項目。技術人員也用它來處理非技術工作。技術與非技術之間的界限正在變得模糊。我絕不是第一個想到這一點的人。Anthropic 的多個團隊幾個月來一直在研究“智能體體驗”——Claude 不僅僅是聊天夥伴,還能幫助你完成實際工作。@bcherny提醒我:我們能否利用內部開發成果,在幾天內發佈一個早期精簡版?於是我們組建了一個小團隊,設定了一個緊迫的截止日期(“周一怎麼樣?” ") ,然後就開始工作了。@claudeai寫道:Cowork。我們人類面對面地討論基礎架構和產品決策,但我們所有開發人員都管理著 3 到 8 個 Claude 實例,用於實現功能、修復錯誤或研究潛在的解決方案。對於原生程式碼,我們使用本地機器上的本地 Git 工作樹。對於較小的改動或僅涉及 Web 程式碼的改動,我們只需讓 Claude 去實現即可。當有人在 Slack 中報告 bug 時,我們通常直接 @ 提及 Claude 並讓他修復。所有程式碼在合併前都會由一位人工(以及另一位 Claude)進行稽核,但我們現在大部分時間都花在協調眾多 Claude 的工作和做出決策上,而不是精心編寫每一行程式碼。我們提前發佈了 Cowork。它還有一些不完善的地方。但如今,軟體工程中最難的部分莫過於確定要開發什麼——我們認為,儘早獲得反饋,瞭解使用者的實際需求,才是打造真正優秀產品的關鍵。如下是cowork的系統提示詞(大道至簡不簡單)
OpenAI發佈自主編碼代理Codex,程式設計師的工作將被徹底顛覆?
OpenAI剛剛發佈了全新的自主編碼代理Codex,一個能自己建構功能和修復bug的AI助手!這已經不是簡單的程式碼補全工具,而是能夠獨立完成整個程式設計任務的AI代理。OpenAI CEO Sam Altman 宣佈稱:今天我們推出了codex。它是一個在雲端運行的軟體工程代理,可以為你執行編寫新功能或修復bug等任務。你可以平行運行許多工。並且,Plus 帳號還得等等(我猜是等你充錢成為Pro 帳號):而Codex 是什麼呢?與其他AI編碼工具不同,Codex不是一個聊天介面,而是一個面向任務的工具。你只需描述編碼任務,它就會在沙盒環境中啟動你的程式碼庫,運行測試和程式碼檢查,確保一切正常運行。受OpenAI 邀請,Every團隊已經提前體驗了幾天,Dan Shipper對此印象深刻,還特別邀請了Codex產品團隊成員Alexander Embiricos進行了深度對話,一起來看看這款革命性工具到底有多強!註:本文部分內容參考了Dan Shipper 的使用體驗文章——https://every.to/chain-of-thought/vibe-check-codex-openai-s-new-coding-agentCodex是什麼以及它如何工作?Codex是專為高級工程師設計的自主編碼代理,能夠自動執行加入功能或修復bug等編碼任務。與其他AI編碼工具的最大區別在於,它允許你同時啟動多個會話,讓多個AI代理平行工作。使用者介面非常簡潔,只有一個文字框讓你描述程式設計任務,然後是兩個按鈕:「Ask」和「Code」。這種設計很有深意——它不是一個聊天框,而是一個任務委派介面。當你按下「Code」按鈕後,Codex會將你的任務加入佇列,開始工作。它會在自己的沙盒環境中啟動你的程式碼庫,在那裡可以運行測試和程式碼檢查工具,以便自己捕捉錯誤。但與Devin不同,它還沒有訪問瀏覽器的能力,無法使用它編寫的程式碼來檢查功能是否正常運行。當任務完成後,它會給你一個簡潔的總結和程式碼差異,讓你清楚看到具體做了那些更改。還有一個按鈕可以輕鬆地將這些更改作為PR提交到Github上。Codex被訓練有「品味」OpenAI通過強化學習對Codex進行了微調,讓它掌握了專業軟體工程師的技能——如何編寫良好的PR標題和描述,如何處理大型混亂的程式碼庫,如何以及何時運行測試等等。訓練團隊向Codex展示了大量程式碼庫——既有乾淨的也有混亂的——這讓它感覺自己擁有更多實際經驗,最關鍵的是,比其他編碼模型有更好的品味。這一點很明顯:Codex產生的程式碼簡潔、精煉,總結也簡明扼要。Dan 親自體驗了這一點,Codex成功地一次性完成了他們內部應用Paradigm的樣式修復。還有一次,他讓Codex給他們的郵件助手Cora加入一個新功能——保存UI展開和摺疊狀態——Codex也迅速而出色地完成了。「豐富思維模式」最適合與代理互動Codex的設計鼓勵一種特殊的使用方式:它強調建立小型、自包含的任務,這些任務轉化為小型、易於審查的PR。這使其非常適合在生產環境中工作的專業軟體工程師,因為它使跟蹤和理解程式碼庫的變化變得更容易。這種方式讓你從程式設計師變成了管理者,如在最初使用Devin時的體驗——就像大學時代玩線上撲克,可以同時運行3-4個桌子,或者,多個窗口倍速同時看不同集的電視劇😂Dan和Kieran的體驗很能說明問題:我昨晚花了大約一小時與Kieran一起結對程式設計,我們聊天的同時向Codex傳送任務,然後測試返回的結果。這是一種更加社交化的程式設計模式,因為使用Codex時你可以分散注意力。這種「豐富思維模式」讓使用者能夠同時委派多個任務而不陷入細節。這允許你將大量代理指向特定任務,比如一個難以解決的bug——即使只有一個成功,也是值得的。Codex的不足之處Codex雖然強大,但也有明顯的侷限性。首先,它不是聊天產品,它位於與ChatGPT分離的介面中,明顯是圍繞特定工作流建構的:給它一個編碼任務,得到一個完成的結果。它對後續請求處理不佳。如果你要求它建構一個功能,然後意識到你想加入或修改它所建構的內容,後續請求是否有效完全是個賭博。因此,它對資歷較淺的工程師不太友好,更適合小型、自包含的任務。如果你像高級工程師一樣在腦中瞭解整個系統的工作原理,並確切知道要建構什麼,你可以將請求輸入任務框並繼續你的一天。如果你更喜歡來回聊天一段時間來確定要建構什麼以及如何完成,Codex將無法很好地工作。此外,它還沒有與大多數工程環境(如Github和Slack)完全整合。雖然它可以向Github發佈PR,但不能響應PR上的評論告訴它需要更改什麼。這些功能可能會隨著時間的推移而加入,但目前增加了一些使用摩擦。OpenAI對代理的思考Codex是OpenAI最終想要建構的統一超級助手的一部分——一個能幫助使用者輕鬆完成任務的代理,在幕後為他們選擇合適的工具。而OpenAI似乎正從兩個角度攻克程式設計問題:考慮到OpenAI報導收購AI編碼代理Windsurf,似乎OpenAI正從兩個角度攻克程式設計。一旦Windsurf完全整合到其生態系統中,它將提供程式設計師和AI之間緊密、協作的程式設計體驗。而Codex則是為自主委派而建構的。這讓我不禁想起OpenAI的另一個產品Operator,它也是分離出來的獨立工具,因此使用者必須記得使用它。由於更加專業化,它的靈活性也相對較低。自Operator五個月前推出以來,我們還沒有看到任何重大更新——考慮到OpenAI報導收購Windsurf,我懷疑Codex是否會有同樣的命運。程式設計的未來OpenAI 對程式設計未來的願景是什麼?未來開發人員可能會花更少的時間編寫常規程式碼,而花更多時間指導代理、審查他們的工作並做出戰略決策。程式設計將變得更加社交化,讓團隊可以輕鬆地同時委派多個任務,讓人們專注於想法和協作而不是常規編碼。而Codex 或將是是自主程式設計的下一步,但我們還需要一段時間才能知道它是否恰好是展現程式設計未來的產品。一方面,OpenAI為高級工程師製作了一個程式設計工具並取得了成功。高級開發人員通過能夠同時啟動多個建構良好的任務獲得了不錯的生產力提升。它還改變了編碼的體驗,如Dan所述,使用Codex進行編碼時可以分散注意力,這是一種更加社交化的程式設計模式。但另一方面,發前所述,Codex讓我想起OpenAI的電腦使用代理Operator——它被分離成自己的工具,所以必須記得使用它。或許,Codex 會走向和Operator 同樣的結果。而且因為它更專業化,所以本質上更不靈活。又或許,使用者會希望能夠在不同的任務和一天中的不同時間段之間來回切換這兩種工具。伸手測試伸手測試的結果顯示:Kieran(已接受代理理念的技術領導者):是的,他一直在思考如何使用它。Dan(技術愛好者CEO,周末編碼愛好者):否,但這是因為他通常是在編寫全新的想法而不是現有產品。總體評價:如果你是技術領導者,在現有程式碼庫上加入功能或修復bug,你會想要使用它。如果你想要建立一個新的「一人十億美元SaaS公司」,去別處看看吧。註:伸手測試"Reach Test" 是Dan Shipper提出的一個概念或測試標準,用來評估AI產品的實用性和長期價值。AI產品長期實用性的最佳領先指標是什麼?我稱之為“伸手測試”——我是否發現自己自動轉向這個工具來完成某些任務?還是我只是把它放在架子上忘記它的存在?簡單來說,這是一個判斷AI工具實際價值的直觀測試:如果你在需要完成特定任務時會自然而然地“伸手”去使用這個工具,說明它確實有用且融入了你的工作流程;如果你總是忘記使用它,那麼不管它多麼先進,實際價值都會有限。這實際上是一個很實用的評估新技術工具價值的方式,關注的是使用者的自然傾向和實際使用習慣,而不僅僅是技術規格或能力。而顯然,Codex不是一個「隨性編碼」的能通過伸手測試的工具。我能看出它不是為了取代高級軟體工程師而建構的,而是作為他們的工具。但無論如何,Codex的出現標誌著自主程式設計的新時代即將到來。對於高級開發人員來說,這是一個強大的生產力提升工具;對於整個行業來說,這預示著程式設計方式的根本轉變。 (AGI Hunt)
30億收購!OpenAI憑什麼敢重金壓碼?
你還在用ChatGPT聊天?巨頭們已經開始了一場新的佈局!🔥震撼消息:AI巨頭OpenAI正以30億美元天價洽購編碼工具Windsurf!這一手筆不僅是OpenAI史上最大收購,更是AI行業新一輪洗牌的開始。為何一家編碼工具公司值這麼多錢?這背後暗藏著怎樣的野心?👀編碼即競技場:巨頭們的下一個必爭之地AI輔助編碼不再是小眾技術,而是科技巨頭們的必爭之地。想像一下:只需用日常語言描述需求,AI就能自動生成完整程式碼,這不僅改變了程式設計師的工作方式,更顛覆了整個軟體開發行業!Windsurf(前身為Codeium)成立僅3年,卻已吸引超2億美元投資,估值從去年的12.5億美元飆升至今日的30億美元。這家公司到底有什麼魔力?答案簡單:在AI編碼這個風口,誰能領先一步,誰就能掌握下一代技術革命的入場券。💰合併潮來臨:吃與被吃的生存法則隨著AI領域競爭加劇,"大魚吃小魚"已成常態。OpenAI此前已悄然收購了Rockset和Multi,而此次對Windsurf的收購將直接對標Anthropic、微軟Github和Anysphere等強勁對手。考慮到OpenAI剛剛完成400億美元融資,估值高達3000億美元,這筆30億的收購對它而言不過是小菜一碟。但對整個行業而言,這是一記響亮的訊號:整合時代已經到來,獨立生存將越來越難!⚔️贏家通吃的AI未來在這場AI競爭中,勝者將獲得巨大的技術優勢和市場份額。OpenAI通過收購Windsurf,不僅獲得了頂尖的AI編碼技術,更打通了程式碼生成與其現有AI模型的聯絡,為使用者提供從創意構思到程式碼實現的一站式解決方案。這樣的戰略佈局,將使OpenAI在與Google、微軟、Anthropic的競爭中佔據更有利位置。而對普通使用者來說,意味著更智能、更強大的AI工具即將到來!🚀當AI能夠編寫複雜程式碼,當創意變成現實只需一句指令,我們的工作方式、學習方式甚至思考方式都將被徹底改變。你如何看待這場AI巨頭的收購戰?AI編碼工具會讓程式設計師失業還是創造新機會?歡迎在評論區分享你的觀點,也別忘了轉發給關注科技的朋友,一起見證這場改變世界的技術革命! (澤問科技)