騰訊研究院AI速遞 20260126

2026/01/26

•

一、OpenAI Codex預告，今先揭秘Codex CLI核心智能體循環

1. OpenAI CEO奧特曼預告下周起將發佈Codex相關重磅內容，官方同步發佈技術部落格揭秘Codex CLI核心架構——智能體循環；

2. 智能體循環通過Responses API協呼叫戶指令、模型推理與本地工具執行，採用"提示詞前綴一致"策略觸發快取最佳化性能；

3. Codex支援零資料保留配置保障隱私，利用自動壓縮技術管理上下文窗口，後續將深入介紹工具呼叫和沙箱模型。

二、Google DeepMind 發佈 D4RT，徹底顛覆了動態 4D 重建範式

1. GoogleDeepMind發佈D4RT，將3D重建、相機追蹤、動態物體捕捉統一成"查詢"動作，速度比現有SOTA快18至300倍；

2. 核心創新是統一的時空查詢介面，AI先全域"閱讀"視訊生成場景表徵，再按需搜尋任意像素的3D軌跡、深度和位姿；

3. 該技術對具身智能、自動駕駛和AR意義重大，讓AI即時理解動態環境，但訓練仍需10億參數模型和64個TPU。

三、Claude Code 宣佈重磅升級：將內部的Todos升級為 Tasks

1. Claude Code將內部"Todos"升級為"Tasks"，支援多會話或子代理協作完成跨越多個上下文窗口的長期複雜項目；

2. Tasks儲存在檔案系統中便於多個會話協同，當一個會話更新Task時會廣播給所有處理同一任務列表的會話；

3. 新功能適配Opus 4.5更強的自主運行能力，使用者可通過環境變數讓多個會話在同一任務列表上協作。

四、文心5.0正式版發佈，霸榜LMArena的最強文科生強在那

1. 百度文心5.0正式版上線，參數量達2.4兆，採用原生全模態統一建模技術，支援文字、圖像、音訊、視訊的理解與生成；

2. 在LMArena文字和視覺理解榜單五次登頂，進入全球第一梯隊，語言與多模態理解能力穩居國際領先；

3. 實測顯示模型在複雜情感理解、弦外之音分析、創意寫作等文科任務表現突出，被稱為"最強文科生"。

五、Clawdbot刷屏，AI智能體+閘道器，現階段使用請注意風險

1. 開放原始碼專案Clawdbot在矽谷爆火，可在Mac mini上運行，兼具本地AI智能體和聊天閘道器雙重身份，通過WhatsApp、iMessage等隨時對話；

2. Clawdbot解決了大模型記憶力痛點，能記住兩周前的對話，還會主動推送郵件、日程提醒，並可直接操控電腦執行任務；

3. 項目GitHub獲9.2k星，最低月成本約25美元，但需要一定技術基礎部署，使用者反饋它能自動管理生意、寫程式碼替代Zapier等付費服務。

六、LeCun創業官宣核心方向，掀起對Next-token範式的「叛變」

1. 圖靈獎得主LeCun創立的AMI Labs官宣核心方向為"世界模型"，旨在建構理解現實世界、具備持久記憶和推理規劃能力的智能系統；

2. 該路線認為僅靠預測下一個token無法真正理解現實，需在更高層次表徵空間進行預測與推理，過濾不可預測的噪聲資訊；

3. AMI Labs據傳正以35億美元估值融資，目標應用於工業控制、機器人、醫療等對可靠性要求極高的領域。

七、實測：Claude in Excel，能聯網、能做表、辦公完全自動化

1. Anthropic推出Claude in Excel外掛，支援Pro、Max、Team、Enterprise使用者，基於Opus 4.5模型，可通過Microsoft Marketplace安裝啟動；

2. 外掛能聯網搜尋並自動填充表格，支援讀取公式、Debug錯誤、從零建模、製作透視表等功能，支援.xlsx和.xlsm格式；

3. 當前不支援條件格式、宏和VBA，官方提醒存在prompt injection風險，建議只用可信來原始檔，高危函數會彈確認框。

八、Claude Code之父最新私教課：手把手教你Claude Cowork

1. Claude Code創造者Boris Cherny詳解Cowork使用方法，強調將其當作"執行者"而非聊天工具，可直接操控檔案、瀏覽器和各類工具；

2. 在之前X推文基礎上，再次強調：核心工作流是平行運行多個任務照看Claude們，先用"計畫模式"來回溝通直到滿意，再切換"自動接受編輯"模式執行；

3. 強調Claude.md作為團隊複利式知識庫的重要性，任何Claude犯的錯都應加入進去，以及給Claude驗證輸出的方式能顯著提升質量。

九、Google總監警告：只會寫Prompt的程式設計師，2026年將被淘汰

1. Google雲AI總監Addy Osmani警告"氛圍程式設計"已撞南牆，AI能完成70%前期工作但剩餘30%只有經驗豐富的工程師能搞定；

2. Stack Overflow調查顯示開發者對AI精準性信任度從40%降至29%，73%受訪者遇到過氛圍編碼導致的程式碼理解問題；

3. 2026年真正核心競爭力是把模糊問題轉化為明確執行意圖、設計好上下文結構，以及區分真正重要的東西。

十、「AI 無處不在」的達沃斯論壇，科技巨頭們都說了那些金句？

1. 馬斯克預測2026年底前AI將超越人類智慧，到2030年AI將比全人類集體智慧更聰明，特斯拉明年底將開售人形機器人Optimus；

2. 微軟CEO納德拉警告若AI只消耗資源不改善結果社會會失去容忍，黃仁勳稱具身智能是"一代人一次的機會"；

3. DeepMind CEO哈薩比斯認為AGI還需5-10年，Anthropic CEO達里奧稱只差6-12個月模型就能端到端完成軟體開發。 (騰訊研究院)