騰訊研究院AI速遞 20250530

2025/05/30

•

生成式AI

一、新版DeepSeek-R1正式開源！已放出權重！直逼o3程式設計

1. DeepSeek-R1新版本正式開源，程式設計能力超越Claude 4 Sonnet，與o4-mini(Medium)性能相當；

2. 新模型核心優勢包括深度推理能力、自然文字生成、支援30-60分鐘長時思考，一次運行即可完美執行複雜程式碼；

3. 實測表明在3D動畫、網站設計和複雜推理問題上表現優異，思考過程更穩定，能完整處理長鏈條推理。

二、可靈2.1剛剛上線，價格降了65%，更快、更聽話、也更強

1. 可靈2.1正式上線，價格降低65%，效果、速度均有提升，形成標準版、高品質版、大師版三檔清晰分層；

2. 高品質版(35靈感值)效果媲美舊版大師版，1080P畫質，運動效果出色，普通創作需求足夠，但僅支援圖生視訊；

3. 新版本性價比顯著提升，普通使用者適合選擇2.1高品質版，而商業級製作可搭配2.1大師版，讓AI視訊創作更加親民。

三、一天內完成更新！騰訊多款產品接入DeepSeek R1最新版

1. 騰訊元寶、ima、搜狗輸入法、QQ瀏覽器等多款產品已率先接入DeepSeek R1-0528最新版，從開源到上線僅用不到1天；

2. 使用者可在騰訊多款產品中選擇DeepSeek模型R1深度思考，實現免費不限量使用

3. 騰訊將堅持雙模型驅動，始終選擇更好、更先進的模型，並第一時間部署上線，始終為使用者打造「好用的AI」

四、 Opera瀏覽器迎來了新成員Opera Neon“AI Agent”瀏覽器

1. Opera發佈AI時代入口級產品Opera Neon，這是首款"AI Agent"瀏覽器，旨在重新定義瀏覽器在代理網路中的角色；

2. Opera Neon由三大功能組成：Neon Chat(聊天)、Neon Do(執行網頁任務)和Neon Make(複雜創作)，能夠理解使用者意圖並轉化為行動；

3. Neon Make是最具創新性功能，利用雲技術執行複雜任務如生成報告、設計遊戲原型和建構Web應用，在使用者離線時也能工作。

五、 3D大模型明星初創VAST推出的Tripo Studio四功能升級

1. VAST升級Tripo Studio，推出四大核心功能：智能部件分割、貼圖魔法筆刷、智能低模生成和萬物自動綁骨，實現從"給模型"到"交成果"的質變；

2. 智能部件分割實現一鍵拆建，可精準識別模型各部分；貼圖魔法筆刷簡化貼圖修復流程；智能低模生成在保留細節前提下大幅減少面數；

3. 萬物自動綁骨功能能識別各類生物力學特徵並快速完成骨骼權重分配，非專業人士也能完成全流程3D創作，效率提升10倍以上。

六、兩位自動駕駛大牛創業世界模型：40毫秒/幀，即時可互動

1. 自動駕駛大牛Oliver Cameron和Jeff Hawke創立Odyssey，推出世界模型實現視訊即時生成，速度達40毫秒/幀，支援即時互動；

2. 該技術區別於傳統視訊模型，通過真實生活視訊學習像素和動作，採用窄分佈模型架構解決自回歸建模挑戰，無需遊戲引擎即可實現持續生成；

3. Odyssey已獲2700萬美元融資，當前預覽版由H100 GPU叢集支援，輸出30FPS的5分鐘連貫互動視訊，使用者可免費體驗，開啟世界模型的新階段。

前沿科技

七、又有一個 AI Scientist 的論文通過了頂會同行評審，叫Zochi

1. AI科學家Zochi的論文被頂會ACL主會錄用，成為首個獨立通過A*等級會議同行評審的AI系統，Beta測試同日上線；

2. Zochi的論文《Tempest: 基於樹搜尋的大型語言模型自主多輪越獄》展示了其多輪攻擊方法，在GPT-3.5上成功率達100%，GPT-4上達97%；

3. Zochi能自主完成從文獻分析到同行評審的科學研究過程，論文質量高，但其公司曾引發學術界對科學同行評審過程被濫用的批評風波。

八、從實驗室到茶水間，可量產十萬內全尺寸具身機器人Wanda 2.0

1. 優理奇推出的輪式雙臂機器人Wanda 2.0售價8.8萬元起，已量產交付，具備自主完成複雜長序列任務的能力；

2. Wanda 2.0搭載融合觸覺的預訓練多模態大模型UniTouch和長序列任務規劃模型UniCortex，通過UniFlex模仿學習框架僅需5-10次示教即可學習新動作；

3. 優理奇通過全端自研降低70%成本，面向類C端小B客戶市場，已完成數億元融資，致力於將人形機器人落地商業、安保、娛樂等多種場景。

九、波士頓動力機器人新進展，3D感知+即時追蹤，人類搗亂也不怕

1. 波士頓動力Atlas機器人重磅升級，具備3D空間感知和即時物體追蹤能力，可360°旋轉頭部和腰部，在汽車工廠中執行複雜工業任務；

2. 技術核心包括2D物體檢測系統(識別邊界框和關鍵點)、基於關鍵點的3D空間定位以及SuperTracker物體位姿跟蹤系統，能應對物體遮擋和位置變化情況；

3. 系統融合運動學資料、視覺資料和力反饋，通過"渲染-比較"方法估計位姿，實現精確手眼協調，團隊正致力於建構統一基礎模型，推動感知與動作融合。

報告觀點

十、 Google CEO Pichai：AI 比網際網路還大，未來將是多終端平行

1. Google CEO Pichai認為AI是比網際網路更大的平台級變革，已進入"研究變為現實"的全面展開期，未來將走向多終端平行；

2. AI進入建構可用產品的第二階段，搜尋正轉變為能代表使用者執行任務的Agent，並將創造Web 2.0等級的殺手級應用；

3. AI帶來的關鍵變革在於互動方式轉變和創作門檻降低，第三階段將是AI與物理世界結合形成通用機器人系統，XR眼鏡等AI原生硬體將成為下一個平台突破口。 (騰訊研究院)