#智能體
“龍蝦”加速上車
以自我進化、主動執行為特徵,還能夠統一呼叫所有APP的OpenClaw(龍蝦)是當前科技圈的“流量擔當”。在剛剛結束的北京國際車展,“龍蝦上車”成為觀眾體驗和產業關注的焦點,也讓公眾對於汽車邁向“移動智能體”的未來充滿期待。 在智能座艙日益成熟的當下,“龍蝦”為駕乘人員帶來那些新體驗? 首先是對複雜任務的拆解、規劃和執行能力。相比傳統語音助手“使用者說一條命令它就執行一條命令”的互動模式,“龍蝦”能夠聽懂複雜的指令,將其拆解為數個需求。記者在斑馬智能的AutoClaw(斑馬智能發佈的“龍蝦上車”方案)智艙協作實車上,體驗了這樣一個場景——當駕駛員提議今晚和同事們小聚一下,AutoClaw先是根據駕駛員平時和同事聚會的偏好,推薦了幾家餐廳,但駕駛員表示自己決定不了,要結合大家的意見。於是,AutoClaw通過釘釘與幾位同事聯絡,確認他們有沒有聚會的意願。如果想去,各自從那裡出發、想去推薦的那一家餐廳,並及時向駕駛員和同事反饋彼此的意見,最後定下來一個大家都能接受的餐廳,並打電話預定位置。在這個過程中,AutoClaw還要應對一些意外情況,比如一位同事提出喝點酒,AutoClaw就要考慮在大家都不能開車的情況下,是在路上順路買酒,還是去線上商城下單等更加細節的問題。 斑馬智能AutoClaw展示同事們對聚餐的意見
1900億砸向AI後,銀行開始算帳了
1900億元投入之後,銀行業的AI故事開始進入算帳階段。 翻看20家A股主要上市銀行2025年財報,金融科技仍是最醒目的關鍵詞:15家披露相關投入的銀行合計投入接近1900億元;人員配置方面,上海銀行科技人員佔比12.06%,興業銀行11.96%,也就是說它們每8個員工裡,就有約1個是科技人員;“AI”“人工智慧”“大模型”“智能體”幾乎塞滿了年報裡的科技章節,成為銀行數位化轉型的新標配。 但真正把AI產出量化到“人年”“工時”“業務增量”的,仍是少數。和過去幾年不同,銀行不再只講“投了多少、建了多少、上線多少場景”。在淨息差持續承壓、利潤增長放緩、降本增效成為行業共同命題之後,AI投入開始被放到更硬的帳本上衡量:它到底節省了多少工時,替代了多少重複勞動,提升了多少客戶觸達,提前識別了多少風險,又能不能最終轉化為收入、利潤和資產質量改善。 這意味著銀行AI進入了下半場。上半場,比的是誰敢投入、誰先佈局、誰把大模型寫進戰略;下半場,比的是誰能把模型嵌進真實業務,把智能體從演示場景拉進客戶經理、風控審批、財富管理和營運後台。銀行不是科技公司,不能只靠想像空間定價。對它們而言,AI如果不能被審慎計量,最終就會從“未來引擎”變成新的成本黑洞。1900億元之後,真正的問題不再是銀行要不要AI,而是每一筆AI投入,能不能被算清楚。
AI Agent 企業級落地:主動演進,還是被動融入?
一、當“智能體”不再只是概念,企業為何仍在徘徊?2025年以來,AI Agent從技術圈的討論熱點迅速蔓延至企業戰略層。德勤在近期報告中指出,Agentic AI正在從“提效工具”向“決策核心”躍遷,企業面臨三大路徑選擇。然而,與輿論熱度形成反差的是,多數企業在實際落地中依然舉棋不定或舉步維艱:技術架構選型混亂、組織流程未做相應調整、投入產出難以量化。一個更本質的問題擺在面前:AI Agent究竟是一場技術升級,還是一次組織變革?如果答案是後者,那麼單純採購工具或搭建平台,很可能只是“新瓶裝舊酒”。二、從“人機協作”到“智能體協作”的結構性重構AI Agent在企業中的業務模式,並非簡單的“把流程自動化”,而是在認知層面實現了三重躍遷:從規則執行到意圖理解、從單點任務到多步推理、從被動響應到主動規劃。這意味著企業需要重新定義人與機器的分工邊界。例如,在客戶服務場景中,Agent不再只是回答預設問題,而是能根據上下文主動提出解決方案;在供應鏈管理中,Agent可以即時協調庫存、物流與需求預測,形成動態決策閉環。這種結構性重構要求企業將業務流拆解為“可Agent化”的原子單元,並建立資料中台與知識圖譜來支撐Agent的推理基礎。三、降本、增收與新商業生態的三重變現從AI Agent盈利模式來看,並非單一線性。首先,最直接的收益來自營運效率提升:通過替代重複性認知勞動(如報告撰寫、資料分析),企業可大幅削減人力成本,行業實踐顯示成熟場景可實現顯著成本最佳化。其次,Agent能通過精準推薦與即時最佳化創造增量收入,例如電商平台利用Agent進行動態定價與個性化行銷,轉化率提升顯著。更深遠的模式在於,企業可將Agent能力封裝為訂閱式服務或API介面,輸出給上下游合作夥伴,形成平台化收益。不過,盈利的可持續性取決於Agent的“可復用性”與“可擴展性”,這要求技術架構天然支援跨場景遷移。四、認知推理、自主規劃與系統協同的不可替代性與傳統RPA(機器人流程自動化)或決策樹相比,AI Agent的核心優勢體現在三個維度:一是認知推理能力,Agent不僅能執行指令,還能理解模糊意圖並分解任務;二是自主規劃能力,面對複雜問題可動態生成執行路徑,並在執行中根據反饋調整;三是系統協同能力,通過A2A協議實現跨Agent、跨系統的資訊交換與任務編排。亞馬遜AWS的實踐表明,企業級Agentic架構需要將推理引擎、記憶模組、工具呼叫與安全護欄四個核心模組解耦設計,才能兼顧靈活性與可控性。這種優勢使得Agent能夠處理那些“規則寫不清楚、但人可以憑經驗處理”的灰色地帶任務,從而真正替代部分腦力勞動。五、四大落地路徑的適用場景與取捨邏輯當前市場上,企業級AI Agent的建構大致可以歸納為四種主流形態:技術編排流、模型生態流、獨立極客流和業務底座流。技術編排流強調通過低程式碼平台(如LangChain)編排LLM與外部工具,適合快速原型驗證,但長期維護成本高;模型生態流依附於單一供應商(如OpenAI的GPTs),生態成熟但存在被鎖定的風險;獨立極客流追求完全自研Agent框架,技術壁壘高,僅適合AI能力強的企業;業務底座流則將Agent深度嵌入企業原有業務系統(如ERP、CRM),通過“場景驅動”逐步擴展,是當前大中型企業的主流選擇。比較而言,業務底座流在深度與靈活度之間取得了較好平衡,但其對組織資料的標準化要求極高,這恰恰是許多企業的短板。六、技術碎片化、組織壁壘與評估缺失的三重困境儘管前景誘人,AI Agent在真實環境中的落地仍面臨嚴峻挑戰。第一,技術碎片化:不同Agent框架之間缺乏統一介面,Google雖提出A2A協議,但產業落地仍需時間;同時,Agent的“幻覺”問題尚未根本解決,在高風險場景(如金融交易)中可能造成嚴重後果。第二,組織壁壘:Agent的跨部門協作需要打通資料孤島,這往往觸及既得利益與流程慣性,行業調研顯示,組織適配不力是企業落地失敗的首要原因,遠高於技術因素。第三,評估體系缺失:傳統KPI無法衡量Agent的“決策質量”或“自主程度”,企業難以判斷投入是否有效。德勤建議建構“Agent-ready”的內生能力,包括人才、流程與治理的同步轉型,但這需要管理層自上而下的決心。七、資料主權、倫理邊界與可解釋性的底線要求合規風險是AI Agent從試點走向規模化的“一票否決項”。首先,Agent在感知與推理過程中會大量接觸企業內部敏感資料(如客戶資訊、財務資料),一旦通過工具呼叫洩露至第三方模型,將觸犯資料安全法。其次,Agent的自主決策可能產生歧視性結果或意外行為,比如在招聘場景中因訓練資料偏差而拒絕特定背景的候選人,這不僅涉及倫理問題,還可能引發法律訴訟。此外,Agent的“黑箱”特性使得審計困難,金融、醫療等強監管行業要求決策可追溯、可解釋,而當前主流大模型尚難完全滿足。企業應在架構層面嵌入“安全護欄”,包括權限分層、資料脫敏、人工審批節點與行為日誌,同時為Agent設定明確的“決策紅線”,確保任何情況下人類都有最終干預權。八、從“能力孵化”到“生態融合”的演進路線展望未來,AI Agent在企業側的演進將遵循“試點→平台化→生態化”的三步曲線。短期(1-2年),企業應聚焦高價值、低風險的場景(如智能客服、知識管理),通過“人機協同”積累經驗;中期(3-5年),隨著A2A協議與安全標準成熟,Agent將從單點工具演化為企業級數字員工平台,支援跨系統編排與動態擴展;長期(5年以上),Agent將深度融入產業鏈,形成跨組織的智能協作網路,正如雲端運算重塑IT基礎設施一樣重構商業邏輯。對企業家而言,現在的關鍵可能已經不是追問“要不要用Agent”,而是思考“如何設計Agent的組織介面”:誰為Agent的結果負責?Agent與員工之間如何考核、問責、協作?這些組織適配問題,遠比技術選型更能決定成敗。建議企業設立“AI Agent治理委員會”,由業務、技術、法務代表共同制定使用手冊,並定期開展壓力測試,在可控範圍內加速探索。 (數字新財報)
Google掀桌:深度研究智能體進入自動駕駛時代
OpenAI剛用Deep Research搶了先手,Google直接掀桌!DeepMind祭出研究智能體雙殺,Max版質量評分從66.1%暴拉到93.3%,知識工作自動化的軍備競賽正式進入貼身肉搏。在AI智能體上,Google這次又放出了個大招。4月末,GoogleDeepMind一口氣甩出兩款AI研究智能體。Deep Research(標準版):追求速度和低延遲,適合即時互動Deep Research Max(增強版):追求最大詳盡度,用擴展test-timecompute非同步跑後台大任務兩個智能體都基於剛發佈的Gemini 3.1 Pro。GoogleCEO Pichai也親自下場站台。Max版在三個權威基準測試中都拿到了SOTA得分:DeepSearchQA:93.3%,綜合網頁研究能力BrowseComp:85.9%,在網頁上定位難找事實Humanity's Last Exam(HLE):54.6%,人類最難學科專家級題庫這兩個智能體干的事情很直白:你給一個研究課題,它自己去網上扒資料、分析資料、生成帶圖表的完整報告。標準版處理日常研究任務,Max版專攻重度場景:盡職調查、競品分析、市場研報,那種過去要一個分析師團隊干兩天的活。Max版在DeepSearchQA基準上達到93.3%。什麼概念?去年12月同一項測試,成績是66.1%。四個月,漲了27個百分點!Humanity's Last Exam上也從46.4%拉到54.6%,直接刷新紀錄。有使用者表示日常版本的標準版即可代替日常的文獻研讀。知識工作的自動駕駛時代一個值得玩味的趨勢正在成型:AI研究工具正在從「輔助搜尋」進化成「自主研究」。過去的AI搜尋是你問一句、它答一段。現在的研究智能體是你丟一個課題,它自己跑幾十輪搜尋-分析-驗證循環,最後交一份成品報告。區別就像導航軟體和自動駕駛的距離。Google、OpenAI、Anthropic三家同時押注這個方向。Anthropic的Claude在程式碼智能體上猛攻,OpenAI用Deep Research搶佔研究場景,Google現在帶著93.3%的成績單殺回來。Pichai親自在發佈會上強調93.3%這個數字。他說這是通過增加計算資源達到的。意味著,只需花更多的電,就能得到更準的答案。計算資源成了新的入場券。小公司買不起。獨立顧問付不起。只有大企業才付得起。這不是工具升級。這是商業模式的代際替換。從「摘要機器」升級成企業工作流底座去年12月,Google通過Interactions API向開發者開放了Gemini Deep Research智能體,讓開發者能用上Google最前沿的自主研究能力。今天,Google把它推到下一個台階。Deep Research和Deep Research Max兩款智能體都由Google最強的模型Gemini 3.1 Pro驅動。Deep Research已經不再是一個聰明的「摘要機器」了。它現在是金融、生命科學、市場調研等企業級工作流的底層基礎設施。它的報告本身有獨立價值,但更重要的是——它是更複雜的AI智能體工作流的第一步:深度上下文收集。一次API呼叫,開發者就能觸發一次徹底的研究工作流——史上第一次,把公開網頁資料和你自己的專有資料流融合在一起,輸出一份專業級的、帶完整引用的分析報告。兩款智能體,匹配不同場景Google設計了兩款智能體,對應從直接面向使用者到大規模離線處理的不同需求。Deep Research(標準版)為速度和效率而生。它取代了去年12月的預覽版本,顯著降低了延遲和成本,同時把質量拉得更高。適用場景:需要低延遲的互動式使用者介面。Deep Research Max(增強版)為最大詳盡度和最高品質而生。Max利用擴展的test-timecompute(測試時計算),反覆推理、檢索、精煉最終報告。打通私有資料+原生圖表Deep Research現在可以檢索:公開網頁任意遠端MCP伺服器使用者上傳的檔案連接的檔案儲存或以上任意子集的組合。這套能力是專門為專業人士每天面對的複雜受限資料宇宙設計的。MCP協議支援(最關鍵的一項)你可以通過MCP協議,把Deep Research安全地連接到你自訂的資料和專業資料流——比如金融資料供應商、市場資料供應商。Deep Research支援任意工具定義。這讓它從一個網頁檢索器升級成了能在任意專業資料倉儲裡自主導航的智能智能體。過去分析師吃飯的傢伙(彭博、FactSet、S&PGlobal終端),現在AI可以直接接入、自主查詢、綜合分析。原生圖表與資訊圖Gemini API裡的Deep Research第一次——不再只生成文字,還原生生成高品質的圖表和資訊圖。底層實現用HTML或Nano Banana。動態可視化複雜資料集,直接嵌入分析報告中。過去一個分析師用Tableau/PowerPoint做2小時的圖表,Deep Research Max直接在報告裡原生生成。不用切換工具,不用再折騰對齊。重磅合作夥伴為了讓這項技術在低容錯率的專業領域真正落地,Google正在和金融、生命科學等行業的初創公司和企業密切合作。比如——Google正在與以下三家公司合作設計MCP伺服器:FactSet(華爾街分析師標配終端)S&PGlobal(標普全球評級與資料)PitchBook(私募股權與風險投資資料庫)讓共享客戶可以把金融資料接入Deep Research驅動的工作流,以閃電般的速度調取這些公司各自的海量資料宇宙,實現生產力的階躍式提升。延伸解讀:FactSet+S&P+PitchBook=全球投行、PE、諮詢公司研究素材的三大上游供應商。它們主動把自己的資料接入Google的AI——意味著分析師過去賴以生存的資料訂閱護城河徹底消失。過去你因為能用上這些資料而值錢,現在任何一個企業訂閱了Deep Research都能用上。如何使用即日起,Deep Research和Deep Research Max在Gemini API付費層開啟公開預覽。開發者可以訪問Google官方開發者文件,通過Interactions API開始建構。Deep Research和Deep Research Max很快也會通過GoogleCloud開放給初創公司和企業。Google做好了一個能替代分析師的AI,現在所有企業都可以用API呼叫它。 (新智元)