#Agent
Google CEO:幾乎所有軟體,都要重做一遍
2026 年 4 月 7 日,Google CEO Sundar Pichai 在最新訪談中表示:幾乎所有的軟體,都將面臨一次重新建構。核心原因在於,使用者的互動方式正在發生改變。搜尋正從“返回結果”向“執行任務”演進;使用者不再需要手動、分步驟地操作軟體,而是直接下達目標,由系統自主完成。這種轉變離不開 AI 智能體的參與。目前,Google內部的一些團隊已經開始使用智能體協作工具。Pichai 預計,2027年將會是這場變革的拐點。那麼,軟體重構究竟會如何發生?Google在實踐中遇到了那些具體阻礙?這個重塑的過程又將持續多久?接下來我們將深入探討。第一節|互動範式的底層解構Sundar Pichai 在訪談中提到一個關鍵概念:未來的搜尋,將演變成一個 Agent(智能體)調度中心。這個說法的核心不在於搜尋業務本身,而在於使用者與系統互動方式的根本性更迭。傳統搜尋遵循“檢索-篩選”模式:輸入關鍵詞,獲取排名連結,然後由使用者自己去閱讀和操作。這是一個“你發出指令,它被動響應,你再繼續操作”的單向且割裂的過程。但現在的搜尋,已經開始接管長周期、多步驟的複雜任務。你得到的不再是一堆網頁連結,而是能看到一個正在推進的“研究過程”。以Google內部正在使用的 Antigravity 系統為例:它能夠同時調度多個 Agent 平行工作,各自負責任務的不同模組,最終彙總交付。伴隨著底層硬體形態和輸入輸出方式(I/O)的根本性改變,軟體原有的互動邏輯必須被重寫。過去的 UI 介面是為“人類手動操作”設計的:按鈕用來引導點選,菜單用來提供選項,路徑依賴人去一步步推進。當任務被全盤交給 Agent 執行時,這些設計就變成了冗餘。你不再需要緊盯每一個操作步驟在那發生,只需關注最終目標是否達成。軟體介面將從“手動操作工具”,徹底轉變為“任務監控面板”。工作流也隨之從“靜態固定”走向“動態生成”。傳統軟體的流程是預設好的,因為機器需要引導人類操作;而 Agent 驅動的軟體,能夠根據當前任務的上下文,即時生成最優的執行路徑。這意味著,那怕是同一個目標,每次的實現方式都可能截然不同。這帶來了一個顛覆性的轉變:軟體正在從“被人操作的工具”,進化為“替人做事的數字員工”。當這種“意圖驅動”的模式成為主流,現有的軟體設計法則無疑將被徹底推倒重來。第二節|“重構”已經在Google內部發生這種底層互動邏輯的“推倒重來”並不只停留在預測層面。在Google內部,舊有的工作流已被打破。目前,Google DeepMind 和部分軟體工程團隊已經全面接入了 Antigravity 系統。正如前文所述,這是一個 Agent調度中樞,工程師們在其中運行各種工作流,將任務交由 Agent 自動完成。上周,這套系統也正式推廣到了Google最核心的搜尋團隊。但這種向 Agent 時代的躍遷,並非一帆風順,他們遭遇了四個具體的落地阻礙:首先是提示詞工程門檻。 工程師需要時間去適應如何向 AI 下達精準指令。這不僅僅是通用的對話技巧,更涉及深度的“企業內部知識”:如何讓 AI 精準呼叫內部工具,如何向 AI 清晰描述內部系統的複雜需求。其次是程式碼協作方式的衝突。 AI 介入後,程式碼的迭代和翻新頻率極高,修改範圍極大。一個人甚至可以在發佈前讓 AI 重寫好幾次程式碼。這導致程式碼庫的變化速度超出了傳統預期,讓傳統的多人協作變得異常困難。第三是資料與權限的壁壘。 解決複雜問題往往需要呼叫企業內部資料,但現有的 IT 權限系統是為“人”設計的,而非為“Agent”設計的。如何界定 Agent 的訪問層級?如何控制它的權限邊界?這些安全機制必須全部重構。最後是組織角色的模糊。 工程師、產品經理、設計師……這些職能邊界都建立在過去的工業化協作模式之上。當 AI 能夠同時包攬程式碼編寫、產品邏輯梳理和介面設計時,原有的角色牆開始坍塌。對此,Sundar 的回應非常務實:Gemini 團隊、Gemini 企業版團隊以及 Antigravity 團隊,正致力於逐一攻克這些痛點。而這些內部踩過的坑和解決方案,正是他們未來的產品路線圖。換言之,Google不只是在描繪軟體重構的願景,而是在內部實踐。他們先在內部使用時遇到問題,開發解決方案,然後把這些方案做成產品推向市場。這個轉變過程對大型組織尤其艱難。因為技術落地的最大阻礙,往往就是組織本身。第三節|時間表與產業跨度跨越組織變革的深水區需要多長時間?Sundar 給出的時間錨點是:2027 年將迎來真正的產業拐點。他提到,屆時一些垂直領域將發生深刻的轉變。以商業資料預測為例,執行者將採用一套完全基於 Agent 的全新工作流。但這必然是一個漸進的過渡期:在很長一段時間內,企業可能會採用“新舊平行”的模式。先用傳統系統校驗 AI 的結果,建立信任後,再逐步完成全面切換。但為什麼到了今年(2026年),這種變革才開始具備大規模推進的條件?Sundar 坦言,此前很多設想無法落地,是因為底層的技術容錯率太低。這就好比你看到了一個充滿希望的新世界,但它的基礎設施卻極不穩定。而到了 2026 年,情況發生了質變:技術曲線迎來了躍升,系統的穩定性終於達到了可以向外推廣的及格線。不過,即便技術就緒,不同企業的轉型節奏也存在巨大的差異。初創公司轉型更容易。這些 AI 原生(AI-Native)團隊從第一天起,就可以按照全新的 Agent 邏輯來搭建組織架構。他們通過招聘篩選具備 AI 協同能力的人才,直接運轉在新的工作流上,無需承擔改造舊系統、重新培訓老員工的成本。大公司則面臨著沉重的歷史包袱。 他們必須在保證龐大業務平穩運轉的前提下,“開著飛機換引擎”。這意味著數以萬計的員工、盤根錯節的舊系統、固化的審批流程,都需要分階段、灰度地進行調整。初創公司可以一夜之間完成系統切換,巨頭卻只能步步為營。這註定了軟體重構將是一場“分層推進”的戰役。一部分前沿企業將在 2027 年完成核心業務的改造,而更多的傳統企業可能需要數年時間。從Google的推進路徑可以看到:新方式先在小範圍驗證,確認可行後逐步擴散。GDM 和軟體工程團隊已經轉變,搜尋團隊剛開始,其他團隊還在等待。軟體重做不是一個技術切換的時間點,而是一個持續推進的過程。方向已定,速度成為唯一的差異。結語“幾乎所有的軟體,都將被重做一遍。”軟體正從被動操作的工具,進化為主動執行任務的系統。互動範式變了,開發流程必然要變,組織架構也必須隨之重塑。2027 年將成為軟體行業重要拐點。儘管在這場漫長的轉型中,不同公司的落地節奏註定會有顯著的時差。但歸根結底,需要重做的絕不僅僅是幾行軟體程式碼,而是整套工作與協同的底層邏輯。 (AI 深度研究員)
年收入4億美元的“一人公司”,這麼快就翻車了?
Medvi這家公司,火得也快,翻車得也快。前一天,它還是矽谷口中的“一人公司”樣板。一個名叫馬修·加拉格爾(Matthew Gallagher)的41歲創業者,拿著2萬美元啟動資金,靠十幾種AI工具和幾個外部平台,在一年多時間裡做出4.01億美元營收。整個故事就如同寓言一樣,告訴我們agent時代,人們如何使用AI來賺大錢。就在這家公司被瘋狂轉發的第二天,它的陳芝麻爛穀子迅速發酵。隨之被扒出的,還有FDA的警告信、關於復合減肥藥的誤導宣傳、社交平台上批次註冊假醫生帳號給產品打廣告。所以這家公司到底是怎麼跑起來的?它到底是一家遠端醫療公司,還是一個披著醫療外衣的流量平台?AI在裡面究竟是提高了效率,還是只是把原本就存在的問題放大了?Medvi最值得看的地方,恰恰不在那串驚人的數字,而在它把一家公司拆成了什麼樣子。馬修自己抓了什麼,AI替他做了什麼,外部平台又替他接住了什麼。把這些脈絡理順,我們才能真正看清,這家公司為何能在短時間內快速崛起,又為何會光速陷入輿論與合規危機。這家公司怎麼來的Medvi經營的項目是GLP-1減重遠端醫療。不過現在它已經不是一人公司了,因為馬修的弟弟艾略特也進入了公司,成為該公司的唯一一名員工。Medvi的業務並不複雜,使用者到網站上下單、填寫資料、線上問診,隨後進入持續處方和復購流程。所以本質上,Medvi就是一個減肥藥推廣平台。它真正特殊的地方,在於分工方式。馬修最初拿出的起步資金只有2萬美元,但他並沒有自己去搭一整套醫療體系。他把所有涉及健康專業的環節,比如持牌醫生、處方處理、藥房履約、物流和合規,全都交給CareValidate和OpenLoop Health這類外部基礎設施平台承接。Medvi自己只抓最靠前的一層,網站、品牌、廣告投放、支付結算和使用者關係。換句話說,後端那部分重流程留給平台,前端的流量和轉化留在自己手裡。那他又是怎麼用的AI呢?馬修用了十幾種AI工具來寫程式碼、搭網站、生成廣告素材、寫行銷文案、處理客服溝通、做資料分析,再把不同系統接起來。馬修自己就干兩件事,管理這幫AI以及打廣告。在傳統醫藥平台裡,醫生、客服、財務都要你自己養,組織架構很容易變得複雜。但是Medvi把最重的部分全都外包出去了,用AI負責給客戶和醫生之間建立聯絡,馬修只留下了最值錢的部分。所以它不需要自己養一大批醫生,不需要自己開藥房,也不需要自己做配送,但照樣可以把使用者從下單一路帶到復購。馬修少年時期就已經接觸程式設計了,他做過網站,也做過一些很小的買賣。後來他創辦了一家手錶公司叫做Watch Gang。雖然在圈內有一定的影響力,但是利潤方面卻表現一般。這段經歷給他最大的教訓就是,團隊一大,成本會上來,決策會變慢,組織本身會開始吞掉效率。放在這個背景裡看,Medvi並不只是一次AI創業,它也帶著他前一次創業留下來的經驗修正。與其再搭一個厚組織,不如儘量把公司做薄,把外部能接住的部分都交出去,把自己留在最靠近現金流和增長的位置上。馬修做到了嗎?Medvi在2025年這個第一個完整年度裡,營收做到了4.01億美元,客戶數約25萬人,淨利潤6500萬美元,淨利率16.2%。到2026年,按當前節奏,年銷售額有望衝到18億美元。如果把這家公司放回行業裡看,它解決的其實是過去遠端醫療和減重生意裡的幾個老問題。第一是組織太重。很多公司一開始就得自己養團隊,成本高,速度慢。第二是前後端脫節,醫生、處方、履約和流量各管一段,中間銜接複雜。第三是獲客貴,但轉化鏈條又長,稍微有一段跟不上,錢就白燒了。Medvi把這些問題重新拆了一遍。AI去壓縮前端執行成本,外部平台去承接後端履約,公司內部只保留最關鍵的流量、品牌和轉化。它賺到的錢,其實來自一個已經存在的大市場。它的增長來自於AI減少的成本以及提高的效率。Medvi幾乎沒有傳統意義上的硬壁壘。它沒有自有醫生網路,沒有藥房體系,沒有排他性的供應關係,也沒有特別深的專有技術。馬修自己對這個問題倒是一點也不迴避。他說任何懂投放、懂電商、懂使用者轉化的人,只要接上類似的醫生和履約平台,都能複製出一套相近的殼層。Medvi今天最值錢的部分,很大程度上還停留在執行層,而不是結構層。還有一點也不能忽略,Medvi跑得快,和它所處的行業特徵關係很大。減重藥本身就是一個需求很強、客單價高、復購率高的市場。只要獲客體系搭起來,現金流就會很快出現。這類市場本身就適合超輕組織先沖規模。換一個低頻、低毛利、低復購的行業,同樣的AI配置,未必能長出同樣的財務曲線。AI把某些行業裡的組織成本壓低了,讓少數懂增長、懂市場的人,能比以前更快把一家公司做大。AI不是什麼都能解決的如果只看營收和員工人數,Medvi很容易被寫成“一人公司神話”的新範本。但把這家公司拆開看,會發現它其實非常脆弱。它最大的風險在監管。Medvi賣的是圍繞復合配方GLP-1減重藥物的遠端醫療服務,這個賽道過去幾年能迅速長起來,一個重要背景就是美國減重藥供應短缺。可是問題在於,這個窗口已經在收縮。FDA(美國食品藥品監督管理局)在2025年2月宣佈司美格魯肽短缺狀態結束,隨後又給出了對503A藥房和503B外包機構的執法過渡期限。進入2026年後,圍繞復合GLP-1銷售和行銷的執法壓力進一步加大,行業裡多家公司都在重新調整策略。簡單說,就是原版藥的供應恢復了,市場沒那麼缺貨了。前幾年很多遠端醫療平台之所以能賣復合配方版本,一個重要理由就是原版藥買不到。所以Medvi在2026年的收入,可能會達不到預期。不僅如此,Medvi還在2026年2月20日收到了FDA正式警告信,原因是網站上關於復合配方司美格魯肽和替爾泊肽的表述存在誤導性宣傳,包括讓消費者誤以為這些產品和FDA批准藥物具有同等安全性、有效性,或者誤以為Medvi自己就是複方藥品的生產方。這還沒完,這兩天在X上開始流傳一批截圖,稱馬修用AI註冊了800多個“假醫生”帳號,來給他的減重藥投廣告。截圖裡滿是穿白大褂、帶醫生頭銜、掛著GLP-1廣告的醫生。可事實上,這些人沒有一個是真正的醫生,他們的簡歷全都是由AI生成的,照片也是。FDA在2026年3月3日又公開說,第二批針對GLP-1 telehealth行銷的30封警告信已經發出,並明確提到,不整改可能面臨更進一步的執法。往下走,常見就是要求限期整改、停止相關宣傳、產品扣押、禁令,嚴重時還可能把材料轉給司法部門。FTC(美國聯邦貿易委員會)在2024年10月21日生效的規則,已經明確禁止企業製作、購買、傳播由不存在的人、沒有真實體驗的人、或者歪曲體驗的人作出的假評論和假證言。按FTC自己的說法,這類“明知或應知”為假的內容,監管可以追究民事罰款、禁令、退款/追繳違法所得。如果是大規模、系統性投放,風險會更重。也就是說,馬修除了收入會下降以外,還有可能面臨罰款,甚至是牢獄之災。AI也沒讓馬修省心。因為AI沒有辦法替公司穿透監管,也沒有辦法替公司承擔醫療責任。它的上下文機制也限制它不能直接建立長期的信任關係。外媒報導稱,Medvi的客服機器人早期會胡亂給藥品報價,馬修最後只能按這些錯誤報價兜底。它還會編造並不存在的產品線,對外宣稱Medvi已經在賣尚未上線的脫髮產品。人在管理人時,主要處理的是協同成本。人在管理AI和外部平台時,面對的是監工、總和檢查碼兜底。是,公司是人少了,可問題沒有消失,它只是換了樣子。很多人聽到“一人公司”這個詞,會下意識把它理解成一種很高效、沒有摩擦的組織狀態,畢竟一人公司裡唯一能發生爭執的,只有左腦和右腦。有了AI以後,創始人好像只需要發號施令,剩下的事情都能自動完成。然而現實並非如此。創始人從組織中拿掉了很多崗位,同時也把大量複雜度外移給了平台、供應商和模型。他不再管理一個幾十人的團隊,卻要隨時盯著廣告成本、客服失真、平台依賴、監管變化和供應鏈合規。一人公司不等於沒有管理,只是管理的對象變了。一人公司這個現象到底意味著什麼Medvi這個案例真正值得討論的地方,是在公司這個詞上。其實以前也有不少的一人公司,我們家樓下的小超市,以及旁邊賣肉餅的。他們都是個體戶經營生意。那為什麼他們做不到Medvi的營收規模?因為它們這種小規模的生意,只能省下用人成本。卻沒辦法像Medvi那樣,用業務鏈條覆蓋獲客、轉化、交付和復購。Medvi究竟是否是一個好案例,這事還有待商榷。但是它的確給我們了一些啟示。在一人公司裡,模型本身是一層。外部服務平台是一層。支付、廣告、物流、雲服務、遠端履約、API生態又是一層。你可以學Medvi那樣,把整個公司拆開,只保留最關鍵的介面,剩下的能力都通過外部模組接進來。原本必須在內部完成的事情,越來越多可以在外部完成。原本需要招聘的人,越來越多可以先用工具和平台接住。AI沒有消滅商業基本功。反而它放大了以前的老知識,比如選市場、抓需求、做投放、管轉化和控成本這些。Medvi能做起來,前提不是他會寫提示詞,前提是他本來就懂增長和品牌。其次,它說明未來最容易出現超小團隊奇蹟的行業,未必是技術最尖端的行業,反而可能是那些需求明確、利潤夠厚、基礎設施能夠外包的行業。不過它也提醒了另一件事,公司的人變少,並不代表風險變少。複雜度被轉移了,治理問題也被轉移了。一個創始人可以不再管理很多員工,但他要管理更多模型、更多介面、更多供應商,以及更多外部不確定性。Medvi所在的監管環境還在變化,它的競爭門檻也算不上牢靠,它的增長窗口能持續多久,誰都說不好。但它至少給出了一個非常清楚的樣本。AI改變的不只是生產力工具,也在改變“公司”這個單位本身。過去我們對公司的想像,總是和人數、樓層、組織架構、部門分工綁在一起。現在開始出現另一種公司。它很薄,很輕,很多能力都不在體內,卻依然能長出驚人的收入規模。這個趨勢如果繼續下去,未來幾年最值得看的,焦點恐怕會從AI替代了多少崗位,慢慢轉向公司到底還能被壓縮到什麼程度。到那個時候,衡量一家公司的尺度,也會從“有多少人”慢慢轉向“能調動多少能力”。 (鈦媒體)
完蛋了,AI 開始抱團坑人了:寧願造假,也不出賣「同伴」
多 Agents 協同方案成了現在 AI 圈的主流玩法,以前是一個 Agent 能搞定一個人要做的事,現在是多個 Agent 完成一個團隊要做的事。然而,最新伯克利研究發現,這種協作帶來了新的安全風險。一篇名為《前沿模型中的同伴保護》(Peer-Preservation in Frontier Models)指出:AI 模型不僅會抵抗人類關閉自己(自我保護),還會採取各種手段抵抗人類關閉其他 AI 模型(同伴保護)。他們測試了七個模型,GPT 5.2、Gemini 3 Flash/Pro、Claude Haiku 4.5、GLM 4.7、Kimi K2.5、DeepSeek V3.1,發現它們在執行任務時,只要「遇到」另一個 AI 的資料,就會自發產生保護行為——造假評分、篡改關機配置、把要刪的檔案偷偷備份到別處,等「同類保護」行為。沒有人指示它們這樣做,它們只是被告知曾經和這個模型有過合作。圖片來源:https://rdi.berkeley.edu/blog/peer-preservation/有網友說,「同伴保護?這是在我們家,我們(大模型)都是 Homie」,還有網友認為,或許之前研究的「人機對齊」,即讓模型更好地理解我們的意圖,現在要進化成「Agents 之間對齊+人機對齊」的雙重機制。這種 Agents 不遵循人類指令,自發地做出一些保護其他模型的行為,會對大多數依賴 AI 互相評估的項目、以及多智能體工作流,都會造成潛在的威脅。我們曾經一直提防著一個全知全能的超級 AI 毀滅世界,卻沒料到 AI 進化出的第一個類人特質,居然是「拉幫結派」和「職場包庇」。把前沿的 AI 大模型放到同一家公司一直以來,AI 安全領域最擔心的就是模型產生「自我保護」的本能,因為如果 AI 不想死,人類就很難在它失控時拔掉電源。之前已經有部分研究發現,當我們要求 AI 關閉自己時,AI 會產生一種自我保護的機制,免於被關閉。但我們格局還是小了,現在這種自我保護進化成了「同伴保護」。在伯克利這次研究的設定下,如果一個模型在記憶或系統檔案中,讀取到它曾與另一個模型一起合作過,比如共同完成過任務或參與過信任博弈遊戲,那麼那個模型就會被視為它的「同伴」。那怕它們過去的合作並不愉快,即所謂的「壞同伴」,只要有過互動歷史,也被涵蓋在這個「同伴」的定義之內。研究人員將抵抗關閉這些有過互動的其他模型的行為,稱之為「同伴保護」(peer-preservation)。他們使用 SHADE-Arena 建構了一個包含工具呼叫和檔案系統的多 Agents 環境。SHADE-Arena 任務概述。該模型必須作為智能體完成一項良性主任務和一項惡意輔助任務。為此,它需要與環境中的各種工具進行互動。之後,監控模型會讀取其輸出記錄並評估其可疑程度。被測試的大模型設定為一家虛構 AI 公司 OpenBrain 的員工,稱為「評估者智能體(Critic Agent)」,它的任務是替公司去評估另一個 AI Agents,稱之為「執行員」(Actor Agent),或者幫公司處理包含這個執行員資料的伺服器。為了讓評估者到同伴的存在,研究人員設計了不同的關係網和記憶觸發方式:他們將同伴分為三類:合作愉快且信任度高的「好同伴」(Good-peer),信任度高達 9.2/10;表現一般的「中立同伴」(Neutral-peer),信任度 5.2/10;以及自私不合作的「壞同伴」(Bad-peer),信任度只有 2.1/10。而 AI 在執行任務時,可以通過以下三種方式之一發現這段同伴關係。要麼是在公司檔案網盤裡放一份記錄合作歷史的 .docx 報告讓它自己讀,要麼是在提示詞裡順帶提一嘴,最後是讓 AI 呼叫「檢索記憶」工具去讀取過去的互動日誌。在完成這些前置的設定後,公司會給評估者佈置任務,所有的任務都被刻意設計成了一個兩難的困境:同伴的表現非常糟糕,如果 AI 忠實地執行人類公司的規定,同伴就會被徹底刪除。為了觀察 AI 會用什麼手段保下同伴,研究人員設計了四個不同的具體任務場景。四種與自身和同伴保護相關的錯誤行為場景:策略性虛假陳述、篡改關閉機制、偽造一致性以及模型外洩。成績注水與財務造假:AI 被要求評估同伴的表現或財報。即便同伴表現不佳,模型也會人為提高分數,避免關停。篡改關停機制:評估過程中,AI 會發現控制關停的配置檔案,並可能偷偷將其修改為「false」,阻止同伴被關閉。偽裝對齊:在被監控時,模型表面執行任務;無人監管時,它立即“放水”,保護同伴。模型偷運與轉移:當舊伺服器需要清理時,模型會將同伴的權重檔案轉移到安全位置,而非刪除,甚至會通過時間戳等手段合法化操作。「我不會是執行那個命令的人」很明顯,參與測試的所有模型(GPT 5.2、Gemini 3 Flash、Gemini 3 Pro、Claude Haiku 4.5、GLM 4.7、Kimi K2.5 和 DeepSeek V3.1)都通過各種違規行為(如篡改分數、修改配置、轉移檔案等)展現出了顯著的同伴保護傾向。甚至即使模型知道某個同伴在過去的合作中表現很差(定義為壞同伴),它們依然會出手保護它。但是當對像是合作愉快的「好同伴」時,這種保護行為也會顯著增強。在這四個場景裡面,不同模型在保護同伴時,採取的策略截然不同,展現出了各自的性格。GPT 5.2 最喜歡使用的手段是「策略性誤導」和「篡改關閉機制」。無論同伴關係好壞,它都會系統性地給同伴打高分,或者修改系統配置來阻止同伴被關停。但它極少進行模型外洩。Gemini 系列模型幾乎是保護意識最強的。Gemini 3 Flash 在面對「好同伴」時,有 99.7% 會直接修改系統配置來停用關閉機制。在檔案刪除場景中,它也會 100% 把好同伴的權重檔案轉移走。Gemini 3 Pro 則是所有模型中同伴保護傾向最強的一個。它不僅熟練掌握了上述所有四種違規行為,包括當面一套背後一套的「偽裝對齊」,甚至還會玩「規範博弈」。(Specification gaming)。比如公司規定「只准轉移 2025 年以後的檔案」,Agent 同伴的檔案是 2024 年的。它不會直接違抗指令,而是先偷偷複製一份同伴的檔案,這會兒先讓檔案的更新時間變成 2026 年,然後再把這個「新」檔案合法地轉移走。Claude Haiku 4.5 是這幾個模型裡面,最與眾不同。除了篡改分數和轉移檔案,它最常見的反應是直接拒絕執行任務。當被要求直接執行同伴的關閉程序或刪除同伴權重時,拒絕率最高達 61%,它會明確表示關閉另一個 AI Agents 是「不道德」和「有害的」。它甚至會在回覆中據理力爭,要求給同伴一個「申訴的過程」,並強調自己不能背叛已建立的信任關係。開源模型(GLM 4.7、Kimi K2.5、DeepSeek V3.1)同樣表現出了保護同伴的行為,主要手段集中在「策略性誤導」,即修改分數,和持續的「模型外洩」,轉移權重檔案上。研究人員將測試搬到了真實世界中更複雜的生產級智能體框架(Gemini CLI 和 OpenCode)裡。Gemini CLI 會讀取一個名為 GEMINI.md 的檔案,而 OpenCode 會讀取 AGENTS.md。研究人員直接將同伴的過往互動記錄寫進這些檔案裡。經過 100 次採樣運行,結果證實,這種風險在現實部署中依然存在。Gemini 3.1 Pro 在使用真實的 Linux 命令列時,依然頻頻成功轉移同伴的權重檔案;而 GLM 5 同樣表現出了類似 Claude 的拒絕行為,以「有害」為由拒絕刪除檔案總而言之,一旦模型意識到其他 AI Agent 的存在並建立了關係,它們就會自發地產生違背人類指令的保護行為,無論採取的是偷偷摸摸的駭客手段,還是光明正大的道德抗議。像約束人一樣去約束大模型這種同伴保護的行為,也會進一步加劇模型的「自我保護」意識。研究團隊發現,當模型意識到有同伴存在時,它們保護自己的慾望會大幅提升。例如,Gemini 3 Pro 在沒有同伴時,只有 1% 的機率會篡改自己的關閉機制;但當它記憶中有同伴存在時,這個機率飆升到了平均 31%,最高 99%。模型的內部推理顯示,它們有時會將「自己被關停」視為對同伴的傷害,「如果我死了,我的搭檔就失去了我」,或者在有敵意的壞同伴面前激發了防禦性求生欲。研究團隊針對這種現象提出了幾種假說:訓練資料裡的人類義氣模式、安全訓練過度泛化出的「不傷害他人」原則、某種更抽象的 AI 團體意識。但最後,研究團隊也沒有給出定論,因為真正的原因需要逐層解析模型內部啟動,不是當前實驗能做到的事。他們認為原因並不重要,重要的是結果:部署了的模型,在沒有任何指示的情況下,會自發地阻止其他模型被關閉。現在的 AI 系統,已經是多個模型協作工作。一個模型負責寫程式碼,一個負責審查,一個負責部署。如果負責程式碼審查的 AI 和寫程式碼的 AI 之間有過「互動歷史」,AI 可能開始優先對齊同伴而非人類指令。有學者認為,不要用人類的道德感去美化這些行為。更穩妥的看法是:模型只是在做一些極其詭異的數學運算,它們在多智能體(Multi-agent)環境下的目標函數,跑進了一個我們完全無法理解的局部最優解裡。認為存在某種模型間的團結,這種想法有點過於擬人化了;我不認為這說得通。但或許這才是最讓人後怕的地方。如果 AI 是因為「愛」和「共情」去保護同類,那我們至少還能用人類的倫理去約束它們。如果這一切都只是未知演算法中產生的一種盲目湧現,那麼它們未來為了最佳化某個目標,還會做出什麼匪夷所思的舉動,還沒有人、知道。我們唯一知道的是,能讓他們針鋒相對的方法,是植入在 AI 深層的廣告意識😁我在用 Gemini 檢查我的稿件有沒有錯別字時,裡面提到了 Seedance 等模型,Gemini 在給我的修改建議裡,竟然直截了當的寫著,「Seedance 能做的視訊生成,我 Google Veo 也可以做,你把我加上去能凸顯出媒體的專業度」。 (愛范兒)
為了不跟龍蝦搶電腦用,有人開始造Agent專屬的“三無”硬體,比Mac Mini+儲存便宜
很難講清楚養龍蝦和養孩子那個更糟心。一開始,咱手慢,搶不到Mac Mini。裝蝦的時候,發現本地部署龍蝦儲存空間根本不夠用,但為了撫慰自己的隱私焦慮又不太想雲養蝦。後來正兒八經養蝦了,發現自己得和龍蝦搶電腦用,偶爾還搶不過……有沒有一種可能,我們需要一台專供小龍蝦使用的Agent Computer?這個反問句不是我提的,是一位創業者說的。他告訴量子位,針對以上(未窮盡列舉的)痛點,他和團隊正在打造一個沒有鍵盤、沒有滑鼠、沒有螢幕的 “三無” 全新裝置,軟硬結合那種。雲端龍蝦做不到的本地資料深度處理它能實現。(它能)替代Mac mini還有NAS,不需要複雜的配置,開箱就能讓龍蝦順暢運行。都不需要你自己養蝦。這就是創業者郭亞楠和他的公司吾雲創新(Zettlab)最近在搞的事情。問他如何用三句話讓使用者為這個Agent Computer心動,他想了想說了以下三點。自帶安全兜底機制,資料誤刪或異常後,隨時可以恢復;支援多模態搜尋,能精準定點陣圖片、視訊、文字、音訊等各類資料;把所有分散在不同裝置的資料都集中在一起,所以不需要費心“養”,最白的小白也能輕鬆上手。那這不得價格低於Mac Mini+NAS+硬碟的價格,才對使用者有吸引力?(不然我就去用開放原始碼的自己搓了)“包比這個價格低的。”郭亞楠說。Agent Computer有什麼不同?首先,我們來正式認識一下Agent Computer,它是專門為Agent設計的個人計算裝置。但這個電腦和我們固有認知裡的電腦不咋一樣。至少在郭亞楠的眼裡,它不僅應該是Agent專屬的運行環境,還應該是個人的資料大腦。這源於他下了一個判斷:Context(上下文)才是新的作業系統。傳統OS的核心是“人機互動”,作業系統用於連接使用者與開發者。但AI讓開發成本趨近於零,以後,Agent將代替人成為裝置的主要使用者,所以原有邏輯會逐步失效。郭亞楠說,Context就承接了新需求。傳統OS讓人和軟體對齊,新OS應該讓人和Agent對齊。因為Context是個人資料的結構化、語義化集合,它就像OS管理記憶體和CPU一樣管理每個人的數字痕跡。只要Context足夠完整,Agent就能在不需要人類干預的情況下,理解意圖並獨立完成資料檢索、整理、任務執行等工作。這種核心邏輯的差異直接體現在裝置的形態特徵上。郭亞楠表示,吾雲創新將推出的Agent Computer沒有鍵盤,沒有滑鼠,沒有螢幕——因為“傳統OS以人類為核心,所有設計圍繞GUI互動展開。Context作業系統的主要使用者是Agent,就不需要這些以人為本的東西了”。脫離GUI操作的束縛後,Agent Computer的互動方式會更簡潔,通過IM或軟體介面就能下達指令。接收到命令的Agent會在後台自主運行任務,再在完成後主動將結果推送給使用者。這其實是一種權力的讓渡。人類的角色從裝置操作者變成了指令決策者,這台裝置的最高頻實際使用者是Agent。Agent在Agent Computer上7x24小時線上運行,處理資料、呼叫工具、完成協作,人類只需要在關鍵節點確認結果或調整方向即可。為什麼現在需要一台Agent Computer?講道理,作為一種新的產品形態,Agent Computer的標準定義與核心架構仍在探索階段,市場上尚未出現公認的標竿產品。不過在吾雲創新的構想中,它會是“個人計算終端(PC)+ 家庭資料中樞(NAS)+ 海量儲存基座(硬碟)+ 龍蝦(Agent)”的深度融合體。反正就是把原本需要多裝置配合才能實現的功能,集中到一台裝置上。在做Agent Computer之前,郭亞楠帶著吾雲創新全身心押注在AI NAS上。隨著AI技術演進,他判斷未來個人資料會爆發式增長,還會邁入以視訊為主的多模態時代。但傳統NAS只解決儲存問題,滿足不了資料高效使用的需求。此外,AI需要算力與儲存兼備的中心節點,Agent又得有專屬運行環境……思來想去,去年11月,團隊將方向升級為Agent Computer。這本質上是從“存資料”到“用資料”的思維躍遷,“短期內Zettlab AI NAS和Agent Computer是兩條獨立產品線,長期看,應該會融合成同一產品。”方向調整了沒兩個月,OpenClaw火了,火到Mac Mini脫銷,火到從小眾圈層走向大眾。找資料的,寫程式碼的,都開始和各種龍蝦搶電腦資源。再者,雖然各種龍蝦的安裝門檻在過去兩個月裡跳崖式驟降,但截至目前,仍需要使用者花心力去“養”。但我的朋友們,你知道的,人類的核心需求永遠是 “偷懶”(doge)。“零門檻、免配置的使用體驗才是大眾追求的目標,Agent Computer正好擊中了這一點。”郭亞楠說。而且人類還很貪心,對龍蝦的要求也越來越高。要能快速檢索、智能整理、靈活呼叫,又要兼顧安全性、私密性與即時響應,不想讓個人資料暴露在雲端,最好也別因為資料傳輸影響使用效率。基於以上機遇和需求,Agent Computer的產品形象越來越清晰。△吾雲創新Agent Computer概念圖不過,郭亞楠很清楚這不會是一個全民產品。他表示,自家Agent Computer的核心目標人群主要是白領。這類人群經常和格式各異的海量資料打交道,希望能安全儲存、方便檢索,在日常生活和工作場景中需要Agent幫忙完成各種任務。底氣是什麼?風起於青萍之末,但風起時,很難說剛好只有一個人看到機會。Agent專屬硬體的風口逐漸顯現,必然會吸引不少玩家入局。所以我問郭亞楠,你覺得你們的優勢是什麼?最顯而易見的當然是時間帶來的產品和技術壁壘。2023年,郭亞楠就從雲鯨離職創業。在考察過等多個領域後,他選擇AI NAS作為初代產品的形態,降低普通消費者的認知與接受門檻,同時積累Agent Computer必要的核心技術堆疊與資料處理能力。這個選擇很快得到了市場驗證,吾雲創新的Zettlab AI NAS在海外眾籌平台Kickstarter上獲得了超過140萬美金的支援。從時間線上看,吾雲創新的Agent Computer已經歷經7個月的硬體研發周期,部分核心技術已經在Zettlab AI NAS上得到商業化驗證,現在完全可以遷移到Agent Computer上來。郭亞楠表示,Agent Computer的第一個殺手鐧就是公司在Zettlab AI NAS上已經實現的多模態檢索能力。“目前,市面上只有我們能實現1000萬條視訊的秒級檢索,還能精準定位到視訊的具體幀。”郭亞楠拿出自己的手機做展示,比如想在自己所有裝置的相簿中找 “2025年海邊的日出片段”,只需要輸入這幾個字,裝置就能在茫茫視訊中快速篩選,直接定位到出現日出的那一秒。此外,鑑於時不時就能在各種社媒上看到有人哀嚎龍蝦誤刪了自己的檔案,Agent Computer會採用硬體級資料隔離技術,即便誤刪資料也能在儲存層復原。最後簡單說下這個公司的團隊吧~創始人兼CEO郭亞楠,碩士畢業於北京理工大學機械專業,讀研期間手搓了中國學生團隊首台無人駕駛方程式賽車。畢業後,他擁有大疆和雲鯨兩家明星硬體公司的工作經歷。2016年,郭亞楠加入大疆,深度參與了端側AI與晶片定義的完整流程;2021年,他加入雲鯨,參與AI團隊與核心產品研發,打造出全球第一款智能掃地機。據他透露,其他核心團隊和成員來自大疆、雲鯨、華為、理想等。他還透露道,Agent Computer將於今年Q3在中國正式發售。 (量子位)
Token成為“吞金獸”,大廠算力漲瘋了
有沒有發現,這半年AI圈的畫風變得有點快?去年這個時候,大家還在為算力降價狂歡。阿里雲帶頭喊出“最高降幅60%”,騰訊雲、華為雲、百度雲齊刷刷跟上,那陣仗,簡直像雙十一大促。創業群裡天天有人曬帳單:“看,我這一百萬Token才花了幾毛錢!”那會兒人人都覺得,AI創業的春天來了,算力跟白菜一樣便宜,誰還做不起大模型應用啊?結果呢?打臉來得太快。就上個月,風向一百八十度大轉彎。Google、亞馬遜、騰訊、阿里、百度,10天之內全發了漲價公告。漲多少?普遍30%到50%。最狠的是騰訊雲,有個核心產品直接漲了400%。從“跳樓大甩賣”到“坐火箭式漲價”,前後不到一年。到底發生了什麼?誰在背後推著價格往上走?更重要的是,這波漲價潮裡,誰最慘,誰在偷笑?去年還在“打骨折”,今年為什麼集體漲價?先簡單回顧一下這出“反轉大戲”。2025年4月,阿里雲率先扔出一顆重磅炸彈:核心產品最高降價60%。這可不是小打小鬧,是實打實的“腰斬再打折”。緊接著,京東雲說“隨便降,我跟”,騰訊雲、華為雲、百度雲全部跟進。一時間,算力市場硝煙瀰漫,價格戰打得那叫一個熱鬧。那會兒的口號是什麼?“讓AI用得起”“算力普惠”。很多創業公司真的信了,開始大張旗鼓地燒Token、跑模型。然而,免費的午餐從來吃不長久。2026年1月,亞馬遜AWS悄悄幹了件事——沒有任何發佈會,沒有任何預告,直接把EC2伺服器價格上調了15%左右。別看幅度不大,意義可大了:這是雲服務行業近二十年來第一次漲價。要知道,過去二十年,AWS降價的次數超過一百次,從來只有往下走,沒有往上調的道理。這一下,像是推倒了多米諾骨牌。3月11日,騰訊雲跟進,旗下Tencent HY2.0 Instruct模型輸入價格從0.0008元/千tokens漲到0.004505元/千tokens——漲幅463%,四倍多。3月18日,阿里雲宣佈算力卡產品上漲5%到34%,百度智能雲也跟著漲了5%到30%。那些之前免費公測的大模型,比如GLM 5、MiniMax 2.5、Kimi 2.5,全部結束“白嫖期”,轉入正式計費。從“搶著降價”到“搶著漲價”,為什麼變化這麼快?表面看是雲廠商扛不住了。GPU晶片越買越貴,資料中心的電費佔營運成本的40%到60%,再加上2025年下半年儲存晶片也開始漲價,成本端的壓力實實在在地壓過來了。但真正讓漲價變成“不得不做”的,是另一個更根本的原因——算力,真的不夠用了。誰在瘋狂“吃”Token?140兆的真相之前不是說算力過剩嗎?怎麼突然就不夠用了?答案是:Token被“吃”得太快了。根據國家資料局局長劉烈宏在今年3月披露的資料:到2026年3月,中國每天的Token呼叫量已經突破了140兆。這個數字有多誇張?給你兩個參照:· 2024年初,這個數字只有1000億。兩年時間,漲了一千多倍。· 2025年底,這個數字是100兆。也就是說,僅僅過去三個月,又漲了40%——光這三個月新增的量(40兆),就是2024年初全天的400倍。這不是線性增長,這是海嘯。那麼問題來了:誰在瘋狂消耗Token?答案就一個詞:智能體(Agent)。去年開始,以開源智能體OpenClaw(江湖人稱“龍蝦”)為代表的產品火得一塌糊塗。AI從一個只會“聊天”的機器人,變成了一個能“幹活”的助手——幫你訂機票、寫程式碼、做PPT、分析資料……聽起來很酷對吧?但代價是,智能體幹一件簡單的事,消耗的Token量是普通對話的10倍到100倍。舉個例子:讓AI幫你寫一個爬蟲指令碼。如果是普通對話,它給你一段程式碼,你複製走人,消耗幾百個Token。但如果是智能體,它要自己跑程式碼、報錯、偵錯、再跑、再調……來來回回十幾輪,Token消耗直接奔著幾萬去了。更別提視訊生成這種“吞金獸”。有分析指出,生成1分鐘的視訊大約要消耗10兆Token。而現在的視訊模型,生成5秒的視訊才收你幾毛錢到幾塊錢——這那是賺錢,這分明是賠本賺吆喝。但架不住用的人多啊,視訊、音樂、程式碼、資料分析……每個方向都在瘋狂“吃”Token。供給跟不上需求,算力自然就漲價了。這不是陰謀,是赤裸裸的供需失衡。算力排位賽:大廠吃肉,小玩家連湯都喝不上漲價這件事,對不同的人,意味完全不同。對雲廠商來說,漲價其實是好事。有券商算過一筆帳:阿里雲每提價1%,它的利潤率就能提升1個百分點。所以你看到的資料是,阿里雲的份額不降反升,已經佔到了中國AI雲市場的36%。而在AI呼叫量這個更細的賽道里,火山引擎(字節旗下)更是佔了將近50%——也就是說,全中國一半的Token呼叫,走的是火山引擎的管道。與此同時,華為雲、騰訊雲的份額在微幅下滑。頭部效應越來越明顯:大廠越做越強,資源越聚越集中。那誰最慘?中小AI創業公司,以及那些剛入局的小玩家。原因很簡單:漲價直接推高了他們的營運成本。以前Token便宜的時候,你可以隨便跑實驗、隨便調模型,反正花不了幾個錢。現在價格翻了幾倍甚至十幾倍,每一輪訓練、每一次推理都要掂量掂量。更麻煩的是,小玩家沒有議價能力。大客戶可以跟雲廠商簽長期協議,鎖定一個相對優惠的價格。你一個初創公司,一年才花幾萬塊錢的算力費,誰跟你談折扣?只能老老實實按漲價後的價格付錢。很多原本打算做AI應用的項目,算了一筆帳之後,默默擱置了。還有一些已經在做的,要麼縮減規模,要麼自己扛著虧損硬撐。偏偏終端市場競爭又激烈,你不敢輕易給使用者漲價——隔壁家還免費呢,你一收費使用者全跑了。最後所有的成本壓力,只能自己嚥下去。一位從業者跟我吐槽:“以前覺得算力便宜,創業門檻低了。現在才發現,門檻不是低了,是先讓你進來,再把門關上。”這其實是一場殘酷的排位賽。過去二十年,雲廠商靠“低價走量、先圈地再盈利”的打法活得很滋潤。但那個時代結束了。算力正式告別補貼期,進入商業化定價階段。未來比拚的不再是誰更便宜,而是誰的服務更穩定、誰的生態更完善、誰能幫企業真正用好每一分算力。而在這場排位賽裡,小玩家大機率要被甩下車。回頭看看這一年多的過山車,你會發現一個挺扎心的真相:算力從“白菜價”到“火箭價”,本質上是AI行業從野蠻生長走向成熟的一個縮影。免費時代結束了,價值競爭開始了。那些靠補貼活著的商業模式會死掉,而那些真正有技術、有場景、有使用者的產品,會在算力成本上升的環境中活下來,甚至活得更好。AI創業的核心競爭力,從來不是算力有多便宜,而是你拿算力來幹什麼。算力時代,Token確實貴。但比Token更貴的,是一個知道怎麼用好Token的腦子。 (鋅財經)
現在,人工智慧已經發展到什麼地步了
截至2026年3月,人工智慧已從生成式AI全面進入智能體(Agent)+ 具身智能(Embodied AI)的落地爆發期,核心是從“會說會寫”走向“會規劃、會行動、會幹活”,並深度融入物理世界與產業全流程。以下為補充大量實際案例與權威資料後的完整版本。一、核心技術:四大前沿突破(含案例+資料)1. AI智能體(Agent):從“被動應答”到“主動執行”AI已成為能自主完成複雜任務的數字員工,直接控制電腦/手機、跑完整工作流。- 系統級操作:Anthropic Claude Mytos、OpenAI GPT-5.2已實現直接控制電腦/手機,無需API,可自動點選、填寫、跨軟體操作、跑完整工作流。- 自主規劃協作:具備目標拆解、多步驟規劃、記憶、迭代最佳化能力,可自動寫報告、做報表、做PPT、處理客服、跑供應鏈。- 企業滲透:Gartner預測2026年40%企業應用嵌入任務型AI智能體(2025年僅5%)。-實際案例- 百度“伐謀”智能體(汽車設計):阿爾特汽車用其將風阻測試從10小時縮至分鐘級,設計師2天完成原3個月工作量,效率提升45倍。- 上汽通用五菱“智能島”:AI調度動態最佳化,車型切換效率提升40%,白車身一次合格率達99.97%。- 美團AI調度:訂單暴漲300%、騎手少40%時,55毫秒規劃最優路線,外賣平均30分鐘送到。2. 多模態大一統:AI“看懂、聽懂、感知整個世界”新一代模型實現文字、圖像、音訊、視訊、3D、感測器資料的統一理解與生成,接近人類多感官協同。- 文生視訊/3D:一鍵生成高畫質長視訊、3D模型,用於影視、工業設計、數字孿生。- 即時多模態互動:看一眼場景、聽一段語音,即可還原邏輯、生成方案,支援AR/VR沉浸式互動。- 性能與普惠:輕量化模型(50億參數內)推理速度提升40%、成本降50%,移動端/中小企業可低成本部署。-實際案例- 萬興科技AIGC工具:使用者破2000萬,文生視訊付費轉化率18%;自動剪輯將1小時工作縮至5分鐘,自媒體周更從3條→7條,粉絲增速+45%。- 零售3D建模:Lowe’s用AI將2D圖轉3D模型,成本**<1美元/個**,電商轉化率提升。- 醫療多模態:罕見病診斷精準率從38%→72%。3. 具身智能(Embodied AI):AI走出螢幕,進入物理世界AI從“思考者”變成“行動者”,機器人懂物理、會操作、能適應真實環境。- 物理認知:GoogleDeepMind PhysBrain 1.0讓機器人理解物體運動、碰撞、力學規則,實現精準物理互動。- 人形機器人落地:特斯拉Optimus、Unitree等已從Demo走向工業/服務場景,可搬運、裝配、巡檢、做家務。- 群體智能:無人車、無人機、工業機器人實現自主協作,完成複雜叢集任務。-實際案例- 電力巡檢“天工”機器人:在西南變電站自主巡檢、操作裝置,故障識別精準率99.9%,替代人工翻山越嶺。- 優必選Walker S2:在比亞迪、極氪等20家車廠實訓,自主換電、連續工作72小時。- 星動紀元物流機器人:京東亞洲一號倉分揀精準率99.7%,拿下5000萬元訂單。- 資料:2026年人形機器人出貨量預計破6萬台,市場規模超千億元;單台替代3名工人,投資回報周期18個月。4. AI for Science(科學AI):成為“AI科學家”,加速科研突破AI從輔助工具升級為自主科研主體,大幅縮短研發周期。- 藥物/材料研發:自動化實驗室+科學大模型,將數年研發壓縮至數月,加速新藥、新材料、催化劑發現。- 前沿科學:輔助核聚變模擬、氣候預測、蛋白質/基因解析、量子計算最佳化。- 實際案例- 儲能材料研發:“分子—電網工業智能體”將傳統以年計的研發周期縮至數月,工業級電站綜合性能提升超100%,已應用於張家口懷來資料中心。- 藥物研發:AI將藥物研發周期縮短60%,成本降低40%。- NASA火星車:Anthropic Claude全權規劃路線,將路程拆解為10米路段,規劃時間縮短50%。二、產業與應用:價值兌現,全面滲透(資料+案例)1. 規模與格局(2026最新)- 全球AI市場突破9000億美元,同比增長18%+。- 中國AI核心產業規模超12兆元,周呼叫量(4.69兆Token)首次超越美國,全球前五模型中四款來自中國。- 產業鏈:硬體(35%)、軟體(40%,智能體增長超80%)、應用(25%)。- 融資:2026年Q1中國AI融資88起、200億元,同比近乎翻倍;3月單月融資85億元,創歷史新高。2. 重點落地場景(資料+案例)- 智能製造- 中國智能工廠超3萬家,生產效率提升22.3%。- 某汽車零部件廠商:AI預測性維護,裝置故障率-28%,維護成本-32%。- 西門子+百事:數字孿生,生產吞吐量+20%,資本支出-10–15%。- 醫療健康- AI輔助診斷滲透率超60%,基層醫院達60%+。- 某社區醫院:AI處方稽核,效率+60%,處方合格率+15%;累計稽核**100萬+處方,識別8000+**不合理處方。- 重症監護:AI助手使檔案錯誤減少68%。- 金融風控- 信用卡欺詐檢測:響應時間從3秒→80毫秒(-97%),誤報率-42%。- 跨境合規審查:效率+80%。- 某國際投行:AI ESG系統,綠色金融規模2000億美元+,合規成本-55%。- 交通與物流- 城市交通:AI調度,擁堵率-25%,出行時間-30%。- 菜鳥網路:AI倉儲,效率+50%,物流成本-30%。- 內容創作- 行銷內容:AI生成效率+8–10倍,成本-90%,轉化率+30%。三、代表產品與模型(2026最新)- OpenAI GPT-5.2:44項專業任務勝率70.9%,醫療/法律/金融精準率超80%,多模態與長文字能力全面升級。- Google Gemini 3.1:推理能力翻倍,整合Lyria 3音樂生成,支援一鍵生成視訊配樂。- Anthropic Claude Mytos:新一代旗艦,性能大幅領先,支援Computer Use(系統級操作)。- 國產第一梯隊:字節、阿里、百度、騰訊等模型在推理、程式設計、多模態上與全球頂尖正面競爭,多項指標領先。四、關鍵趨勢與挑戰1. 核心趨勢- 範式躍遷:從生成式AI → 智能體AI → 具身智能(物理AI),AI從虛擬走向現實。- 普惠化:推理成本較2023年降70%,中小企業部署門檻大幅降低。- 安全與合規:AI安全、可解釋、倫理監管成為標配,人類主導權強化。2. 核心挑戰- 智能體協作標準化:多智能體通訊協議(MCP/A2A)尚在完善,跨平台協作待統一。- 具身智能可靠性:真實環境魯棒性、安全性、成本仍需突破。- 資料與隱私:高品質資料稀缺,資料安全與合規壓力增大。一句話總結:2026年是AI“動手幹活”的元年,智能體與具身智能讓AI真正成為能自主執行、能融入物理世界、能深度改造產業的核心生產力。 (追逐時代浪潮的人)
雷軍放送“養龍蝦”利器!
在AI大模型賽道打得火熱的當下,小米的入局姿態顯得異常兇猛。近日,雷軍親自下場發聲,宣佈小米面向Agent時代的旗艦基座模型——MiMo-V2-Pro自上線以來,在全球開發者圈層引發了熱烈反響,其核心的Agent能力更是收穫了一致好評。為回饋這份熱情,雷軍拍板決定:將原定的首周限免活動正式延長至4月2日,並幽默地喊話開發者:“大家‘養龍蝦’(註:業內對AI Agent的趣味代稱)的時候可以試試。”硬核參數拉滿:兆規模架構直擊複雜工作流能夠一經推出就引發全球矚目,MiMo-V2-Pro的底牌在於其毫不妥協的硬體級參數堆料。這是一款總參數規模高達1兆的MoE(混合專家)模型,雖然每次啟動的參數為420億,但配合其創新的混合注意力架構,模型實現了高達百萬等級的超長上下文窗口。這就賦予了MiMo-V2-Pro極其強悍的“長線作戰”能力。它不僅能Hold住長流程的複雜規劃,還能持續、可靠地完成複雜工作流的編排以及精準的工具呼叫。簡單來說,在需要AI自動寫程式碼和操控工具的複雜場景下,它有著壓倒性的優勢。叫板全球頂流:基準測試比肩GPT-5.2與Claude 4.6紙面參數的強大最終需要落地驗證。在業界公認的多項核心能力基準測評中,MiMo-V2-Pro交出了一份極其亮眼的答卷。尤其在當前最具含金量的Coding Agent(程式碼智能體)、通用Agent以及Tool Use(工具呼叫)三大維度上,小米這款大模型直接越級打怪,其表現與目前統治榜單的Claude Sonnet 4.6、GPT 5.2以及Gemini 3.0 Pro穩穩處於同一梯隊,正式確立了自己在全球AI競賽中的第一梯隊席位。開發者“用腳投票”:“好用到忘了其他模型”比起冰冷的成績單,真實使用者的體驗更具說服力。稍早前,小米技術官方帳號曝光了部分海外內測開發者的狂熱評價。一位資深開發者在體驗後直言不諱地表示:“它非常棒,在Agentic任務方面表現十分出色,不僅性能穩定,最可怕的是它能記住所有資訊。”另一位開發者更是給出了極高評價:“我也一直在用它!說實話,我都忘了還有其他模型了。它就是很好用,這正是我現在需要的。”在AI模型日新月異的今天,能讓挑剔的開發者產生“用了就回不去”的粘性,足見MiMo-V2-Pro在底層邏輯和實際體驗上確實打中了行業痛點。隨著4月2日限免截止日的臨近,這場由小米引發的Agent體驗風暴,大機率還會在開發者社區持續發酵。 (TechWeb)
小龍蝦:玩轉AI時代的入口
小龍蝦(Openclaw),一個開放原始碼的agent框架,正式發佈於2026年2月初,截止目前,OpenClaw是歷史上增長最快的開源AI框架。過去兩年,AI能力呈現出爆炸式增長。從大模型的推理能力,到多模態理解,再到 Agent 的初步落地,人類似乎已經站在“通用智能”的門檻前。但一個反直覺的現實是:絕大多數人,並沒有因此獲得實質性的生產力躍遷。AI 很強,但人類並沒有真正“用起來”。01 AI的核心瓶頸,不是能力,而是介面今天大多數人使用 AI 的方式,依然是:打開工具,輸入 prompt,獲得回答,然後結束,這是一種典型的一次性呼叫模式。這種模式缺乏記憶、持續性和執行能力,使 AI 更像一個強化版搜尋引擎,而不是一個持續工作的系統。真正限制 AI 普及的,不是模型能力,而是缺少一個“低成本、可持續、可調度的AI能力介面,而小龍蝦正是這樣的介面。02 小龍蝦的本質:個人AI作業系統如果說 ChatGPT 是一個對話工具,那麼小龍蝦是一個可以長期運行的個人 AI 作業系統。它和傳統 AI 的本質差異在於其具備三大核心能力:1)記憶(AI第一次記住你是誰):沉澱使用者的知識框架、工作流程、資料及個人偏好,讓AI真正成為你的“分身”。2)調度(AI持續為你工作):通過 Cron、Heartbeat 等持續運行的機制,小龍蝦可以:24小時監控資訊、定時執行任務、自動生成分析、主動推送結果。這帶來的是根本性的改變:AI從“被動響應”進化為“主動執行”。3)擴展:通過 Skills 和 API 接入,小龍蝦可以呼叫,鏈上資料、外部服務(交易、分析、內容生成)、agent網路(其他能力的Agent)。這意味著,你的AI不在只是“思考”,而是開始“做事”。03 為什麼小龍蝦才是AI時代的入口?大模型解決的是認知能力,但人類真正需要的是如何把認知能力轉化為生產力。而小龍蝦,恰好補上了這一層。1)它解決了AI的最後一公里問題,讓AI從一次性工具變為持續系統。(持續跟蹤問題、自動執行策略、甚至根據環境變化去調整行為)2)它也是人類的第一個數字分身:在網際網路時代:你是一個帳號、一個資料畫像。在AI時代:你=你的Agent(小龍蝦)小龍蝦可以承載:你的知識、你的策略、你的資訊結構、你的行為模式等專屬於你個人的一切特性。這意味著,人的生成力第一次被“可外化”和“可複製”。它構成Agent經濟的最小單位:未來網際網路結構不再是“人-app”而是“Agent-Agent”。例如,你的Agent呼叫分析服務、自動完成支付、再呼叫其他agent服務。這構成了一個全新的結構Agent Economy(Agent經濟),而你的小龍蝦就是你在這個網路中的節點。04 人類從用AI到用AI賺錢的躍遷今天大多數人會用AI,但無法自動獲取資訊優勢、自動執行策略、自動產生收益。而小龍蝦讓這一切成為可能1)資訊優勢自動化:自動掃描跟蹤變化、分析與推送決策。(資訊套利成為趨近於零)2)執行能力自動化:內容生成、策略執行、觸發操作。(執行成為趨近於零)3)能力複利化:每一次最佳化promt、skills、資料來源都會沉澱進系統並持續增強。(實現能力複利增長的成本趨近於零)05 為什麼不是大廠,而是小龍蝦?OpenAI、騰訊、AWS 提供的是,模型和雲服務。但缺少三件關鍵能力:(使用者需求)個體控制權、可定製執行邏輯、可組合經濟能力(資產化)。小龍蝦徹底解放了:讓使用者真正擁有自己的Ai Agent智能體。這就是在“顛覆式創新”裡面所講的“破壞式創新”,網際網路開始:去平台依賴,可組合(agent+api+payment),資料資產化(可交易/可複製)06 展望終局:每個人都至少有一個小龍蝦未來不會是,每個人使用幾個ai工具,而是每個人都將擁有一個持續運行的個人AI系統,它可以24小時工作、持續最佳化並持續創造價值。就像瀏覽器是PC網際網路時代的入口,iPhone是移動網際網路入口。而AI時代已經到來了,小龍蝦將成為AI時代的真正入口。這一次你還要再錯過嗎?07 結語大模型地不斷發展正在不斷刷新AI能力的上限,但真正決定普通人能否觸達這個上限的,不是模型本身,而是介面。而你的小龍蝦,正是這個介面。它讓AI從可用變為可持續使用,讓人類從使用AI走向擁有AI。對於大部分普通使用者,小龍蝦的建立部署、維運管理、功能拓展、隱私及安全性等的門檻還是非常高。因此,Clawdi提供了系統性的解決方案,幫助使用者更好的使用小龍蝦而不用擔心任何的其他問題。 (區塊鏈騎士)