#A.I.
連續5周反超美國!中國AI憑什麼領跑?一個職場人的真實經歷給出答案
“以前做一張報表熬到半夜,現在喝杯咖啡的功夫就搞定,這AI是真能救打工人的命!”做電商營運的小李,最近終於擺脫了被Excel支配的恐懼。而他的逆襲,正是中國AI實力崛起的一個縮影——據OpenRouter最新資料,中國大模型周呼叫量已連續5周超越美國,最新一周更是達到12.96兆Token,是美國的4.27倍,全球呼叫量前6名全是中國模型。很多人覺得“呼叫量領先”是遙不可及的行業資料,離自己的日常工作和生活很遠,但其實,這種領跑早已悄悄滲透到我們身邊,小李的親身經歷,就是最鮮活、最有說服力的證明。一、職場真實案例:從“表格噩夢”到“高效摸魚”,只隔一個AI的距離小李在杭州一家中小電商公司做營運,一晃就是3年,每天被各類表格纏得喘不過氣,其中最讓他頭疼的,就是每月5號前必須提交的全管道銷售資料彙總。“我們店舖主攻天貓和抖音,兩個管道的規則完全不一樣——天貓扣點10%、運費統一8元/單,抖音扣點15%還得加上達人佣金,每月還有平台補貼、滿減活動,光把兩個後台的原始資料匯出來、核對清楚,就要花1個多小時。”更麻煩的是算毛利,要手動套用“銷售額-扣點-運費-佣金+補貼”的複雜公式,一行行拉資料、核對數值,稍微分心就會出錯。“我經常加班到凌晨,眼睛盯著螢幕發花,就怕那個數字算錯,耽誤整個部門的復盤進度。”最讓他崩潰的一次,就發生在上個月。那天是月度復盤截止日,他熬到晚上11點,終於做完了報表,提交給領導後剛要下班,就收到了領導的奪命連環call:“小李,你這毛利算錯了!抖音的平台補貼漏算了3000多塊,導致整體毛利偏差近10%,趕緊重新做,明天一早要用!”掛了電話,小李瞬間洩了氣,看著螢幕上密密麻麻的數字,又累又委屈,眼淚都快掉下來了。“那時候真的想辭職,覺得自己每天都在做無用功,明明拼盡全力加班,卻總因為這種細節失誤拖後腿,連頓飯都吃不安穩。”他只能重新打開電腦,一點點核對資料、修改公式,硬生生熬到凌晨2點多,才把正確的報表提交上去。這樣的崩潰時刻,小李經歷了不止一次,長期的加班內耗讓他身心俱疲,直到上周,同部門的同事看他又對著滿屏表格愁眉不展,隨手甩給他一個連結:“試試阿里千問的表格Agent,我上次做活動報表,幾分鐘就搞定了,比你手動算快多了,還不會出錯,能幫你省不少事。”他對著對話方塊,一字一句輸入需求:“把本月天貓、抖音兩個管道的銷售額、扣點、運費、平台補貼、達人佣金整理成Excel,自動計算各管道毛利,按毛利高低排序,備註清楚每項資料來源。”隨後,他拍下兩個平台的後台資料截圖上傳。他端起桌上的咖啡,剛喝了一口,螢幕就彈出提示——報表已生成。他低頭一看,從輸入指令到生成表格,只用了1分40秒!打開表格,格式規範整齊,每項資料都標註了來源,公式自動套用無誤,甚至還幫他標註出了毛利偏低的單品,省去了他後續分析的麻煩,直接下載就能使用。“當時我都懵了,反覆核對了三遍,確認沒有任何錯誤!”小李笑著說,以前花3個多小時、熬到半夜才能做完的活,現在喝一杯咖啡的功夫就搞定了,再也不用熬夜改表格、擔驚受怕算錯數。更讓他驚喜的是,節省下來的時間,他能專心最佳化店舖營運策略——調整商品主圖、最佳化直播話術。這個月,店舖的轉化率直接提升了8%,銷量也跟著漲了15%,他還得到了領導的表揚。“現在我每天都能提前1小時下班,終於能按時回家吃晚飯,不用再讓家人等我了。”小李的逆襲,從來不是偶然,也不是個例。他用到的千問「表格Agent」,正是中國AI“實用為王”的典型代表,更是中國大模型呼叫量能連續5周領跑全球的核心原因之一——它不玩虛的概念,不拼華麗的參數,只聚焦普通人最迫切的痛點,把複雜技術變成人人能用的工具。二、千問重磅發力:國內首個全場景表格Agent,到底有多好用?阿里千問此次上線的「表格Agent」,是國內首個全場景表格工具,它最厲害的地方,就是把複雜的Excel操作,變成了“聊天”,那怕是完全不懂函數、不會排版的新手,也能輕鬆上手。1. 一句話搞定Excel,1-2分鐘直接交付成果不用手動輸入資料、不用百度查公式、不用反覆調整格式,只要用自然語言說出需求,AI就會自動完成所有操作。比如“整理2026年增值稅優惠政策成Excel清單”“把手繪的課程表轉換成可編輯表格”,甚至上傳一張紙質報表的照片,它都能精準識別,生成標準Excel檔案,無需二次修改。2. 多模態適配,覆蓋全場景需求它不僅支援文字指令,還能接收PDF、照片、Word等多模態輸入,無論是職場人需要的銷售報表、財務台帳,還是學生需要的知識點彙總、題庫表格,甚至是小微企業的進銷存台帳,都能一鍵生成,真正實現“對話即交付”。3. 專業級能力,告別錯誤與繁瑣它能自動聯網檢索最新資訊,自動套用複雜公式,還能在獨立的安全環境中完成操作,避免資料洩露。像小李遇到的公式錯誤、資料漏算問題,用它就能輕鬆規避,大大提升工作效率和精準性。三、連續5周領跑:中國AI的優勢,藏在“實用”裡很多人好奇,中國AI為什麼能連續5周超越美國,成為全球領跑者?其實答案很簡單:中國AI不拼參數、不炒概念,而是紮根真實場景,解決普通人、職場人、企業的實際痛點。美國的大模型多聚焦於實驗室裡的技術突破,追求參數的極致提升,卻常常脫離普通人的實際需求;而中國AI則走出了一條“普惠實用”的差異化路線——千問「表格Agent」解決了職場人的表格難題,鋼鐵大模型助力製造業轉型,各類AI工具走進千家萬戶,讓普通人也能低成本用上頂尖技術,真正實現技術賦能生活。就像小李說的:“以前覺得AI是高大上的技術,離自己很遠,現在才發現,它就是能幫我們少加班、少出錯的工具。”中國AI,從“領跑”到“賦能”,每一步都很紮實連續5周大模型呼叫量超越美國,從來都不是偶然,而是中國AI長期深耕真實場景、注重實用價值的必然結果。千問「表格Agent」的上線,不僅成功解放了像小李這樣被表格內耗的職場人,更清晰彰顯了中國AI的核心競爭力——好用、親民、親民,能真正解決問題。中國AI的領跑,從來不是為了追求資料上的好看,而是為了讓技術真正服務於人。當AI能幫我們擺脫繁瑣的重複勞動,能讓普通人也能輕鬆高效地完成工作,這樣的AI,才是真正有價值的,也是中國AI能持續領跑全球的底氣。 (紫光漫漫的寶藏箱)
筆記本“養蝦”,MTT AIBOOK夯爆了
當 AI Agent 從“聊天工具”進化為“數字員工”,在本地養一隻真正能自主幹活的“龍蝦”(OpenClaw),正成為眾多開發者與極客的新需求。然而,同樣的 OpenClaw 運行在不同的作業系統和硬體架構上,其表現出的形態與體驗截然不同。通過將摩爾線程MTT AIBOOK與MacBook、Windows PC的深度對比,我們可以清晰看到不同平台的設計哲學,以及它們在支撐 AI Agent 時的差異。安裝部署:繁瑣折騰vs 開箱即用對於AI Agent而言,環境部署往往是第一道門檻。在 MacBook 上搭建 OpenClaw 環境,主要依賴開發者熟悉的命令列工具。使用者需要依次配置 Git、Node.js,並運行官方指令碼。這套流程對資深開發者來說並不陌生,但需要投入一定的時間進行前置準備與版本維護。Windows PC 則為開發者提供了更豐富的選擇路徑——既可以選擇開啟 WSL2 部署 Ubuntu 子系統,也可以在原生環境中手動配置。這種高自由度帶來的代價是相對繁瑣的配置路徑,尤其是在處理子系統與宿主機之間的環境依賴時,往往需要較高的維護成本。相比之下,AIBOOK 採用的是“0幀起手”的開箱即用邏輯。最新的 MT AIOS 1.3.4 版本直接預裝了 OpenClaw,並與官方保持同步更新。系統內建了 12 款來自 ClawHub 官方技能社區的熱門實用 Skills,並預裝了 Qwen3-8B 本地模型。使用者無需介入任何環境配置,開機即可直接進入 AI Agent 的使用場景。系統生態:封閉圍欄vs自由生長決定一個AI Agent是“寵物”還是“員工”的關鍵,在於系統權限的開放度與呼叫硬體的自由度。macOS 以出色的隱私安全機制著稱,其嚴格的沙盒機制和 TCC 權限模型能最大程度保護使用者資料。但這種設計在面對需要 7×24 小時運行、需頻繁呼叫系統底層的 AI Agent 時,會產生不可避免的系統性摩擦。為了讓高級 Skill 正常工作,往往需要使用者手動授權,這種需“專人值守”的特性,使其更適合作為輕量級的日常輔助介面。Windows 的權限模型相對開放,但在運行 OpenClaw 時,主流的 WSL 子系統方案會引入額外的網路和檔案系統相容性開銷。當 Agent 需要呼叫宿主機的攝影機或麥克風時,仍需要進行額外的橋接配置,增加了跨環境通訊的複雜度。AIBOOK 搭載的 MT AIOS 基於 Linux 核心,天生契合開發與生產環境。其權限模型清晰直接、可程式設計,完美適應自動化服務的需求。在 AIBOOK 上,使用者可以通過自然語言直接觸發 Skills 的自動安裝。OpenClaw 能夠順暢地完成從環境檢測、依賴下載到模型配置的閉環,例如音視訊轉錄(FunASR)、語音合成(Kokoro)及視覺檢測(YOLO NPU/PaddleOCR)等能力,均可完全駐留在本地高效運行。算力底座:支撐思考與執行的硬實力本地化運行不僅需要權限,更需要紮實的算力支撐。MacBook 搭載的 M 系列晶片能效比優異(例如 M4 晶片提供約 38 TOPS 算力),能夠應對基礎的端側 AI 需求,但受限於統一記憶體和系統機制,大型模型的本地部署仍需手動適配。Windows PC 陣營擁有龐大的硬體跨度。輕薄本的整合顯示卡在處理複雜 AI 任務時稍顯吃力;而搭載頂級獨立顯示卡(如 RTX 4090)的工作站雖然能提供極高的算力,但往往伴隨著高昂的功耗與犧牲便攜性,更多屬於固定場所的“重型裝備”。AIBOOK 則在便攜與性能之間找到了專注 AI 場景的平衡點。其提供了 50 TOPS 的異構 AI 算力(CPU+GPU+NPU),不僅確保了預裝大模型的流暢運行,也為複雜的視覺檢測和語音互動提供了充足的算力冗餘,保障了低延遲與資料隱私。結語:給AI Agent一個原生的家不同的系統環境,承載著不同的計算使命。MacBook 是優秀的個人消費與創作終端,Windows 是全能的綜合性工作台。但如果您的核心訴求是擁有一位真正的“AI 員工”——要求它能看、能聽、會思考,能跨越應用獨立執行複雜任務,並且能在本地環境穩定、低延遲地長期運行,那麼 MTT AIBOOK 無疑提供了更純粹的土壤。不需要繁瑣的改裝與配置,AIBOOK 正以原生、開放、專屬的姿態,重塑 AI Agent 時代的個人電腦體驗。 (芯榜)
全球AI雙榜第一!力壓GoogleVeo與Grok,Vidu Q3「參考生」之王歸來
【新智元導讀】Vidu Q3帶著「全家桶」重磅回歸,視覺、聽覺、場景能力全面進化。AI視訊的生產級交付時代,真的來了。這個月初,Google一紙公告,把Veo 3.1的視訊生成能力,免費開放給了所有Google帳號。可以說,這是AI視訊史上的一個分水嶺——曾經一條10秒視訊要燒掉數美金的「奢侈品」,正在被巨頭硬生生做成「水電煤」。但越是免費、越是普及,一個尷尬的問題就越藏不住:模型可以無限趨近「能用」,可它和「能交付」之間,依然隔著一整條生產線。榜單上的分數、demo裡的炫技、社交媒體上的爆款片段,全都換不來一個劇組、一支廣告團隊、一條電商內容流水線的穩定輸出。熱鬧歸熱鬧,能用歸能用,從來就是兩件事。而當大多數玩家還在卷免費、卷解析度、卷畫面時長時,一個被低估的中國玩家,悄悄把答案擺上了桌。今天,Vidu Q3帶著「參考生」重磅回歸。作為全球公認的「參考生鼻祖」,這一次,它直接把「參考生」揉進一整套全家桶——以Vidu Q3參考生模型為「核心底座」,Vidu SaaS(Vidu Agent、Vidu Claw)與 Vidu MaaS(Vidu AI 開放平台)全面接入。其中Vidu AI開放平台,可0門檻接入、價格僅為行業平均水平的1/3、切鏡自然合理、生成速度快。同時,它還支援提示詞調優、工作流適配及專項培訓服務,即便在高峰時段也能確保穩健輸出。以上三層加在一起,構成了一套完整的、可直接接入真實生產流水線的內容生產系統。至此,Vidu Q3已全面覆蓋文生、圖生、參考生三大領域,完成由單一模型向全場景視訊生成方案的跨越。正如Slogan所言,「為劇而生,萬物可參」,Vidu正在做一件其他玩家還顧不上做的事:把模型能力,焊死在真正的生產流程中。「參考生之王」回歸 直接拍戲了要理解這件事的重要性,先把背景拎清楚。1月30日,Vidu Q3全球首發,在權威評測榜單AA上一騎絕塵,拿下了全球第一的成績。它一舉超越了Grok Imagine、Gen-4.5、GoogleVeo3.1等一眾領先模型。在全球首個參考生榜單,SuperClue榜單上,Vidu Q3斷層登頂,在多圖/單圖參考任務蟬聯雙榜第一。首次亮相,Vidu Q3便主打「為劇而生」,成為全球首個聲畫直出16秒的AI視訊模型。事實上,整個AI視訊行業的競爭焦點,正在悄悄發生一次根本性的位移。視訊大模型,正在從「生成畫面」邁向「生成內容」。比拚的重點也從單點能力,轉向兩件更本質的事——是否具備完整的敘事能力,以及,是否能進入真實場景的生產級交付。這兩件事,才是把AI視訊從「技術demo」推向「內容生產力」的真正分水嶺。Vidu Q3的出世,恰恰被視為整個行業轉變的階段性節點——從最早的「視訊生成」,到Q2的「演技生成」,再到Q3真正具備「劇集生產能力」的敘事單元級躍遷。每一步,Vidu都踩在了行業演化的關節上。而支撐這次躍遷的關鍵變數,正是Vidu一直握在手裡的那張王牌——參考生。在AI視訊走向生產級交付的這條路上,「參考生」的角色正被徹底改寫。它不再只是一個提升畫面一致性的工具能力,而正逐漸演變為一種可復用、可組合的內容生產範式。作為全球「參考生」首創者,名副其實的「參考生之王」,這一次,Q3直接把其從模型層推到了應用層。這種巨變,直接體現在了漫劇、短劇、廣告、影視劇等應用場景中的可用性和交付性。換句話說,Vidu讓AI視訊,真正具備了「劇」的表達能力,為劇而生。萬物可參,為「劇」而生,聲畫同出在視覺、聽覺和場景上, Vidu Q3系統性升級,招招致命。相較於上一代,Q3不再執著於枯燥的「生成質量指標」(FID/FVD)比拚,而是死磕一個核心目標:讓AI生成內容,真正具備「劇」的表達能力。要知道,所謂的「劇集感」,是由無數個符合直覺的微小細節堆砌而成的。Vidu Q3在視覺、聽覺與場景三個關鍵維度上,交出了一份令人「恐怖」的答卷。在視覺方面,Vidu Q3新增六大特效:粒子、流體、動力學、運鏡、轉場、光影,將其深度融入敘事語言,讓生成內容更接近「成片級表達」。五大沉浸式音效:環境、動態、氛圍、擬音、情緒,讓Q3賦予了AI視訊「聽覺上的敘事連續性」。至此,聲音不再是畫面的附屬,而是情緒的載體。最重要的是,Q3場景能力已進化為直接對齊工業流程的「內容單元」,大幅縮減從創意到成片的距離,覆蓋了短劇、漫劇、影視劇、廣告四大場景。在這些領域,Vidu 不僅實現了極速生成與高頻迭代,更通過極高的視覺穩定性,率先解決了AI創作中「角色一致性」的行業難題。這種從點到面的全場景滲透,標誌著Vidu已從技術驗證期跨入深度產業應用期,建立了不可踰越的落地領先優勢。為了驗證其真實戰力,我們拋棄了傳統的「跑分邏輯」,直接把Vidu Q3扔進更接近真實生產的內容場景裡——漫劇的高燃瞬間、短劇的情緒爆點、影視級的災難與懸疑調度,以及廣告的多元創意。高燃漫劇漫劇,是過去兩年AI內容工業化跑得最快的賽道之一。低成本、短周期、可批次生產,這些特性天然契合AI視訊的能力邊界。但也正因為漫劇對「量」的極致追求,它把AI視訊最致命的那塊短板暴露得淋漓盡致——一致性。一部大約60分鐘的漫劇,每分鐘三四十個鏡頭,每段AI生成的素材只有5–10秒。這就意味著,整部劇是由上千段片段硬拚而成。過去,AI模型最大的問題,是每一張圖之間彼此獨立:人物的臉換了一點、服裝紋樣飄了一點、道具位置跳了一幀,觀眾瞬間出戲。創作者在剪輯台前熬夜重抽素材的痛苦,幾乎是整個行業的共同記憶。一個能夠支援批次生產與快速迭代、同時把主角、場景、道具死死鎖住的模型,是漫劇工業化真正的分水嶺。丟給Vidu Q3一張紅圍巾校服少年的立繪,讓它生成一個「熱血少年覺醒變身」的短片。結果令人震撼,狂風的怒吼、電流的尖嘯、大地的碎裂聲在這一秒瘋狂交織、層層遞進,將情緒推向了最頂峰。最關鍵的突破點在於:複雜的特效變化下,男主形象始終如一。再比如,投喂給Q3一張古風女主的角色圖片、一張江南水鄉的場景圖、一套手繪的服化道參考。提示詞唯寫了一句,「@圖1穿著@圖2衣服,在@圖3江南水鄉行走」。可以看到,動漫女主的臉部特徵被死死鎖住,沒有出現任何畫風偏移或五官融化,服裝的紋理與褶皺也隨著行走步伐自然飄動。而且,背景還夾雜著微風、鳥叫聲、腳步聲生動的環境音效。如果說單人變身是基礎操作,那麼複雜的「雙人肢體纏鬥」則是檢驗AI模型能力的試金石。上傳兩個主角的圖片,在這段激烈的對峙戲中,Vidu Q3展現出了令人膽寒的技術統治力。面對拳腳相加、重擊倒地、連續翻滾等大動態物理互動,Vidu Q3將兩位主角的形象死死鎖住,徹底告別了傳統AI常見的「面部融化」與「服飾穿模」。不僅如此,它在音效與情感生成的顆粒度上達到了影院級水準:沉悶的肉搏聲、倒地後紊亂的喘息,甚至刀鋒逼近脖頸時那一聲微小且冰冷的顫音,都與畫面嚴絲合縫。這一段,可以直接剪進漫劇成片裡,幾乎不需要返工。真人短劇如果說漫劇拼的是「量」,那短劇拼的就是「戲」。中國短劇市場一年狂飆到幾百億規模,單集時長被壓到極致,敘事密度卻反向拉滿——每一句台詞、每一次對視、每一個停頓,都必須精準擊中觀眾的情緒點。大幅降低製作成本和周期,是短劇行業對AI視訊最迫切的呼喚;但前提是——AI必須先學會演對白戲,也就是說,短劇的生死線是「對話」。過去AI視訊在多人對話場景上最容易翻車:要麼兩個人同時張嘴像合唱團,要麼口型對不上台詞,要麼切鏡頭的瞬間人就變了。觀眾能容忍畫面糙一點,但對話一崩,戲就徹底散了。且看下面這段極其細膩的古風雙人對角戲,呈現了Vidu Q3令人驚嘆的「影視級演技」。Vidu Q3 不僅將兩人的骨相特徵與複雜的古裝妝造死死鎖住,更完美呈現了男主嘴角輕佻時那抹似有若無的笑意。這種告別了「AI僵硬感」的細膩神態捕捉,讓角色瞬間擁有了鮮活的靈魂。更令人稱絕的是隨後的雙人台詞交鋒,對話時口型的毫釐不差。再比如來一個現代劇,女強人和霸主之間的糾葛,在Vidu Q3的筆下呈現得淋漓盡致。廣告/電商對於廣告或電商而言,用AI的最大訴求可能就是提升效率──不止是素材版本多,創意要快,要快速試錯。素材生產效率,就是速度、就是搶先引爆熱點的優勢。而Vidu Q3不僅提升了素材生成效率,更重要的是人物、風格統一可控,商品不走樣,背景或人物任意選。比如,下列唇蜜的廣告,利用Vidu Q3參考生功能,可快速篩選不同的風格:只需替換參考模特,一鍵生成不同風格、聲情並茂的視訊,真一鍵出片!鏡頭逐漸推進唇部,模特用唇蜜塗抹在嘴唇上,特寫鏡頭展示唇蜜質感。廣告大片效果,多鏡頭展示。最後手持唇膏模特說說:This touch is more than just color.。去掉bgm,保留人聲再舉一個例子,老梗換新貨,更容易在網上爆紅。比如,威爾·史密斯吃義大利面,就是國外的經典梗之一,可謂歷久不衰。在Vidu Q3,用他的表情包+新的商品(比如漢堡),繼續利用參考生就能生成類似場景的梗圖。這效果看起來是真香!影視預演/內容創意影視劇是AI視訊最難啃的一塊骨頭,但也是價值天花板的最高場景。過去,一個劇本從文字到成片,中間要經歷概念設計、分鏡繪製、預演拍攝、特效合成——這背後,動輒是上千萬的預算,是以「月/年」為單位的製作周期。整個行業最渴望的,是一種能把劇本快速可視化、分鏡自動生成、創意驗證前置的能力,讓導演在燒錢之前,就先看到自己腦中的畫面。Vidu Q3沒有選擇繞路,直接正面正剛。它挑了三種最吃功力的片種:科幻、災難、懸疑。給到一段提示詞:根據參考機甲與未來都市場景,生成一段電影級科幻追逐戲。夜色中的賽博朋克城市高樓林立,霓虹燈閃爍,主角駕駛機甲在高架橋與樓宇之間高速穿梭,後方數架敵方飛行器緊追不捨。鏡頭先從城市遠景俯拍,再切入近距離追蹤,機甲急轉、噴射推進、擦過廣告螢幕與樓體邊緣,期間伴隨爆炸火光與碎片飛散。畫面要求有強烈速度感、空間縱深與電影感,參考主體外觀保持穩定,特效密集但清晰。這個生成的難點在於,俯拍切近景、遠景切追蹤、機甲高速運動、爆炸的碎片層次....每一個細節,都考驗著模型對「電影感」的理解。更狠的是音效,直接構成了一個立體聲場,給人一種身臨其境的壓迫感。再來看災難片,考核的是尺度與震撼,這是這類型大片的標準配方。Vidu Q3在生成效果中,處理了多層次的視覺要素:天空、水牆、慌亂的人群、建築物震顫,每一個要素配合著調度營造出一種末日緊迫感。而且,由遠及近的聲壓推進,更成為了這個視訊重頭戲。更令人想不到的是,一段廢棄醫院的長鏡頭,瞬間拉滿了那種脊背發涼的氛圍感。Vidu Q3不僅在空間推進中保持連貫,還在光影忽明忽暗中保留了真實性,角色表演也有一定的張力。音效更是克制到極致,燈管電流雜音、走廊回音、腳步聲、呼吸聲,把緊張感推向頂點。總言之,Vidu Q3在視覺、聽覺與場景三個關鍵維度上,將四大場景的應用推向了新的高光時刻。偉大的技術 最終都將隱形於無形縱觀科技史,任何一項偉大的技術,其最終的宿命都是「隱形」。當電動機剛發明時,人們驚嘆於電流的魔力;但當大工業時代到來時,電動機隱身於工廠的流水線中,人們只看到源源不斷產出的精美商品。今天的AI視訊行業,正在經歷同樣的蛻變。Vidu Q3通過極盡複雜的底層演算法攻堅,通過從Q1到Q3的艱難跋涉,換來的,恰恰是創作者極其簡單的「為劇而生」。它終結了那個需要靠算運氣、抽盲盒才能得到一段好視訊的時代;它把AI視訊從獵奇者的「玩具箱」,搬到了專業創作者的「工作台」上。「萬物可參」,參考的不僅是現實世界的像素,更是人類無盡的想像力。當你在Vidu App中敲下第一行劇本,當Vidu Claw為你自動生成第一組分鏡,當Vidu Q3用它極具張力的音效和電影級的光影,把你腦海中那個原本只敢做夢的龐大宇宙完美呈現時,你會深刻地意識到:不要用做盲盒的邏輯,去奢望大工業時代的轟鳴。AI視訊的「前戲」已經結束,屬於創作者的、由新質生產力驅動的「大航海時代」,在Vidu Q3按下Enter的那一刻,正式拉開了帷幕。在這個充滿無限可能的時代,最好的故事,不再受制於資本的傲慢與工業的繁瑣。 (新智元)
李開復陸奇重倉同一家Harness智能體公司,李笛帶隊,4個月2輪融資3-5年糧草
多智能體賽道爆發,Harness成為破局關鍵,資本加速佈局。剛剛,成立僅四個多月的AI初創公司明日新程(Nextie),宣佈連續完成兩輪融資。其中,天使輪由創新工場、Atypical Ventures聯合領投,奇績創壇繼續跟投。原微軟全球副總裁David Ku等個人投資者,以及公司獨家財務顧問安可資本等,也紛紛看好入局。公司表示,當前資金儲備已夠未來三到五年持續創新所需。幕後掌舵人,正是“小冰之父”、微軟亞洲互聯網工程院原副院長李笛,以及與他並肩多年的微軟小冰創始核心班底。△李笛在奇績創壇路演日上壓軸登場在一級市場整體降溫、機構出手愈發審慎的當下,一家成立不到半年的公司卻能連融兩輪,更迎來陸奇、李開復兩大AI圈頂級“風向標投資人”罕見同框、同步押注,這本身就是一種訊號,體現了資本對其團隊、技術、賽道的多重認可。所以這筆資金將投向何方?團隊給出的答案很明確,大方向只有一個——Harness群體多智能體。當下,無論是持續霸屏的OpenClaw,還是近期風頭正盛的Hermes Agent,AI Agent正以前所未有的熱度席捲整個行業。隨著實踐的不斷深入,Harness的價值逐漸清晰。包括OpenAI、Anthropic在內,越來越多頂尖團隊已意識到,Harness是智能體落地的核心支撐。有意思的是,這個判斷,明日新程團隊負責人李笛早在去年就已給出。去年12月7日,奇績創壇Demo Day上,李笛壓軸登場,系統性拋出群體智能理論,並對Harness趨勢有了準確預判和率先佈局。雖然他本人很低調:我們現在其實都比較羞於說我們早就看到了什麼,這個是沒有用的。這個世界上永遠都是,你做它比你看到它要難得多。就像《駭客帝國》裡有句話,知道路與走路,二者截然不同。如今,該賽道已成為投資人佈局AI下半場的核心標的。而明日新程,也已在這一領域形成了領跑態勢。Harness為何會成為行業共識?明日新程又憑什麼能夠殺出重圍?團隊下一步又將如何落地?量子位與李笛聊了聊。糧草已備,重倉佈局Harness群體多智能體OpenClaw火遍全網,無疑為智能體賽道按下了加速鍵,讓行業第一次真切看到了智能體主動幹活的潛力。但當人們開始把它當“正式員工”用時,問題來了。這事兒要說還得Meta最有發言權……Meta安全對齊總監Summer Yue的信箱,曾一夜之間被OpenClaw清空所有郵件。此事過去沒多久,OpenClaw未經授權擅自行動,將敏感的公司和使用者資料,洩露給無權限員工長達近倆小時。究其原因,該框架在工程實現上,尚處於早期階段,缺乏Harness等級的技術注入。在處理24小時以上的長程複雜任務時,其Token消耗量巨大,效果卻常常不盡如人意,穩定性與安全性仍有很大提升空間。用李笛的話來說,任何一個超級智能個體,無論它的智能水平達到什麼程度,都一定有盲區,沒有辦法自我糾偏。而當超級智能個體處理長程任務時,錯誤會隨著時間累積被指數級放大。隨著行業實踐的深入,AI廠商逐漸關注到這一問題。Harness,如今已成為AI工程領域的新共識。所以,Harness到底是什麼?從本質來看,Harness意為“馬具”,類比到AI領域,就是連接“模型(馬匹)”與“人類需求(騎手)”的核心框架。它不直接參與任務執行,卻能通過明確的約束、規範與協同機制,引導多智能體高效協作,避免失控,實現“約束換自主”的核心價值,這也是其區別於Prompt Engineering、Context Engineering的核心所在。今年2月,OpenAI發佈官方Blog《Harness Engineering: Leveraging Codex in an Agent-First World》,通過實驗證明AI是可以獨立完成全流程開發的執行主體,但必須有一套框架來駕馭它。通過Harness Engineering,3人工程師小組在5個月時間裡,可以利用Agent建構百萬行程式碼的產品。Anthropic最近也發佈了新Agent架構Managed Agents,技術文件中也有反覆強調“Agent Harness”。而明日新程在這條路上,堅持得比別人更專注一些。不同於行業內對Harness的單一架構解讀,明日新程所佈局的“Harness群體多智能體”,是將Harness工程化理念與群體智能深度融合的全新體系。它並非簡單的“多智能體+約束規則”,而是以原生群體智能與認知模型為核心,讓眾多具備不同認知能力、不同功能定位的Agent,按照明確的規則協同工作、互相校驗、迭代最佳化。李笛進一步解釋,Nextie的Harness核心包含三個關鍵元件:上下文管理、參與其中的多智能體、多智能體協同方法。其中,多智能體協同方法最為關鍵,團隊內部將其稱為“認知碰撞”,即通過辯論、挑戰、反思、同行評審、投票等方式,讓多智能體真正實現思辨與互補,而非“表演式一致”。上下文管理,則確保多智能體在協同過程中獲取的資訊精準、全面且適度,避免因資訊過載或偏差導致荒謬結果;Agent池最佳化,指的是根據任務需求動態搭配不同角度、不同功能的Agent,實現協同效率最大化。這種體系既能解決OpenClaw等框架的長程協同痛點,讓多智能體在長周期任務中保持穩定高效;又能通過群體思辨、共識機制,打破單一Agent的認知盲區,輸出經過權衡的最優解,真正實現“群體智能大於個體智能之和”。這也是明日新程對多智能體賽道未來的核心判斷。這其中的種種思考,繞不開一個詞——協同。“協同”這道題,他們在小冰時代就思考了李笛團隊的佈局並非一時興起。“自2022年以來,我們一直在準備這個時刻”,李笛把這段蟄伏期拆成了幾個關鍵節點。第一個節點,是在2022年底。彼時,Transformer架構的合理性已被徹底驗證,其顛覆性潛力讓行業看到了全新可能。在當時,團隊受到了決策體系的限制,但李笛最終還是帶著團隊自籌算力,把這條線先跑了起來:我們手裡有一套基於上一代技術的框架。我們能清晰感知到框架本身的潛力,但它被上一代技術拖累了。當看到新技術出現時,我們眼前一亮,很多過去棘手的難題,終於有了破解的可能。但興奮之餘,一個更為根本的問題浮現出來:有些障礙,不是靠模型能力變強就能繞過去的。這個問題,種子早在小冰時代就已埋下。團隊最初的目標就不止於打造一個“小冰”,而是建構千千萬萬個能精準匹配使用者需求、且彼此配合的AI。但實踐中他們發現,單個Agent再聰明,一旦放進多智能體場景,局面就失控了。要麼是“表演式一致”,表面上一團和氣,實則誰都沒往深裡想;要麼互相衝突內耗,整體效率還不如單干。完全依賴模型自身驅動協同,遠遠不夠。於是,一條新的研究方向被李笛團隊單獨闢出來:多智能體之間,到底應該怎麼協作?在他們看來,唯一的參考藍本,就是人類社會。畢竟,人類是迄今所知的、唯一實現了大規模高級認知協同,並持續產出價值的群體。為此,團隊還專門梳理了1800-2020年整整220年的人類文獻,只為拆解“群體智慧”的演進脈絡。時間來到2023年年初,團隊提出CoT是關鍵。他們自研了“小冰鏈”(X-CoTA),驗證了思考過程透明化的核心價值。小冰鏈僅使用了GPT-3約2%的參數量,便實現了可觀測、可追溯的思維鏈建構,並能夠在推理過程中即時獲取外部資訊、做出行動決策。實際上,CoT也是多智能體協同大計畫中的一塊關鍵拼圖。在團隊的構想裡,真正高效的協同,不能只共享結論,更要同步思考過程。就像人與人協作,只有知道對方的推導邏輯,而非僅僅拿到一個結果,才能實現超越表層的深度配合。到了2023年年底,團隊做的開源大模型性能超越了Meta同期產品。他們欲乘勢而上,提出研發推理模型的新計畫,但在當時的決策框架下,這個方向再次被擱置。2025年12月9日,李笛帶領微軟小冰創始核心團隊成立新公司明日新程(Nextie)。如今,技術條件、市場環境、團隊狀態終於迎來同頻共振的時刻。團隊現在手握完全的決策權,可以心無旁騖地深耕Harness群體多智能體賽道。延續對“多智能體協同”的長期思考,明日新程團隊組建之初,便將核心方向鎖定為原生群體智能與認知模型。今年2月份,團隊打造的首個原生群體智能平台——“糰子(tuanzi.ai)”發佈內測版。量子位在產品剛發佈時,就上手實測過:使用者提出問題後,幾十個Agent成團“圍坐一桌”,各抒己見、互相補充、辯論交鋒,甚至還有投票表決、同行評審這樣的專業環節。它不追求單一智能體的能力極致,而是聚焦“群體協同價值”,既能勝任高認知複雜度的深度研究任務(通過多智能體思辨、碰撞,破解單一模型的認知侷限),也能適配以OpenClaw為代表的長程多智能體協同、大規模群體模擬等核心場景,真正將Harness理念落地到了產品層面。在團隊設計的視角完備性、辯證深度、落地實操性、隱含訴求滿足度、決策五維度評測指標中,Nextie綜合表現顯著優於競品。不僅超過了包括ChatGPT-5.2 Thinking在內的單一大模型;同時,在達到同等思考深度的情況下,整體計算消耗(Token)可降低約50%。此外,前段時間引發關注的“衛士蝦”TuanziGuardianClaw,則是群體智能能力的又一次實戰驗證。這只專門堵OpenClaw安全漏洞的Agent,完全由糰子群體智能體自主協同設計而成。量子位還打探到,目前明日新程內部大量使用Agent作為“人機共生的同事”,採用“常駐Agent+臨時Agent”的協作模式——常駐Agent負責常規開發與產品設計,臨時Agent根據具體任務需求動態補充。“衛士蝦”就是安全領域的臨時Agent與常駐Agent協同完成的。“小冰島”將以新形態重現談到近期產品規劃,李笛向我們透露了團隊醞釀已久的全新動作。他們正在全力打造一款形態接近“小冰島”的全新產品。它不再侷限於簡單陪伴,而是能夠協同完成各類複雜、長期任務,讓一群Agent真正做到幫使用者幹活、陪使用者成長,並在持續互動中與使用者建立深度繫結關係。李笛表示,新產品最大的延續,在於小冰島最初的設計理念:觀察圍繞每一個人,究竟配備一群怎樣的Agent才是最適配的。每個人的需求不同,有人需要工作支援與情感陪伴兼顧,有人更需要理性、專業的決策輔助。我們要做的,就是讓Agent群體真正貼合使用者本身。而產品最核心的升級,則是技術層面的全面迭代,深度融入糰子的Harness群體智能能力。李笛解釋,當年做小冰時,受限於技術水平,很多複雜的協同邏輯只能靠工程抹平,無法實現真正的智能協同;如今有了大模型與Harness,終於能實現當初的設想。以前在小冰島上,你告訴一個AI“我失戀了”,這個AI無法判斷是否要把這個私密資訊傳遞給其它AI,要麼所有人都來安慰你,讓你尷尬;要麼只有這一個AI知道,無法形成真正的情感支援。但現在,Agent會通過智能判斷,做出最合理的反應,你的每一次互動,都會在Agent群體中產生智能、合理的漣漪。未來,使用者可以擁有一組像OpenClaw一樣的自主Agent,他們能夠根據你的自身需求靈活調整。換句話說,這群Agent,從來都只是為你而存在。由此,這也將打開多智能體全新的應用場景。By the way,新版“小冰島”預計本月底推出~ (量子位)
全世界消耗Token最多的人
2025年之前,想要證明自己混得好,大概得腕上戴塊百達翡麗,車庫裡停輛庫裡南。但到了AI時代,硬通貨變了:看你一年到底燒了多少Token。一年燒掉250億個Token,有位25歲的韓國小夥子,成了全世界最能燒的人。2025年12月,首爾江南區一家中餐館裡,Anthropic(Claude系列大模型的開發公司)擺了一桌私宴。公司聯合創始人Ben Mann帶著幾位高管,跟一群重度使用者圍坐一桌,暢談怎麼讓AI代理系統跑得更穩、更靠譜。席間最打眼的是一位24歲的韓國年輕人。他頂著亂糟糟的齊肩捲髮,臉上還帶著幾顆沒消下去的青春痘,笑起來一臉膠原蛋白,身材微微發福,看起來就是個普通大學生模樣。他叫Sigrid Jin。很難想到,這位其貌不揚的小夥子,正是Anthropic當時公認的“榜一大哥”。一年內,他一個人在Claude Code上燒掉了250億個Token。250億個Token是個什麼概念?按開發者常用的Claude Sonnet 4.6定價(輸入3美元/百萬Token,輸出15美元/百萬Token),假設輸入輸出比例為2:1,這筆開銷大概相當於17.5萬美元,折合人民幣約125萬。這筆錢,放在北京五環外,差不多夠付一套小兩居的首付。Sigrid Jin一個人去年在模型上燒掉的錢,抵得上一套三線城市的房,也夠在北京紮根了。圖|claude官網定價Sigrid Jin本名Jin Hyung Park,今年25歲,目前還在英屬哥倫比亞大學(UBC)讀書。不過他是個出了名的“輟學專業戶”,2018年和2024年先後兩次暫時離開學校,到現在也沒固定專業,只是掛在理科大類下面。他的技術不是科班出身,而是靠參加後端開發訓練營自學成才。他的人生路徑相當跳脫。高中就讀於韓國外國語高中,主修語言和人文,當過辯論隊隊長,還辦過TEDx。工作經歷更是五花八門,他做過以太坊稽核員、給經濟學人寫過研報、在空軍服役期間負責過財務和人事助理。圖|領英上,Sigrid Jin的部分工作經歷直到2022年底,Sigrid Jin才真正開始碰軟體開發。各種經歷雜糅在一起,像一團沒理順的程式碼。現在,他已經是韓國最大LLM研究社區instructkr的創始人。這個Discord群裡聚集了一千多名活躍成員,平時大家就在裡面聊模型、分享workflow、吐槽各種agent的坑。另外,他還是Sionic AI的團隊成員。2023年,Sigrid Jin加入這家公司,開始研究一個叫“AI Harness”的方向。通俗一點解釋,如果把單個AI Agent比作幹活的工人,那AI Harness就是整個工地的總調度。它負責定規矩、搭流程,讓不同的AI工具像流水線一樣配合起來,真正做到“沒人盯著也能一直跑”。為了驗證這套系統,Sigrid Jin和團隊直接開了5個OpenAI Codex Pro帳號、6個Claude Code Max帳號,同時讓它們狂跑,一天就能燒掉20億Token。據說,他所在的初創公司Sionic AI過去一年總共消耗了1380億Token,算力燒得那叫一個毫不手軟。真正讓他封神的,是那個程式碼洩露的凌晨。2026年3月31日凌晨,Sigrid Jin被手機震醒。消息鋪天蓋地,Claude Code的原始碼洩露了。洩露的起因堪稱荒誕。Anthropic在npm更新時,打包工具出了問題,一個60MB的source map檔案被塞進了安裝包,裡面躺著51.2萬行TypeScript原始碼。最先發現的是安全研究員Chaofan Shou。凌晨4點23分,他在X上扔出一個下載連結,帖子很快收穫了1600萬瀏覽量。幾小時內,GitHub上冒出了8000多個複製,Anthropic的法務團隊緊急出動,一口氣發了8100份DMCA下架通知。Sigrid Jin的消息列表炸了。他遠在韓國的女朋友連珠炮似的給打電話,聲音都在發抖。女友擔心Sigrid Jin的電腦上存了那些程式碼,會有法律風險。Anthropic之前起訴過類似項目。圖|程式碼洩漏當晚,Sigrid Jin發帖換做普通人,可能早就刪庫跑路了。但Sigrid Jin做了件更瘋的事。他決定,不看洩露的程式碼,只用AI Harness從零重寫一個。他啟動了自己參與推廣的oh-my-codex(OmX)。這是另一位韓國開發者Yeachan Heo打造的AI工作流編排層,基於OpenAI Codex建構。Sigrid Jin是該項目的社區大使,對這個工具的調度邏輯瞭如指掌。在這個工具的調度下,多個AI代理同時開工。team指令負責平行程式碼審查和架構反饋,ralph指令執行持久化的驗證循環。Codex負責程式碼生成和審查,其他模型輔助檢索。短短幾個小時,他和同伴就用另一種方式把Claude Code那51.2萬行核心邏輯完整復現出來,搞出了一個平替版“Claw Code”。整個過程有點像翻拍一部經典老電影。主線和靈魂沒變,但台詞、演員、佈景全換成了自己的那一套。天還沒亮,Claw Code就被推上了GitHub。兩小時內收穫5萬star,24小時突破10萬,成為GitHub歷史上躥升最快的項目之一。Anthropic後來對8100多個直接搬運洩露程式碼的倉庫發出了DMCA下架通知,唯獨Sigrid Jin的clawcode安然無恙。因為它屬於“淨室重寫”(clean-room rewrite),一字節原程式碼都沒抄,版權上完全算獨立創作。“這是用250億個Token換來的直覺。”Sigrid Jin後來這樣評價。這種直覺來自他對Claude Code近乎痴迷的鑽研。今年2月,他特意飛去舊金山參加Claude Code的一周年生日派對。本以為會看到一屋子極客,結果現場擠滿了醫生、律師、音樂家之類的普通人。一位加州律師用Claude Opus 4.6做了一個自動化建築許可審批工具,還在駭客松裡拿了冠軍。這讓Sigrid Jin意識到,AI Harness不再是極客的玩具,而是這個時代最迫切的基建。圖|claude code一周年生日會合影一周後,他在舊金山辦了一場一百多人的程式設計活動,規則特別離譜。參賽者設定好任務後,從中午12:30開始四個小時全程不能碰電腦。如果忍不住想干預,就得穿上紅色的龍蝦服當懲罰。Sigrid Jin把這叫“IRL模式”:一邊瘋狂用AI代理幹活,一邊強迫自己切換回現實生活,別完全沉進去。這大概就是他在那250億Token裡摸索出來的生活態度。雖然他的GitHub上堆著上百個實驗項目,但他的社交媒體首頁卻主打粉紅色,氛圍輕鬆又快樂。頁面裡時不時出現女明星和呆萌動漫頭像,還有他打卡學習中文的帖子。Claw Code爆火之後,他還認真回覆網友:“別只顧著造AI agents,也要去現實裡好好經營人際關係。”在2月的生日派對上,他曾對著鏡頭半開玩笑地喊:“讓Claude Code再便宜點吧,求求了。”結果一個月後,他做出了同樣功能的Claw Code,而且還能免費使用。現在,這個“全世界燒Token最多的人”,終於成了真正握有AI掌控權的那一撥人。只不過他的方式有點特別。他沒有去寫更牛的程式碼,而是設計了一套更狠的規則,讓AI自己去管AI。那250億個Token,不過是他交給這個時代的學費。而當他把Claude Code的靈魂用免費的Claw Code還給全世界時,故事才真正收尾。在AI時代,最頂級的Token消費,從來不是為了證明你有錢,而是為了把門檻踩得稀巴爛。從這個角度看,Sigrid Jin這250億個Token,燒的不是錢,是一張通往新世界的門票。 (36氪)
阿里首提智能體經濟,在全球AI競爭顯鋒芒!
行家一出手,便知有沒有!自AI問世以來,已成中美科技必爭之地,誰能笑到最後,關鍵還是要看應用!在這方面,矽谷那邊的公司一直想打通AI+消費這條路,但缺乏穩固的生態和龐大的應用場景,一直流於形式,還未實踐。而阿里在春節期間取得了千問辦事的成功之後,在新財年的首次集團戰略會上,阿里正式提出,要全力推進以千問為代表的智能體經濟。1. 什麼是“智能體經濟”?對普通人有什麼意義?“智能體經濟”簡單來說,就是通過AI這個技術載體來推動更好的消費,也就是很多官媒說的“AI+消費”!這玩意對普通人來說,有三好!一好為:方便。比如以前點外賣,得自己去外賣軟體上一個個找,現在一句話就能搞定;以前買電影票,選座位得研究一下,現在交給千問按需訂票。可以這麼說,過去很複雜的消費流程,現在一句話就能辦完,給誰誰能不喜歡?二好為:創造新的機會。往前翻個20年,就能發現每一次技術革新,除了會為行業帶來新變化以外,也會創造新的機會。比如當年的電商,讓很多人從個體戶變成了小老闆;10年前左右的自媒體,催生了現在的網紅經濟;那麼如今阿里的智能體經濟要發展,必然也會衍生出一系列的工作崗位,現在能想到的就是營運、設計、AI訓練師之類的工作,往後發展這方面人才缺口勢必會放大,普通人只要抓住機會,很有可能直接改變命運。三好為:技術普惠這個怎麼理解呢?以老年人為例。很多上了年紀的老人。對於智慧型手機用的並不熟練。一個人在家想點個外賣,都搞不明白。但在千問智能體經濟的技術普惠下,老年人也能一句話搞定外賣,體驗到年輕人的生活方式。網際網路的浪潮奔湧向前,阿里通過技術普惠,讓銀髮一族也能緊跟時代的步伐,這既是社會責任的體現,也是技術便利每一個日的最好寫照!2. 為什麼阿里是第一個提出此概念的公司?因為只有阿里具備這些條件!這個智能體經濟兩大要素,過人的技術,優秀的生態。而這兩方面,不管是那個條件,阿里都是王中王、頂中頂!論技術,阿里從模型到GPU晶片都是行業頂尖。最新模型Qwen 3.6 Plus一經發佈,單日呼叫量突破1兆Token的模型,問鼎全球大模型周呼叫量冠軍,究其原因,是因為它是國產程式設計模型技術能力的天花板。上周的時候,在AI視訊生成領域,由阿里巴巴內部孵化的模型HappyHorse-1.0,登頂Artificial Analysis排行榜。這個大模型有多牛?它在文字生成視訊、圖片生成視訊等四大核心賽道中全面領先。這也能證明,阿里在AI領域持續投入是有結果,同時,阿里在多模態大模型領域技術積累也非常的雄厚。平頭哥自研GPU也已實現規模化量產,截至26年2月已累計交付47萬片。AI技術,大模型是基礎,GPU是運轉的關鍵,兩大技術阿里全都有,並且全都硬,為智能體經濟提供了堅實的保障。論生態,阿里積累了20多年的網際網路商業、消費經驗,旗下擁有淘寶、閃購、高德、飛豬等覆蓋人們吃喝住行娛一體的生態產品,並且還這些產品還和千問全部打通,這也就將阿里的生態優勢賦能到了AI應用端。為了集中力量辦大事,4月8日的時候,阿里還進行了組織架構調整,新設立了阿里巴巴集團技術委員會,吳泳銘任組長,周靖人擔任首席AI架構師,整合優勢資源,投入到智能體經濟戰略當中來。3. 總結阿里今天提出智能體經濟,是其科技實力的體現,也是生態經營多年的結果。這大概也就是此前美國知名科技商業媒體The Information發報導稱:“阿里巴巴在AI辦事領域的進展快於亞馬遜和 OpenAI。”的原因所在! (梁穩健)