#豆包
豆包日活破億,中國國產AI大戰邁入新階段?
國產AI大戰或加速步入下一階段。中金公司援引市場資料顯示,國內豆包App日活躍使用者數(DAU)已突破1億大關。該機構認為,豆包目前的使用者規模、留存率、增速、DAU與MAU的比率,均說明其DAU邁向更高門檻的確定性強,甚至有望實現對Chatbot形態的產品使用者近乎全量的覆蓋;而競爭對手們無論是基於對產品的理解、定位還是投入,都很難影響這一路徑。而根據研究機構Quest Mobile發佈的《2025下半年AI應用互動革新與生態落地報告》,截至最新統計周期(12月8日至12月14日),豆包周活躍使用者數在全市場AI原生App中亦居榜首,達1.55億,實現了斷崖式領先。DeepSeek、元寶分別位居第二、第三,周活躍分別為8156萬、2084萬;螞蟻阿福、千問周活躍使用者量則分別為1025萬、872萬。豆包使用者數目增長的背後是大模型呼叫量的跨越式爆發。在前不久的火山引擎原動力大會上,火山引擎總裁譚待透露,豆包大模型日均使用量(Tokens)超過50兆,自發佈以來增長417倍。對此,中金公司如此強調:“國內所謂‘Chatbot入口之爭’似乎已然意義不大。”儘管如此,國內網際網路大廠所佈局的AI入口形態確各不相同:12月1日,字節跳動豆包團隊發佈豆包手機助手技術預覽版——一款通過深度系統合作而實現的AI手機;阿里將千問APP視作“超級入口”,並致力於接入高德地圖等生態場景;騰訊則是將元寶深度融入微信APP,其活躍程度甚至一度引發“評論區的元寶互動是小編輪班扮演還是AI”的爭議。基於上述背景,仍有眾多機構強調未來AI入口之爭的不確定性,如華源證券指出,AI入口競爭後續會持續演繹,手機端側、超級APP和垂直AI平台將從不同維度持續推進AI Agent入口使用者層面的教育和圈定,同時通過不同方式完成應用層生態的連接和統一。中泰證券最新研報則表示,越來越多的AI應用場景正被解鎖。AI會放大應用的價值空間,從效果工具走向勞動力服務市場,市場空間有望大幅提升。更多的專業門檻高、流程複雜、服務屬性強的場景不會被大模型廠商穿透。投資層面上,該機構判斷,基礎大模型廠商仍在加速卷能力天花板,對算力的需求持續旺盛,且伴隨AI應用的快速落地,更多的推理算力需求也隨之而生,隨著宏觀經濟好轉、AI應用落地以及人員調整與人效提升,電腦類股的基本面有望加速向好。 (科創板日報)
張一鳴全面出擊,抖音豆包徹底起飛
張一鳴已經勢不可擋。2024年初,豆包大模型橫空出世,許多人還帶著冷眼旁觀的審慎。沒想到短短一年,它已經實現了日均50兆次的呼叫數量。而豆包AI手機的問世,現在更是改寫了網際網路十年未變的互動邏輯。在這場AI手機的變革中,張一鳴帶著字節跳動,已然掀起巨浪。豆包大模型日均呼叫量已超過50兆昨天,字節舉辦了火山引擎原動力大會,會上總裁譚待透露,截至今年十二月,豆包大模型日均呼叫量超過50兆,自模型發佈以來增長417倍。圖源:財聯社譚待指出,目前已有超過一百家企業通過火山引擎平台實現累計呼叫量突破兆tokens。這裡的“token”是處理文字、圖像、音視訊資訊的基本單位,其規模之大,意味著豆包AI已深度融入企業核心業務,並能穩定支援億級使用者的實際需求。市場表現同樣印證了這一趨勢。目前在中國,月活躍使用者達億級的AI原生應用僅有豆包與DeepSeek兩款。資料表示,今年第三季度,豆包月活規模逆勢增長8%,反超DeepSeek位列第一,反映出豆包在基數較高的基礎上,依舊在保持穩定增長。圖源:QuestMobile會上,團隊還正式發佈了豆包大模型1.8版本,以及音視訊創作模型Seedance 1.5 pro。與以往相比,豆包大模型1.8發生了一些變化。在核心定位方面,該款大模型從側重於通用對話與生成,轉向強調規劃和執行能力,類似於由一個聊天夥伴,升級為一個主動思考並幫助使用者解決問題的管家。在性能方面,該模式處理視訊的能力變強,單次視訊理解幀數從640幀提升至1280幀,能像人一樣速覽長視訊並識別關鍵片段。同時,模型支援智能上下文管理,能在長任務中自動清理無效資訊,避免對話中斷或遺忘,讓創意生成、複雜任務執行更加流暢。此外,該模型在遵循複雜指令、進行多輪互動乃至直接作業系統層面都有明顯增強。這與前不久豆包AI手機的底層邏輯類似,或許暗示著字節對AI手機落地的決心。整體來看,無論是日均呼叫量的飛躍式增長,還是模型能力的持續迭代,都清晰指向AI已不再只是展示技術,而是真正成為支撐企業營運、服務億級使用者的基礎設施。而在規模化落地上,豆包顯然已經跑在了前面。拿下vivo,豆包手機的合縱連橫之術12月初,字節聯合中興發佈了一款豆包AI手機樣機。和尋常搭載智能語音助手的手機不同,它能像真人一樣,通過模擬點選在多個App間自動跳轉,完成複雜任務。例如,說一句“幫我全網比價xx品牌的牛仔褲”,它會自動打開淘寶、京東等App搜尋、比價,最後找到最優解,跳轉到支付頁等使用者確認。此外,能得到使用者授權後,它可以記住使用者的偏好,如常坐的航班座位,並能“看懂”螢幕內容即時互動。圖源:36氪這完全改變了智慧型手機的互動方式。以前是使用者自己點選,在不同App間手動切換完成任務,應用和應用之間是孤立存在的。而現在,手機成為中央調度器,AI打破了應用壁壘,使用者給AI下達指令後,由AI跨應用自動執行任務。樣機剛一上市,就引起業內熱議,在兩天內迅速售空。然而在測試中,出現了插曲,即用該款手機登錄微信時,出現了異常情況,導致使用者無法登錄。據瞭解,這大機率是觸發了微信系統的防控機制。事後,豆包官方團隊對此事進行了回應,異常登錄的問題被陸續解決。但是這件事,也讓大家紛紛猜測,這款手機是否觸及了網際網路巨頭的利益。一般來說,使用者在使用服務時,需要打開軟體app,比如美團、淘寶等,這時,app充當了一個流量入口,通過使用者瀏覽、點選、下單等資料,軟體可以推薦相應的資訊和廣告,從中獲取利益,並得到使用者的相關資料。而AI手機直接擊碎了這條線,使用者通過AI下達指令,不接觸應用介面就能完成需求,原有廣告、推薦等流量路徑被繞過,這相當於動搖了現有移動網際網路商業模式的根基。因此,這場微信風波也被業界解讀為一場關於未來流量入口和資料控制權的防禦戰。而字節跳動也因為缺乏硬體技術,面對此類平台級限制,似乎一時難以突破。就在外界認為字節跳動將暫緩硬體嘗試時,它卻迅速找到了新路徑,與 vivo 達成合作,再次引爆關注。據瞭解,字節跳動與vivo的具體合作模式,是字節跳動通過 “讓利換入口” 的策略,在vivo手機上預裝“豆包”AI助手,並共享未來的流量收益。據知情人士透露,字節跳動為吸引廠商,提出了一套“低門檻+高分成”方案。即前期零成本,計畫免除給vivo的定製開發費和AI使用(Token)銷售分成;後期共享收益,讓vivo參與其帶來的流量分發與會員訂閱等收益分成。這次合作,對字節跳動而言,這是獲取“關鍵入口”的戰略佈局,有助於扭轉其在AI競爭中處於“應用層”的相對被動局面。對vivo而言,這是快速提升AI競爭力的務實選擇。據瞭解,vivo曾謀求與騰訊在AI大模型的深度合作,後因遲遲找不到合適的商業化落地方式導致雙方不能達成一致,其中一點便是Token成本帶來的問題。同時,其自身AI業務進展也未達預期。因此,與字節跳動合作,既能快速為手機注入成熟的AI能力作為賣點,又能通過新的流量分成模式獲得收益,是一種高效且低風險的策略。資料顯示,今年第三季度,vivo以18%左右的市場份額重返榜首。圖源:Omdia此時選擇與字節跳動聯手,不僅是兩家企業的雙贏,更可能攪動整個手機行業的競爭格局。AI手機的戰爭已經打響除了vivo,字節跳動與聯想、傳音等多家硬體廠商正在推進合作。魅族更是主動向其拋出了橄欖枝。由此可見,AI手機領域的合縱連橫已全面展開。縱觀當前市場,AI手機的參與者可大致分為三個主要派別:一是全端自研派,以華為、小米為代表。圖源:微博它們從晶片、作業系統到端側大模型全程自主可控,如華為的麒麟晶片與盤古模型、小米的MiLM大模型。這類路線技術壁壘高,強調性能與隱私安全,掌控力強,但研發投入巨大。二是合作務實派,以vivo、OPPO為核心。圖源:微博它們在堅持自研大模型(如vivo藍心)的同時,也開放引入外部成熟的AI能力,以快速補齊體驗、搶佔市場。策略靈活務實,能借助市場佔有率推動AI落地。三是網際網路生態派,以字節跳動、阿里巴巴等大廠為主。圖源:微博它們通過預裝或深度整合,將自家AI助手變為手機的系統級能力,全力爭奪“第一入口”。不過,這一派別內部競爭也非常激烈。此前就有行業觀點認為,阿里、騰訊、美團等可能形成“聯合防禦”,共同限制AI對跨應用呼叫的權限。不過雖然目前大家都在投入,但清晰的盈利閉環,如訂閱制、流量變現、服務分成,尚未完全明朗。或許誰能率先找到可持續的商業模式,誰就能贏得持久戰。此外,誰能率先催生出真正顛覆性的、使用者離不開的AI原生應用,誰或許就能獲得決定性優勢。今年以來,各大廠已明顯加快佈局。小米引入AI專家羅福莉,騰訊挖來姚順雨,人才儲備戰悄然打響。這些動作為下一階段的競爭積攢著關鍵能量。最終會是“一個統一的AI助手” 勝出,還是 “多個專用AI助手” 並存?這需要時間驗證。 (科技頭版)
豆包大模型1.8正式發佈,擁有更強多模態Agent能力,豆包日均使用量超過50兆,推出成本節省計畫降幅達47%
豆包大模型1.8具備更強的多模態Agent能力,256K超長上下文使其能夠處理更複雜的資訊,擅長處理複雜多步任務。火山引擎正式發佈的"AI節省計畫",普惠覆蓋豆包大模型、豆包視訊及圖像創作模型與第三方開源大模型,全面最佳化使用者呼叫成本,最高節省幅度達47%。火山引擎在2025原動力大會上發佈豆包大模型1.8,具備更強的多模態Agent能力,256K超長上下文和原生API上下文管理,擅長處理複雜多步任務。火山引擎總裁譚待在12月18日的大會上透露,平台"兆Tokens俱樂部"成員已突破100家。並披露豆包大模型日均使用量超50兆Tokens,自發佈以來增長417倍,同時推出最高節省47%的AI成本最佳化計畫。除主力模型外,火山引擎同步發佈圖像創作模型Doubao-Seedream-4.5和視訊生成模型Seedance系列,進一步完善多模態能力版圖。新推出的Seedance-1.0-Pro支援2至12秒1080P自由生成,可實現多人語言對白和多鏡頭敘事。火山引擎正式推出"AI節省計畫",一次加入即可覆蓋豆包大模型、視訊圖像創作模型及第三方開源大模型,支援全預付、零預付等靈活付款方式。開源證券研報指出,此次發佈有望推動AI在企業生產場景中的落地應用。火山引擎總裁譚待在回應對明年模型行業的競爭時表示,“明年模型之間最重要的還不是競爭,最重要的是要把市場做大。明年這個市場可能還要再漲10倍,大家其實就不是存量的競爭,不是零和博弈,而是說大家一起把市場做大。同時,明年模型還需要進一步降價,這個市場才能做大。”01 核心模型能力全面升級豆包大模型1.8在多模態理解上實現顯著提升。模型的長視訊理解和安防監控場景能力得到增強,256K超長上下文使其能夠處理更複雜的資訊。通過更靈活的上下文管理,新模型可輔助公司處理複雜任務並支援決策。在圖像生成領域,火山引擎發佈的Doubao-Seedream-4.5具備多圖組合、創意寫真、圖片拆解、複雜組圖、虛擬試穿與海報設計等能力。視訊生成能力同步增強,Seedance系列包含兩個版本:Seedance-1.0-Lite以成本優先兼顧速度,適配高頻創作;Seedance-1.0-Pro提供影視級畫質與原生音效,滿足電影級感官敘事需求。豆包大模型已落地智能硬體與語音助手,應用場景覆蓋日常溝通、專業服務與報告解讀、聯網搜尋等。配合使用者認證的邊想邊搜互動體驗,使豆包成為隨身智能夥伴。02 推理與開發服務生態完善火山引擎推出"火山方舟"推理代工服務,已接入Qwen、GLM、Seed-OSS等主流開源大模型,支援企業將精調後的模型一鍵Serverless部署。平台提供海量資源、專屬推理加速與極致彈性調度,承諾"你訓練,我推理"。Viking系列產品在大會上亮相,VikingAI搜尋與VikingDB向量資料庫雙輪驅動,為終端使用者提供優質輸入,為模型與Agent快速建構知識庫和記憶庫。配套的多模態搜尋支援文字、圖像跨模態檢索,個性化推薦實現"千人千面",Agentic問答基於豆包大模型精準識別意圖。在Agent開發方面,火山引擎發佈企業級AI Agent平台AgentKit與TRAE(CN)企業版,已獲NIO、PwC、匯付天下、銳捷、軟通動力、高頓等頭部客戶採用。平台依託企業級GPU叢集,支援10萬檔案、5億行程式碼超長上下文,可靈活配置企業規則、知識庫與Agent,即時追蹤AI生成率與程式碼量,程式碼全鏈路加密傳輸、雲端零儲存。03 成本最佳化計畫釋放普惠紅利火山引擎正式發佈的"AI節省計畫"採用一次性加入機制,普惠覆蓋豆包大模型、豆包視訊及圖像創作模型與第三方開源大模型,全面最佳化使用者呼叫成本。最高節省幅度達47%,支援全預付、零預付等多種付款方式,實現"多用多省"。火山引擎此次還發佈了MaSS on AICC服務。開源證券研報稱,火山引擎此次發佈有望實現性能提升與成本降低,特別是視訊生成模型的進一步升級。研報建議關注字節產業鏈及AI應用投資機會,認為Agent開發工具的升級與Agent生態的擴容將推動AI在企業生產場景中的落地應用。 (硬AI)
從DeepSeek到豆包手機助手:中國AI下一程何去何從?
在中國AI發展史上,2025年註定會是里程碑式的一年。1月27日,DeepSeek憑藉發佈僅一周的開源推理大模型DeepSeek-R1,在蘋果應用程式商店中國區和美國區的免費榜上雙雙獲得第一,震驚世界。儘管隨著千問、豆包等大模型的崛起,DeepSeek在很多排名中不再名列前茅,但其貢獻將永載史冊。12月5日,張亞勤教授在人文清華講壇演講時說,DeepSeek在演算法、技術、系統架構上都有創新,它用1%的算力就可以達到和美國前沿大模型相似的能力。“DeepSeek出來之後,咱們和美國的差距可能就從之前的2~3年縮短到2~3個月,而且在有些應用方面,我們可能做得更好”。中國網際網路從1995年左右起步,先後經歷了PC網際網路、移動網際網路和物聯網時代。張亞勤認為,現在進入了智能體網際網路(Internet of Agents)的新時代。所謂智能體(Agent),就是具備自主智能的系統——你只需要給它設定一個目標,它就能自主規劃任務、不斷迭代,甚至自我試錯,最終達成目標。這非常像人類的行為:有個目標,自己就會去規劃路徑,依靠各種記憶和判斷去實現。未來已來。12月1日,字節跳動豆包團隊發佈了“豆包手機助手技術預覽版”,通過和中興通訊努比亞手機合作,展示了一系列驚豔表現——豆包手機助手根據使用者指令,可以在多款App應用之間自動跳轉,完成查票訂票、商品多平台比價下單、定製出行攻略、批次下載檔案等任務,完全自動化執行。智能體網際網路真的來了?毫無疑問,是的。智能體網際網路的“Aha moment”手機助手本身並非新生事物。2011年蘋果就發佈了siri,使用者可通過語音指令完成資訊查詢、電話撥打、消息傳送、裝置尋找等功能。但這樣的助手只能呼叫單個App應用,比如你要它“打開微信”它就給你打開微信。而當你提出一些跨應用、多步驟的複雜指令,如“對比一下淘寶閃購、美團、京東同款麥辣雞翅的價格,選個最低價,下單到指定地址,然後截圖發給指定聯絡人”,又如“下周我要出差,先去北京再去廣州,幫我訂一下機票和酒店,最後生成一張清單”,等等,它就一籌莫展了。這樣的多步驟複雜任務,恰好是豆包手機助手的用武之地。你只要說一聲,它就會在你手機所有的購物App裡搜尋同款商品,對比價格和規格,自動領券,選擇最低價,最後通知你“接管操作完成支付下單”;當你準備出差,它會按你的吩咐,在公司辦公軟體上向經理提交出差申請,然後訂好機票酒店;當你想給女兒推薦幾個禮物放進購物車時,如果你設定開啟的記憶中已儲存有女兒的年齡、興趣等資訊,它可直接查詢符合女兒年齡、偏好的方案,無須你再逐一交代細節……這些前所未有的新體驗,讓豆包手機助手初出茅廬就成為智能體網際網路的一個“Aha moment”,也為2025年的中國AI發展貢獻了一部“收官之作”。一石激起千層浪然而,和年初DeepSeek發佈時贏得的普遍都是掌聲相比,豆包手機助手發佈後,則是一石激起千層浪。有人盛讚,AI操作手機、AI助手一定會遍地開花,我們的生活也會完全離不開它,將來的人們會記住這歷史性的一天;有人評價,豆包和中興通訊做的這件事,是通過跟系統、跟硬體廠深度綁在一起,讓豆包獲得系統級權限,可以橫跨所有App看通知、讀頁面、點按鈕,從一個App升級成手機系統內常駐的大腦,成為作業系統的一部分而不是普通的第三方軟體,這是AI時代的手機新入口;有人擔心,AI手機助手依賴高等級的系統權限,能在執行使用者指令的操作過程中讀取到螢幕內容——包括銀行卡資訊和聊天記錄,會帶來安全隱患;也有一些國民級應用App、金融機構App迅速截停了豆包手機助手,使用者在手機上無法呼叫,或遭遇異常退出、無法再次登錄。更深層次的討論也開始了——若使用者習慣將操作完全交由AI助手代理,各種App都將被“管道化”,以流量分發為核心的網際網路商業模式將會被顛覆;而對手機廠商來說,將從“硬體製造商”變為“AI服務分發商”,其賣點不再是硬體參數的堆積,而是能否接入最強AI能力,提供最豐富和高效的場景服務。豆包手機助手到底是什麼?其實,它是在豆包App的基礎上,和手機廠商在作業系統層面合作的AI助手軟體。目前還只有一款和中興通訊合作的工程樣機,也只面向開發者和科技愛好者少量發售。在官方視訊的結尾,豆包手機助手特別提示,“儘管演示內容均為真實錄製,但受限於大模型技術的不確定性,相關場景無法保證百分百復現。當前產品實際可用性與團隊預期仍有差距,未來仍將持續迭代最佳化”。可見,它還是剛剛起步。但沒想到,發佈當日,中興通訊A股漲停,在行業和社會迅速引起巨大波瀾。在被一些App截停後,豆包手機助手發佈了《關於微信登錄異常的情況》《關於調整AI操作手機能力的說明》等公告,澄清了所謂“未經授權獲取系統權限”的謠言,指出豆包手機助手在努比亞手機上擁有系統級的INJECT_EVENTS權限,所以其相關產品才能跨屏、跨應用模擬點選事件,完成使用者操作手機的任務需求,它也不會代替使用者進行相關授權和敏感操作。關於使用者隱私,豆包手機助手表示,不會在雲端儲存任何使用者螢幕內容。“當使用者給助手指令,要求操作手機時,助手確實需要讀取螢幕,否則無法完成使用者任務,但螢幕和操作過程都不會在伺服器端留下儲存,且所有的相關內容也都不會進入模型訓練,確保使用者隱私安全。”豆包助手再次強調,此次發佈的是“技術預覽版”,是面向行業、AI技術愛好者的探索產品,提示普通消費者謹慎選擇。豆包助手還表示,計畫在接下來的一段時間,在部分場景對AI操作手機的能力做一些規範化調整,如限制刷分、刷激勵的使用場景,進一步限制金融類應用的使用,限制部分遊戲類使用場景等。顯然,豆包手機助手的社會影響大大超出了團隊預想,因此團隊開始採取一種“退”的姿態。退一步,進行調整,並努力和App們以及手機廠商達成共識,找到合作模式。一場技術上的顛覆式創新,開始步入社會化共識與服務規則的形成期,以及新舊利益如何分配的磨合期。但無論如何,因為豆包手機助手的發佈,中國的網際網路服務掀開了新的一頁,即從App主導到智能體驅動。這一頁既已掀開,就不可能再倒回去。為什麼是豆包?豆包手機助手和中興通訊合作的AI手機,顯示出“大模型+手機廠商”的清晰趨勢。在國內,華為、vivo、小米、OPPO、榮耀等手機廠商都在佈局AI智能體賽道,都有自己的AI助手,都在個性化互動、跨應用執行方面探索。大模型初創公司智譜去年10月也曾官宣推出了端側AI智能體,可以訂外賣、訂票、回覆微信,智譜還與三星在AI手機領域達成戰略合作;在國際上,蘋果去年6月發佈了Apple Intelligence,定位為系統級AI助手,但直到iPhone 17系列仍未完全落地。GoogleGemini也在與三星深度合作,強化其語音助手Bixby。大家都在做AI手機助手,為何唯有豆包一鳴驚人,真正讓使用者眼前一亮?單從技術實現路徑看,豆包助手和別的助手採用的都是圖形使用者介面智能體(GUI Agent)技術。該技術通過多模態大模型,即時解析手機螢幕截圖,識別出按鈕、文字、圖示等UI元素,然後呼叫作業系統提供的服務,模擬人的手指動作。只要人在螢幕上可以手動完成的操作,從理論上說,GUI Agent都能代勞。在過去,使用者必須通過手動方式在不同App間切換,才能完成複雜任務。這是因為,如果使用者想讓AI與App互動,App開發者必須主動開放資料和功能介面,而基於安全、商業利益等考慮,App們並不會開放。GUI Agent的邏輯不是請求App們的許可,而是直接模仿人的點選、滑動、輸入等動作,跨應用完成操作。當然,這裡有一個前提,就是與手機作業系統在系統層面深度整合,獲得系統級權限來呼叫各種App。那麼,是不是有了GUI Agent,再加上擁有系統級權限、避免了APP的“玻璃牆”限制,就能做好AI手機助手呢?也不是。否則,手機廠商已經先發先至了。其實,在手機助手跨應用自動執行任務的背後,涉及到多種技術能力,如通過自然語言精準理解使用者的複雜、多步驟指令,將使用者需求拆解成多個子任務,知道呼叫什麼App去執行什麼任務,以及在自動完成操作後根據結果進行反饋調整、持續改善。並不只是獲得系統級權限去呼叫App那麼簡單。AI手機助手的本質,是基於大模型技術,通過模擬人類點選和圖形處理實現智能互動。其關鍵在於預訓練模型的研發,以及在預訓練、後訓練和業務理解這三個環節上是否有突破,有創新。在中國網際網路公司中,字節跳動是對AI技術投入最大、時間最久的之一。除了眾所周知的推薦技術,在大模型之前,字節跳動也在量子化學、AI蛋白質設計等領域有諸多投入。為了發展大模型業務,字節跳動單獨設定了“豆包股”長期激勵,鼓勵內部創新,鼓勵開展有技術高度的創新,以建立壁壘。雖然字節跳動的大模型業務不是全球最早,但轉型迅速,在基礎設施如萬卡叢集訓練等方面投入巨大,且穩定性很好,為技術實現奠定了基礎。豆包手機助手一出生就與眾不同,極大刷新了使用者體驗,和豆包大模型在視覺理解、推理、GUI(圖形介面)識別等方面均處於國際第一梯隊是分不開的。在中國大模型公司中,豆包對“蒸餾”的限制最嚴格,這也避免了依賴他人的模型導致“屋下架屋”、效果受限等問題。“通過模擬人類點選進行圖形處理”,這個概念早就有人提出,並不新鮮,其他手機廠商和App廠商也都在做,但從豆包手機助手的實測和使用看,字節跳動是國內首個從技術能力上能把這一技術真正做到可用程度的企業。當有些廠商還在為“如何讓助手生成更流暢的文字”努力時,豆包手機助手已經能自主絲滑地完成複雜操作,這就是技術優勢所拉開的代際差距。所以,豆包手機助手的超常表現,歸根結底在於技術領域的硬核創新。這和之前DeepSeek在混合專家模型(MoE)架構和多頭潛在注意力機制(MLA)等方面的自主創新頗為相似,都是先站上技術的高地,接著才有出眾的產品。AI手機助手的下一步儘管豆包手機助手展現出了新互動模式的巨大潛力,但它要真正進入千家萬戶,還有很長路要走。除了自身的產品迭代最佳化,以及讓使用者更加放心(比如爭取在不久的將來,在本地端側模型上實現和雲端同樣的效果),它還需要和行業各方有更充分溝通,以共建更清晰、可預期的規則。就眼前遭遇的被一些App封禁的問題,豆包手機助手需要將心比心,和它們坦誠協商,以解決在技術預覽版手機上的使用限制問題。長期而言,則要努力探索合作與分享的具體機制安排。豆包手機助手已明確“無自研手機計畫”,而是希望通過生態合作模式,嵌入不同品牌的手機機型。這是一種開放的態度,將有利於合作的達成。有專家預測,在智能體網際網路時代,有可能形成“使用者付費+廠商分成”的模式:使用者為智能助手的便捷服務支付少量費用,豆包與合作的App廠商按一定比例分配收益;對於免費的App應用,則可通過流量導流、資料共享等方式實現共贏。在這個過程中,最難跨越的關隘,還是現有App生態的流量與利益格局。同時,手機大廠是否願意合作,以何種方式合作,也存在大量博弈空間。可以設想的是,不管豆包手機助手有多麼強大,未來都不可能只有一個AI手機助手。既然是大勢所趨,必然會引來多個參與者。就像電商App,有淘寶,也有拼多多,有京東,有抖音電商,等等。當然,因為手機助手更像“大腦”,使用者在使用、比較之後,大機率會選擇某一個可信賴的助手,長期使用,越用越習慣,而不太可能像電商App一樣,同時使用幾個。騰訊總裁劉熾平在2025Q3財報電話會上表態,微信最終將推出自研AI智能體,讓使用者在微信生態內即可利用AI完成多項任務。當豆包手機助手點亮了一盞燈,一定會帶動和加速更多盞燈亮起來。這對於廣大使用者一定是好事。就此而言,無論怎樣的超級App,都應該避免簡單基於商業競爭的考量,用“一刀切”的方式否定使用者合理使用AI的權利。因為當它們將來要推出手機助手的時候,也會面臨和今天豆包類似的問題。無論最終模式如何,豆包手機助手的創新都值得鼓勵。App時代的“多應用切換”是使用者的痛點,誰能更好地解決這個痛點,誰就會得到使用者的認同。使用者也將成為這場智能化變革的最大受益者。從生成式AI到智能體AI,從移動網際網路到智能體網際網路,從App林立到AI手機助手統籌,豆包手機助手用一個個具象化的場景,讓使用者感受到大模型等技術帶來的便利。它雖然還沒有正式發佈,卻已讓人們看到,智能體AI將徹底改變我們與手機的互動方式,讓科技真正服務於生活本身。人工智慧時代的新黎明正在降臨。不管還有多少挑戰和難題,新質生產力都將穿越,也必將穿越。 (秦朔朋友圈)
豆包手機逼出一個“死局”,但遊戲才剛剛開始
01怎麼理解豆包手機的“系統級權限”?你不妨把手機想像成一座大樓。平時我們安裝的AI應用,就像訪客,只能在大堂裡活動。但豆包助手不一樣,它拿到了一把萬能鑰匙,可以自由進出所有房間,可以操作房間裡的裝置。比如,你對它說“幫我在招聘軟體上找產品經理的工作,然後投簡歷”。它會自己打開招聘軟體,篩選崗位,然後一個一個投簡歷。有人測試過,10分鐘能投30份簡歷。再比如,你說“幫我點個外賣,要少糖少辣,餐具分開裝”。它會自己打開外賣軟體,選餐廳,選菜品,在備註裡寫上你的要求,然後你下單支付。這就是所謂的“系統級權限”。但問題是,華為、小米、OPPO、vivo、榮耀,那家沒有自己的AI團隊?它們會把系統的核心權限,交給一個外部公司嗎?不太可能。因此,字節跳動要想讓自家的AI具備“系統級權限”,大機率上就只能自己造手機,至少是作為聯合製造方參與手機製造。這回的豆包手機,就是字節和中興合作的。那麼,這條路走得通嗎?我從卓克老師那看到一個觀點,很難。為什麼?首先,技術水平不夠。現在的大語言模型理解不了人需求的多樣性,錯誤率太高。10次任務出3到4次錯,錯誤率大概30%到40%。注意,假如是作為聊天助手,這個錯誤率好像也能忍忍。但是,作為一款負責執行的消費級應用,這個錯誤率幾乎是災難性的。比如,你讓AI幫你點外賣,結果它點錯了餐廳,你還會繼續用嗎?一般來說,消費級產品的可靠性,至少要達到95%以上,使用者才會覺得“可以用”。要達到99%以上,使用者才會覺得“好用”。從“能用”到“好用”,是一道鴻溝。卓克老師認為,這需要下一代全新原理的模型才能解決。其次,很多App廠商都會抵制。你想想,假設你打開電商應用,想買個手機殼。但看到其他感興趣的東西,你也會點進去看看,可能順手加購。但假如用AI助手操作呢?你說“幫我買個手機殼”,AI直接搜尋,直接下單。不看推薦,不看廣告,不看其他商品。你的停留時長,從10分鐘變成10秒。瀏覽頁面從十幾個變成1個。電商平台的廣告收入、推薦轉化、交叉銷售,全都沒了。比如,網上傳言,微信團隊封禁了搭載豆包助手的手機,使用者啟動助手後微信會自動退出登錄。微信官方回應說,沒有做任何特別動作,可能是助手觸發了原有的安全風控措施。但不管是主動封禁還是被動觸發,結果都是,AI助手在微信上用不了。而微信,是中國使用者使用頻率最高的App之一。假如微信不支援,豆包手機助手的價值恐怕就要大打折扣。當然,關於目前的消息,估計你已經看到很多了。因此接下來,咱們換個角度。02從博弈論角度看“系統級AI助手”你看,即使現在的“AI助手”會出現問題,即使現在的手機算力,還不足以支撐一些大模型的本地部署。但是,這些都是技術問題,將來或許可以解決。AI的錯誤率會繼續降低,大模型的本地部署門檻也會降低。因此,我們姑且假設,未來早晚會出現大量搭載“系統級AI助手”的手機。那麼到時候,這些AI手機和之前的各大App之間,會如何共存呢?會出現那些可能性呢?關於這個問題,我們或許可以參考“博弈論”的視角。從短期到長期,行業也許會經歷幾個不同的階段。第一,先說短期。行業也許會進入“囚徒困境”的博弈。假設,有10個購物平台。AI助手來了,要求接入。這時,每個平台也許都會想,“假如我開放了,AI會把使用者直接帶到商品頁面。使用者不看廣告,不瀏覽其他商品。我的流量損失會很大。”所以,抵制更“安全”。假如所有平台都這麼想,結果就是,大家都抵制。這就是囚徒困境的經典場景,每個人都選擇對自己最安全的策略。但這個均衡,非常不穩定。為什麼?你看,假如9個平台抵制,1個平台開放,會發生什麼?那個開放的平台,會獲得AI助手帶來的全部購買需求。比如,你對AI說“幫我買個手機殼”。AI去查詢各個平台,發現9個都不讓它操作,只有1個開放。那麼它會把所有訂單都導向那個開放的平台。那個平台在AI管道裡的市場份額,可能從10%,直接跳到100%。而且,這個優勢會越來越大。因為AI會學習,會記住“那個平台最好用”,下次會優先推薦它。而那9個抵制的平台呢?它們會發現,自己的流量在快速流失。它們會被迫跟進,也開放介面。這就是連鎖反應。所以,“大家都抵制”這個均衡,看起來穩定,其實非常脆弱。只要有一個平台率先開放,整個局面就會被瓦解。當然,也可能出現分化。微信、淘寶之類的大平台有資本抵制,還可能會做自己的AI手機。但不管是那種結果,有一點也許是確定的,命運的齒輪已經開始轉動了,它不會因為當前的某款手機不好用就停下。第二,再說中長期。行業也許會進入一個“演化博弈”的階段。簡單說,就是在一個生態系統中,不同的策略會相互競爭,市場會自然選擇出最適應環境的策略。比如,在AI助手這個新環境下,會不會出現一種全新的“AI原生App”?現在的App,介面是給人看的。精美的圖片、吸引人的視訊、精心設計的互動。這些都是為了吸引“人”的注意力。但AI不需要這些。AI需要的是:結構化的資料、清晰的邏輯、標準化的介面。這樣的苗頭已經出現了。比如,有家公司叫Stripe。它是一個支付服務平台,據說估值大幾百億美元。但它沒有複雜的介面,開發者只需要一行程式碼,就能呼叫它的支付功能。據說,80%的美國消費者都用過Stripe,只是絕大多數人根本不知道。因為它是“藏”在各個網站和App背後的。你在亞馬遜、優步、Shopify上支付,背後可能就是Stripe在處理。這就是一個典型的“給機器用的服務”。它不需要吸引人的注意力,它只需要提供標準化的介面,讓其他系統可以呼叫。再比如,亞馬遜的子公司Alexa,你對著它的AI產品說“幫我買衛生紙”,它就能幫你下單。亞馬遜現在還要求,商家不能只填商品名稱和價格,還要填寫所有屬性:顏色、材料、容量、尺寸、技術規格。而且,這些屬性要用“日常對話語言”來描述,因為使用者可能會問“那個微波爐功率最大”,AI需要能理解並回答。再比如,最近有個概念叫“無頭電商”。什麼叫無頭電商?就是前端和後端完全分離。後端通過API提供所有電商功能,包括商品管理、訂單處理、物流等。前端可以是任何裝置:App、智能手錶、車載系統。所有資料都是高度結構化的,任何裝置都可以通過API呼叫。你看,這些都是“AI原生”的苗頭。它們的共同特點是:不是給人看的,是給機器用的。介面不重要,資料結構才重要。從這個角度看,假如有人專門做一個“給AI用的購物平台”,會怎樣?這個平台可能沒有漂亮的介面,甚至沒有介面。所有商品資訊都是結構化的,AI可以直接讀取,可以秒級完成交易。將來傳統App和AI原生App,最終的結果,也許不是“一方消滅另一方”,而是“共存”。就像線上購物和線下購物一樣。也許有些場景適合AI原生App,比如買菜、點外賣,也有些場景適合傳統App,比如買衣服、買家具,對這類商品來說,“逛”是個必備環節,使用者是不想讓AI代勞的。未來假如AI手機普及,會有那些人參與呢?可能是手機廠商,比如蘋果、華為、小米。它們控制作業系統,可以內建AI助手。也有可能是做AI的公司,比如字節、百度、OpenAI。它們有AI能力,關鍵是能不能說服手機廠商預裝自己的AI助手。還有可能是超級App,比如微信。微信有最多的使用者和最高的使用頻次。假如微信內建AI助手,使用者可能根本不需要系統級的AI助手。就像微信小程序,創造了一個新的App生態。這背後的可能性還有很多,我們就不展開了。最後也強調一句,今天的很多內容,都只是基於現有資訊,借助“博弈論”這個工具所做的推演。未來的事誰都不敢百分百確定。但是不管未來如何,我們或許都可以說,命運的齒輪已經開始轉動了。它會帶來很多摩擦,也會催生更多的機會。 (羅輯思維)
豆包AI手機勁敵是小米?高盛:AI「系統級整合」面臨挑戰,更驗證了小米的長期競爭力
高盛認為,豆包AI手機雖然“火爆”,但其在系統權限、資料獲取和應用聯通性上面臨重重挑戰,反而凸顯了小米等手機巨頭的結構性優勢。小米憑藉其“人車家”生態、近10億的AIoT裝置連接以及滲透率高達71%的AI助手“超級小愛同學”,已建構起強大護城河。小愛同學已經能發佈微博筆記、篩選淘寶商品等。近期,字節跳動高調發佈「豆包AI手機助理」預覽版,意圖透過大語言模式(LLM)重塑手機互動體驗,引發市場高度關注。高盛12月4日發佈的最新研報中分析認為,「豆包AI手機助理」標誌著AI競爭進入到作業系統層面,然而,第三方AI代理在獲取系統級權限、使用者資料和跨應用連接方面面臨重重挑戰,反而更加驗證了小米等現有手機巨頭長期競爭力的穩固性。01. 豆包AI來襲但系統級整合面臨三大挑戰根據報告,字節跳動於12月1日發佈的“豆包AI手機助手”是一個系統級的圖形使用者介面(GUI)代理,它將豆包大模型深度整合到移動作業系統中,旨在實現螢幕內容的視覺解讀和跨應用的複雜任務操作,例如演示中的跨平台比價和自動領取優惠券。報告顯示,豆包已成為多家智慧型手機原始裝置製造商(如OPPO、vivo、榮耀)部署的熱門大語言模型,5月份硬體AI助理在豆包上日均產生的token數達到1.3兆(佔豆包總token消耗的8%)。儘管技術上展示了潛力,但高盛指出,這類第三方AI代理要實現大規模應用,面臨三大核心挑戰:系統級操作權限: AI代理程式需要取得讀取螢幕內容、模擬使用者行為和存取系統服務的權限。目前主流智慧型手機OEM廠商在AI生態系統中仍享有戰略優勢,它們可能不會輕易開放完整的系統核心和權限系統給第三方。系統級記憶能力: 主流OEM廠商能夠存取和儲存使用者全面的行為和偏好資料,這是訓練和最佳化AI代理的關鍵。第三方AI在這方面處於天然劣勢。跨應用介面連接: AI代理的跨應用操作能力,取決於第三方網際網路應用的介面開放程度。報告認為,一些希望建構閉環生態的大公司可能會限制外部代理的使用,同時,應用自身UI的頻繁變化(如彈出視窗)也會影響AI代理的穩定性。高盛預計,在可預見的中期內,消費AI終端(手機廠商)、網路平台和第三方LLM/AI代理商之間的價值鏈競爭將持續存在。02. 手機市場高度集中軟體顛覆難上加難高盛在報告中強調,理解AI對手機產業影響的關鍵前提是市場結構。報告引述資料顯示,中國智慧型手機市場已高度整合,前六大廠商(vivo、OPPO、榮耀、蘋果、小米、華為)合計佔了超過90%的出貨量份額。這與中國新能源汽車(NEV)市場形成了鮮明對比。 NEV市場更為分散,為具備軟體差異化(如華為HIMA賦能的車型)的新進者留出了空間。而在智慧型手機領域,剩餘不到10%的市場被小眾品牌和山寨機型佔據,新玩家顛覆市場的空間極為有限。這意味著手機產業的競爭壁壘極高,手機巨頭的市場地位相對穩固。03. 小米的護城河 龐大生態與深度整合的AI代理高盛認為,豆包AI面臨的挑戰,正好凸顯了小米等公司的長期優勢。小米正積極推動其「人x 車x 家」的全生態策略,而AI是貫穿其中的核心。報告指出,小米在AI領域的投入龐大,預計2025年在AI方面的研發支出將超過70億元人民幣,佔其全年研發總費用的22%。該公司已發佈了涵蓋視覺、音訊、語音等多個領域的專業LLM,並致力於將AI能力應用於其龐大的生態系統——截至2025年第三季度,小米全球連接的AIoT裝置數量已接近10億台。小米的AI代理「超級小愛同學」(Super XiaoAI)已經取得了實質進展。根據QuestMobile的資料,「超級小愛同學」是中國MAU排名前三名的作業系統原生AI助理之一,在小米手機使用者的滲透率高達71%(截至2025年9月)。高盛透過通路調查發現,「超級小愛同學」已在多個核心場景實現深度功能整合:社群媒體: 能夠在抖音、微博、QQ等平台發佈筆記、傳送聊天訊息、按贊和分享內容(但微信除外)。電子商務: 能夠在淘寶、美團、京東、拼多多、攜程等幾乎所有主流平台上,幫助使用者尋找商品或服務直至選擇/支付頁面,並能確認收貨和發表評論。生產力與內容服務: 支援根據使用者的自然語言輸入編輯圖像、即時翻譯、文字撰寫和摘要。記憶能力: 能夠在本地記憶包括敏感資料在內的資訊、知識庫和使用者習慣(如AIoT使用、用藥、觀影時間),以備未來應用。高盛總結認為,小米憑藉其在作業系統、硬體、龐大AIoT生態以及深度整合的AI代理方面的綜合實力,建構了強大的競爭障礙。這種系統性的優勢,使得第三方AI代理難以在短期內對其構成實質威脅,反而驗證了其「人x 車x 家」生態策略的長期價值。 (硬AI)
進擊的AI手機,撞上隱私牆
未來,當手機AI助手,普遍性讀取整個螢幕,使用者對這類授權的警覺性就會下降。這就為金融詐騙打開了方便之門。近日,字節跳動發佈了全新一代豆包手機助理的技術預覽版。這款豆包手機助手,跟手機廠商深度融合,具備了視覺感知、長期記憶以及直接動手操作的能力。它在螢幕上產生一個懸浮窗,模擬你的一切操作,完成你的指令。你對著手機說完​​這句話,不用打開任何APP,後台已自動完成美團、淘寶、京東的比價,彈跳窗確認後直接跳轉支付。使用者詢問車停在那裡時,它能調出使用者上次拍攝的車位照片並附帶樓層指引;當需要取快遞時,它能讀取簡訊歷史並報出取件碼;甚至當使用者詢問高鐵座位號時,它能自動翻找12306的購票記錄並告知精準位置。消息發酵後,中興通訊A股強封板漲停,成交額超140億元。港股同步走強,盤中一度漲超10%。消費者對這款手機也非常有興趣,中興官方商城已經售罄,閒魚上二手售價4200~4999元,比官方售價高出上千。不難判斷,未來各家都會推出自己的AI助理。這種AI新入口,為未來的商業競爭,帶來了巨大的不確定性,機會和挑戰並存。要理解這一點,還得從底層技術談起。首先,AI助理的基礎,是大模型的分析資訊、與人互動的能力。這個能力可以讓AI根據使用者的指示去收集、分析訊息,透過文字、語音、圖片,給用語音、文字、圖片給出結論。其實,這些能力之前的手機也並不是完全不具備。如果價格、評分、評估等資訊標準化、結構化了,並透過API介面提供,那麼,無需大模型,也可以給出對比的結論。所謂API介面,指不同軟體系統間互動的標準協議,透過預先定義的通訊規則,實現功能呼叫和資料共享。但是,各家APP顯然不會通過API,提供這種標準化、結構化的API資料介面。剛好相反,各家會採取技術手段,避免自己的資料被「爬蟲」爬取。這也是為什麼消費者有時候會遇到真人校驗。而透過技術手段,破解API介面,繞過安全防護機制,非法取得他人電腦資訊系統中的資料(如使用者資訊、商業資料等),可能觸犯《中華人民共和國刑法》第二百八十五條,構成非法取得電腦資訊系統資料罪‌或‌提供侵入電腦資訊系統程式罪‌。而大模型的意義恰好就是能處理非結構化資料,理解複雜語境。一方面,當使用者說“找個安靜的咖啡館寫東西”,AI能結合位置、環境噪音、使用者習慣等多維度資訊進行判斷,並通過語音與使用者持續溝通。這就提升了人機互動的自然度與方便度。更重要的是,在另一方面,AI大模型與手機廠商合作,用系統金鑰打包並燒錄進手機ROM,獲得諸多底層權限,才可以像作業系統原生部件一樣,跨應用操作。再加上AI助理可以憑藉處理非結構化資料的能力,從螢幕取得資料,就可以讓AI助理繞過各家的API,直接取得這些APP的資料,並模擬使用者手指,操作這些APP。這是一個法律的新問題。也就是說,以前各個APP直接向使用者提供訊息,現在,使用者說:AI助手,你去幫我讀取,然後幫我決策。所以,AI手機助理的實質,就是有能力獲得「讀屏」「模擬手指」這類底層權限,進而繞過各家APP的屏障。這才是最關鍵的一點。有了這個能力,AI助理可以做很多事。例如,可以進行跨電商平台比價、各家電商之間,幫你算那個便宜,那家送得最快。顯而易見,在這些操作中,AI助手就可以在一定範圍內,引入自己的傾向性。 AI可以告訴消費者,這家便宜5毛,但另一家送得更快;它也可以反過來說,這家雖然送得更快,但另一家便宜5毛。它還可以說,這家便宜5毛,那一家送得更快,但有一家新開的,或評分不錯,你要不要嘗試一下?這種誘導,未必是侵害消費者利益,因為對消費者來說,便宜5毛錢;送得更快;嘗試一下新味道,三者是同等效用的,並沒有被損害。但這對整個外送、餐飲甚至電商生態來說,是顛覆性的。2013年上映的科幻愛情片《Her》,講述了未來世界中,信件撰寫人西奧多與人工智慧作業系統薩曼莎之間的情感故事。薩曼莎沒有實體,僅憑聲音與西奧多建立了超越傳統的親密關係。不難想見,一個和使用者有情感連結的AI助手,對未來的商業版圖的影響是巨大的。做一個有趣的比喻,如果說消費者是皇帝的話,各個APP的各種促銷、廣告、補貼就像臣子,臣子要影響到皇帝的心智,要見到皇帝,都得通過AI這個貼身太監的許可。但風險也隨之產生,例如,現在很多銀行的APP在偵測到讀取螢幕時,就提示使用者,手機開著螢幕分享,請關閉。銀行APP的這個提示,並不是提前做好,用來抗拒手機AI助理的,而是為了應對電詐的。AI要作為一個助理存在,必然要取得許多包括「讀屏」在內的高敏感權限。這就像現實中的助理一樣,要展開工作,必然需要瞭解僱主的許多敏感資訊。從這個角度,AI透過「讀屏」等權限,把所有APP連接在了一起,打破了沙盒機制。所謂沙盒機制,是電腦的安全機制,為運作中的程式提供的隔離環境。當AI助手,某種程度上打破了這個沙盒,成為一個“超級應用”,風險也由此產生。這相當於把所有資訊都放到了同一個籃子裡。大廠商當然會做到規範,但事情總有萬一,一旦洩露,就是系統性風險。以前金融、聊天、圖片、付款、健康等訊息,分別在不同APP,如今都在一個超級應用AI。除此之外,敏感權限的授權,也會造成消費者的警覺性下降。伴隨網路、智慧型手機的發展,這個趨勢其實一直都存在。例如,以前用數位相機拍一張照片,放到電腦上觀看,全過程相片不會被第三方看到。但現在,如果想用手機發一張圖,或修一張圖,或提取其中的文字,你就必須接受讓第三方讀取你的照片。手機作業系統也做出了相應的改變,設定了單次授權,App每次只能存取使用者主動選擇的單張照片,無法自動批次取得或遍歷所有照片。但這意味著你每次都得選兩次,這種不方便,最終就會讓使用者授權第三方讀取整個相簿。以前一個陌生人,翻你電腦上的相簿,你會高度敏感。但現在,當很多軟體都要求讀取相簿,讀取通訊錄的時候,使用者的警覺性就下降了,就會不假思索地同意第三方讀取整個手機相簿。未來,當手機AI助手,普遍性讀取整個螢幕,使用者對這類授權的警覺性就會下降。這就為金融詐騙打開了方便之門。讀屏和透過api獲得資訊不同,它覆蓋整個手機螢幕的全部訊息,這就意味著,AI手機使用者雖然授權,但他的聯絡人、聊天對象、快遞收件人,都一併被讀取了訊息。根據國家網路金融風險分析技術平台發佈的監測資料顯示,截至2020年2月底,已發現網路金融仿冒網站4.8萬個,受害使用者達12萬人,網路金融仿冒APP 2801個,下載量3343.7萬次。 未來AI手機助手普及,電詐份子只需做一個假的AI助手,使用者也會不假思索地進行各種高敏感權限授權,然後犯罪分子就能拿到受害者的全部金融資訊。 AI手機帶來方便、有效率的同事,也會提高黑灰產的效率。目前,消費者、監管、各家廠商,面對這即將到來的衝擊,還未完全準備好,有待未來在落地、普及的過程中,逐漸演化。圍繞著隱私、資料安全、商業利益,AI助理將成為各方博弈的焦點。AI助手,可以稱之為手機的靈魂,也是手機廠商由硬轉軟,更直接接觸整個行動網路商業生態的機會。手機廠商肯定不願意交給第三方。在2025年第39周,中興、魅族、努比亞、三星等品牌累計佔據5.66%的市佔率。由此可見,努比亞的市佔率已經很小了,所以,會選擇深度繫結。但其他手機品牌,絕對不願意輕易交出自己的靈魂。在應用層面,基於安全、商業利益等原因,「APP們」也會抵抗AI手機助理。例如,銀行APP,基於金融安全的需求,就拒絕「讀螢幕」。但是消費者仍然是巨大的推動力。例如,一個抗拒讀取螢幕的銀行APP,消費者可能就拒用,轉向另一家銀行。而對於提供同質化、標準化產品與服務的商業模式來說,挑戰就更大。《Her》這部電影,拍攝於2013年,電影設定的故事發生時間卻剛好是2025年,地點是上海。 12年前的科幻元素已成為現實。這使《Her》不僅是一部科幻片,更像是現實的預言。手機、網路公司、使用者、監管,即將迎來20年未有之大變局,而這個變局會決定今後更長時期的商業、經濟、社會面貌。 (FT中文網)
豆包搶入口,捅了馬蜂窩
豆包捅開的“馬蜂窩”,本質上揭示了對AI時代超級入口的爭奪。在行動網際網路時代,App是資料和流量的控制者。而進入AI時代,能夠調度一切、貫穿全域的「系統級AI Agent(智能體)」將成為下一代裝置的靈魂,成為新的「權力中心」。誰掌握了它,誰就掌握了最大的App推薦權和使用者心智。僅僅發佈幾天,被寄予厚望的“豆包手機”就主動選擇了“退一步”。12月5日,豆包團隊發佈公告,稱為了讓技術發展與產業生態良性適配,將對AI操作手機的能力進行「規範化調整」。其中最核心的一條,暫時下線操作金融類APP的能力,包括銀行、網路支付等。豆包在公告中給出的理由是“審慎起見”,並表示將積極與廠商溝通,制定清晰、安全的AI操作準則。此前12月1日,豆包手機助理技術預覽版剛剛發佈,並率先落地中興通訊旗下手機品牌努比亞M153。這款能夠跨應用自動操作、完成複雜任務的AI助手,一度讓市場沸騰,原價3499元的手機被黃牛炒至近7000元。然而,興奮情緒還未散去,現實的"圍堵"便接踵而至。微信、淘寶、中國農業銀行、中國建設銀行等應用也陸續出現豆包AI助理無法正常操作的情況。這場技術層面的攻防戰,揭露了AI廠商、手機硬體商與應用開發者之間的利益博弈,並對現有的資料安全法規和商業生態構成了前所未有的挑戰。同時預示著AI Agent作為下一代網路入口的爭奪已經拉開了序幕。01. 微信、淘寶、銀行集體“設防”12月1日,字節跳動正式推出豆包AI助理預覽版。這款產品實現了AI互動的重大突破-能夠根據使用者指令在不同應用間自主切換和操作。豆包AI助理功能覆蓋機票查詢預訂、批次檔案下載、跨平台物流追蹤等效率提升上,同時在生活服務方面也解放雙手,例如智慧修圖、外賣平台比價、一鍵商品購買等。該產品的創新之處在於,從作業系統底層實現AI能力的整合,使AI從傳統的"問答對話"模式進化為"跨應用任務執行"的智能代理。然而在12月2日晚間,多位首批拿到豆包手機助手工程機(努比亞M153)的使用者在社群媒體上表示:使用豆包的AI助手操作微信,會導致微信帳號異常退出,甚至被強制下線無法登錄。在該消息引發熱議後,有聲音將其解讀為「頭騰大戰」升級為「AI Agent 攻防戰」的訊號。緊接著,更多使用者發現,豆包的AI之手,同樣伸不進淘寶和各大銀行的App。無論是嘗試登錄還是進行支付,都會被平台的風控系統攔截。外界普遍認為,這是上述APP 針對豆包AI 助手跨應用操作的反制。對此,微信方面的回應顯得雲淡風輕:“沒有什麼特別的動作,可能是中了本來就有的安全風控措施。”據技術人員分析,豆包手機助理之所以能實現跨App操作,核心在於它獲取了名為INJECT_EVENTS的系統級高危險權限。通俗地講,這個權限允許AI在系統中模擬使用者的點選、滑動、輸入等一切行為。這在微信等超級App看來,與那些批次養號、自動發廣告的「外掛」或「灰黑產」工具在行為模式上高度相似。微信在其服務協議中明確禁止「通過非騰訊開發、授權的第三方軟體、外掛、外掛、系統,登錄或使用本軟體及服務,或進行自動化操作」。而對於淘寶、銀行這類涉及資金安全的App而言,對任何「模擬使用者」的行為保持最高警惕,是其安全體系的本能反應。02. 高盛:這恰好證明了小米的護城河華爾街見聞提及,高盛在最新的研報中指出,豆包的遭遇,恰恰凸顯了第三方AI代理在挑戰現有手機生態時面臨的三大核心障礙:系統級操作權限:手機廠商(OEM)牢牢掌握系統核心和最高權限,很難輕易向第三方開放。系統級記憶能力:廠商能夠存取和儲存最全面的使用者資料,這是訓練AI的關鍵,第三方處於天然劣勢。跨應用介面連接:超級App們希望建構自己的閉環生態,天然會限制外部AI代理的呼叫。高盛認為,這場風波非但沒有撼動現有手機巨頭的地位,反而更加驗證了像小米這樣的公司,其長期競爭力的穩固性。在中國高度整合的手機市場,前六大廠商佔據超過90%的份額,新玩家顛覆市場的空間微乎其微。而小米正在全力推進的「人x 車x 家」全生態戰略,其核心正是由AI貫穿。報告指出,小米的自有AI代理「超級小愛同學」已深度整合進其龐大的硬生態系統,在小米手機使用者中滲透率高達71%。它不僅能操作抖音、淘寶、美團等絕大多數主流App(同樣,微信除外),還能在本地記憶使用者的敏感資料和使用習慣。結論是,小米憑藉其「作業系統+硬體+龐大AIoT生態+深度整合的AI代理」所建構的系統性優勢,形成了強大的競爭壁壘。 豆包面臨的挑戰,剛好是小米等廠商先天優勢的最佳證明。03. AI時代的超級入口之爭豆包捅開的“馬蜂窩”,本質上揭示了對AI時代超級入口的爭奪。當語音互動成為主要入口時,傳統APP的營運邏輯將面臨崩塌。有分析指出,絕大多數使用者不會在語音指令中特意指定平台,比如不會說"用淘寶幫我買部豆包手機",而是直接說"買部豆包手機";也不會說"用高德導航去公司"、"用滴滴打車去學校",而是簡單說"打車去學校"。在這種情況下,誰能成為系統默認入口就顯得至關重要。在行動網際網路時代,App是資料和流量的控制者。而進入AI時代,能夠調度一切、貫穿全域的「系統級AI Agent(智能體)」將成為下一代裝置的靈魂,成為新的「權力中心」。誰掌握了它,誰就掌握了最大的App推薦權和使用者心智。這正是字節跳動選擇與中興合作,繞開自研手機、直接從作業系統層面切入的深層原因。然而,通往這個終局的道路充滿荊棘:意圖框架路線:需要得到第三方App的授權。但在利益衝突和資料安全的壁壘下,微信們的「花園圍牆」只會越修越高。純視覺方案:無需授權,通過“讀屏+模擬點選”實現。但這又回到了與微信們正面衝突的原點,並時刻面臨法律與合規的挑戰。AI Agent的元年已經開啟,技術創新與現有商業生態、安全規範之間的平衡點仍在探索。這場遊戲的參與者,包括了騰訊、阿里、字節這樣的網路大廠,華為、小米、OPPO這樣的終端廠商,以及無數AI創業公司。沒有人敢置身事外。馬斯克曾預言,App終將消失,一切都將由AI生成。豆包的這次碰撞,為這場關乎未來十年網路格局的終局之戰,拉開了序幕。 (硬AI)