#豆包
豆包的野心,被千問先實現了
2026年剛開始不久,國內AI領域的又一里程碑事件就出現了。題圖 | 阿里巴巴1月15日,阿里巴巴集團旗下的千問App宣佈接入淘寶、支付寶、淘寶閃購、飛豬、高德等阿里生態業務,可以實現點外賣、買東西、訂機票等AI購物功能。和AI助手聊天,讓AI助手尋找資料、生成文件,已經是很多人生活中不可或缺的一部分。但絕大部分情況下,AI助手是和使用者手機裡的“錢”絕緣的,它可以為我們提供理財和消費建議,但不能“上手”。而千問App的這次升級,打破了這個界限。你只需要說幾句話,AI助手就在淘寶給你下單支付了。活動現場,千問C端事業群總裁吳嘉演示了AI外賣功能,給千問App下達一句話指令,“幫我點40杯霸王茶姬的伯牙絕弦”,隨後千問App呼叫淘寶閃購下單,無需任何跳轉即在端內完成AI支付。不久後,淘寶閃購騎手就將奶茶送達現場。更複雜一些的操作也可以,比如像聊天一樣說“想給爸媽家買個掃地機器人,預算2000到4000,家裡還有隻貓”,千問App就能推理出“防纏繞”、“高溫殺菌”的需求,並給出合適的商品;準備春節出遊,千問App一邊呼叫飛豬來預定機票和酒店,一邊呼叫高德來做行程規劃和預定年夜飯,甚至直接打電話訂餐廳。這些操作,不由讓人想起了不久前火爆全網的“豆包手機”,類似的“AI跨應用”設想,為什麼一個被大範圍抵制,一個則順利發佈呢?01.千問App 與豆包手機,差在那?我們來回顧下豆包手機的發展軌跡:2025年12月1日,字節跳動與中興通訊聯合推出了搭載豆包手機助手預覽版的努比亞M153,也就是我們說的“豆包手機”,具備跨應用自動操作能力;僅僅幾天後,就有使用者反饋在使用豆包手機助手操作微信時出現異常退出,同時,支付寶等金融應用因系統權限問題觸發風控,部分使用者帳號被強制退出或限制登錄;2025年12月5日,豆包手機助手發佈《關於調整AI操作手機能力的說明》,明確限制三類場景,其中包括暫停操作銀行、支付等涉及資金安全的App。曇花一現的背後,網路上對其的聲討主要聚焦在使用者隱私方面,但深入思考一下就不難發現,“豆包手機”試圖打通微信、支付寶等不同大廠的App,來實現跨應用的便捷操作,讓AI助手升級成“智能管家”,這種模式顯然觸及了各大廠的商業利益。移動網際網路時代,像微信、支付寶、抖音這樣的超級App是“版本答案”,它們建構起封閉的生態,掌握著流量入口和商業變現模式。但“豆包手機”卻在挑戰超級App的地位,比如,AI助手成為新的流量入口,直接會減少使用者在App的停留時長,進而減少其廣告曝光與商業變現機會,最終可能瓦解超級App的商業閉環,使其淪為工具型App。當然,這樣的模式是非常有想像力的,就像抖音集團副總裁李亮所說的:“AI帶來的變革是真實存在的,使用者的需求也是真實存在的。豆包和中興的探索是個開始,不論這次是不是會成功,但AI一定是未來。”沒有大廠會對這樣的機會視而不見,問題是要怎麼做?千問App和“豆包手機”的不同在於,如果說“豆包手機”是在“砸別人家的牆”,千問App則是在“自家地盤修路”,由於其整合的都是阿里系App,就不存在激烈的利益衝突,千問App只需充當“串聯者”的角色,因此落地的難度大大降低。DoNews 攝這張照片由筆者在現場拍攝,淘寶、支付寶、飛豬、高德等一眾阿里生態業務都來為千問App站台,不誇張地說,除了微信的社交功能無法取代,這些App足夠涵蓋普通人日常的大部分需求了。02.App生態:超級AI的“護城河”老網際網路人還記得“阿里系”和“騰訊系”這兩個標籤,兩家大廠曾在網際網路的各個領域跑馬圈地,通過內部創業和收購,將一系列的App納入自己的生態版圖。本以為這個時代已經逐漸過去,AI的發展,卻讓App生態的協同優勢再次凸顯。阿里系豐富的應用場景,為千問App提供了廣闊施展空間,它就像是使用者手機中阿里系App的“總調度台”。比如淘寶購物、支付寶支付這些高頻場景,在千問App內都能一站式達成,最佳化了使用者的體驗,也進而提高了使用者對千問App乃至阿里系App的粘性。也許未來最強大的人類AI助手,考核的標準不是智能上限,而是可以合法呼叫App的“資格”?能觸達的App生態,將成為移動端超級AI的“護城河”。這裡面要重點提到的就是支付寶,“豆包手機”暫停了操作銀行、支付等涉及資金安全的App,就像被斬斷了伸向現實的觸角,而千問App卻能通過支付寶深度打通各個App業務的支付鏈路,進而實現從“聊天對話”到購物付款等“辦事”的躍遷。但“豆包手機”被拷問的問題同樣存在:AI的操作是否獲得使用者明確授權?資金交易過程是否足夠安全?更換裝置或應用後,服務體驗能否保持連貫?1月16日,支付寶聯合千問App、淘寶閃購等夥伴,發佈了ACT協議(Agentic Commerce Trust Protocol,智能體商業信任協議),回答了這些問題。這是中國首個面向Agent商業需求設計的開放技術協議框架,可以說,就是為AI與電商、外賣等服務平台的協同而打造的一套“通用語言”,保證跨終端、跨系統、跨平台的AI任務執行便捷且高效。支付寶為其搭建了“委託授權域”“商業互動域”“支付服務域”“信任服務域”四個核心基礎設施標準,在ACT協議的規則框架下,AI僅承擔下單操作的執行角色,付款環節由使用者主導或自主授權,在保障資金安全的前提下大幅節省時間成本。還是以在千問App點奶茶為例,使用者在千問App發出指令,千問App推薦附近符合需求的商品,同步完成比價與優惠券自動核銷,使用者點選“選它”確認支付寶付款完成結帳。目前ACT協議可在AI代買、企業自動化採購等場景使用,未來還將持續最佳化,支付寶表示,正積極推動更多支付服務商、商家與平台、AI開發者、智能終端生態廠商加入共同完善協議內容。隨著“AI代辦”服務日漸普及,支付是其中特殊且關鍵的環節,正成為全球科技企業的共識。此前,OpenAI聯合Stripe推出協議以支援ChatGPT結帳功能;近期,Google也發佈AI購物全流程通用商務協議(Universal Commerce Protocol,簡稱 UCP),將實現使用者在 Gemini 內直接下單。繁榮且全面的App生態,和來自支付寶的關鍵支援,是千問App邁向超級AI助手的重要助力;當然,強大的底層能力——千問大模型Coding能力大幅提升、全模態理解能力突破、超長上下文處理能力大幅提升——是一切的前提。能同時滿足這三個條件的科技公司,在國內可以說屈指可數,也許阿里巴巴之後,騰訊有可能跟進整合,字節跳動和百度還要略遜一籌。對中小型AI企業而言,缺乏繁榮的App生態和支付協議,複製千問模式難度巨大。可以預見,手機端的AI競爭將進一步加劇。結語:千問App的這次升級,對使用者來說將帶來諸多便利,但隨著其整合阿里系App,這種閉環模式是否又會限制使用者的選擇權呢?AI進入“辦事時代”的趨勢不可阻擋,但最終的商業模式會是怎樣,還值得持續關注。 (DoNews)
日活過億的豆包APP,上線了“豆包愛學”
多知觀察到,豆包APP近日上線了“AI老師”功能,名字就叫“豆包愛學”。此功能最早於去年9月在豆包愛學APP中率先推出。“願意聽、願意問、學得會”。在豆包APP底部功能欄進入“豆包愛學”後,使用者可通過文字、語音或拍照上傳題目等方式提問。豆包AI老師(“豆包愛學”)會結合智能板書、即時互動問答及知識延伸講解,幫助使用者理解問題。(“豆包愛學”出現在豆包APP底部的功能欄)根據中金公司近期援引的市場資料,豆包App日活躍使用者數已突破1億。此次“豆包愛學”功能接入豆包APP,可視為豆包在教育領域探索的一個階段性體現,也反映出該產品在教育方向持續投入、並試圖提供更具深度學習支援的發展定位。可以說,與去年9月推出的1.0版本相比,此次上線的豆包AI老師(“豆包愛學”)已升級至2.0版本。那麼,具體有那些迭代呢?核心在於,如果說1.0版本著重於“講好題目”,2.0版本則更關注如何“講好知識”,同時讓使用者“願意聽、願意問、學得會”。具體來說,一方面,其講解能力增強。2.0版本在講解時更注重知識的深度和延伸,也更容易引發使用者的思考。以“蘭亭集序”為例。豆包AI老師從雅集現場、傳世文字、書法封神三個層面逐一展開講解。講解的最後,它拋出了“如果《蘭亭集序》沒有那麼高的書法成就,它還能流傳千年嗎?”這一問題啟迪使用者進一步思考。另一方面,其多模態能力也有所提升。在講解題目需要圖示輔助時,2.0版本可搜尋和生成圖片,讓解答更生動形象。(圖截自豆包APP)儘管“豆包老師”功能已同時在豆包APP與豆包愛學APP上線,但兩款產品的定位仍有明顯區別,從產品體驗上看:豆包愛學專注於教育垂類,面向學科學習場景,使用者群體更加垂直,主要面向中小學學生和家長。在該APP中,使用者可以進行更深度的教育行為積累與學習動作。豆包則面向更廣泛的使用者群體,功能設計上更為泛化,覆蓋更多日常場景,包括百科、知識問答等。多知獲悉,字節跳動旗下的Gauth、豆包愛學屬於同一部門。就在不久前,隨著期末考試的臨近,字節跳動旗下海外教育產品Gauth宣佈推出一項新功能:AI tutor,類似豆包愛學上的“AI 老師”功能,同時還推出了Study Converter(學習轉換器)。Study Converter功能瞄準了美國學生除拍照搜題外的另一個剛需——複習備考與知識記憶。簡單來說,學生可以通過這項功能將多種學習資料(包括照片、錄音、PDF檔案、YouTube視訊連結、網頁連結或手動輸入話題等)上傳至Gauth,系統便會自動生成互動測驗(interactive quizzes)、閃卡(flashcards)或內容總結(summaries,解決“太長不看”的問題)。對Gauth而言,此舉意味著它已不再侷限於拍照搜題的框架。拍搜只是學習過程的入口,而Gauth更希望深入學習環節,協助學生解決整體學習流程中的問題,成為真正意義上的學習助手。整體來看,無論是Gauth、豆包愛學,還是豆包,從其產品迭代與功能上線的節奏來看,字節團隊在AI教育場景上的投入和佈局都顯示出極高重視。 (多知)
字節又賭贏了
豆包成為字節新“王牌”上周,豆包刷足了存在感。先是有媒體報導,火山引擎將攜豆包站上春晚 AI 雲獨家合作的 C 位;接著豆包 DAU(日活躍使用者數)破 1 億的消息不脛而走——若再結合火山引擎披露豆包大模型日均 Token 呼叫量已超 50 兆,一場事先張揚的 AI 輿論戰便在 2026 年前夕打響了。躁動的不止字節跳動:前腳,阿里調集數百名工程師聚集在西溪園區 C4 樓封閉開發千問;後腳,騰訊成立 AI Infra 部、AI Data 部及資料計算平台部,全面強化 AI 研發體系。種種跡象顯示,網際網路巨頭正在 AI 賽道不遺餘力推進 “模型研發與 ToC 產品落地平行” 的商業化佈局。這恰恰讓字節回到了最熟悉的“舒適區”——極致 ROI、極致商業效率早已刻進這家公司的 DNA,從資訊、短影片到電商、短劇,字節跳動向來擅長以“閃電戰”在軍備競賽中彎道超車;如今,字節跳動正在 AI 混戰中,不動聲色完成階段性成果驗收。字節迎頭趕上復盤字節跳動的崛起路徑,除在本地生活、遊戲賽道“短暫躊躇”外,其在資訊、短影片、電商、短劇等核心賽道都非先發者,卻最終上演了後來居上的戲碼。2024 年初,字節跳動 CEO 梁汝波在 All Hands 全員會上多次提及“危機感”。他坦言,不少內部人士反饋,現在字節“該有的大公司病全有了”,最大的危機感是擔心字節跳動作為一個組織,正變得平庸,無法取得新突破;尤其,在應對這波大模型浪潮時顯得遲鈍。這場會議成為戰略轉向的明確訊號,也是字節跳動奮起直追的關鍵註腳——此後兩年間,多篇媒體報導均提及,張一鳴對 AI 業務展現出濃厚興趣:不僅會在新加坡與研究員深度交流,還會定期回國與核心技術骨幹溝通。這一系列動態,也讓今年 6 月下旬“張一鳴重回字節跳動業務一線”的傳聞愈演愈烈——畢竟,他曾帶領字節跳動闖入騰訊、阿里的“狩獵禁地”,即便遭遇重火力阻擊,仍成功改寫了資訊、短影片、電商行業格局,打造出數款 DAU 破億的產品。據虎嗅瞭解,自 2024 年下半年起,豆包大模型所屬的字節跳動 Seed 團隊,被視為公司核心戰略業務,集團核心高管不僅親自參加 Seed 團隊復盤會,還深度參與 AI 技術路線、模型策略及前沿課題的規劃,字節跳動也從之前的反應遲緩快速切換至全力追趕的姿態。與此同時,2025 年 Seed 團隊完成了 AI Lab 等數個部門的整合,吳永輝肩挑“一號位”,全面統籌大模型基礎研究與應用落地,盡顯“畢功於一役”的戰略決心。背後的深層原因在於,當下中國移動網際網路已進入使用者、流量趨於見頂的成熟期,監管層面更側重產業網際網路的推進與建設,這意味著技術已走到平台重構生態的關鍵節點,張一鳴自然無法“作壁上觀”。正如四年前他卸任時預判的那樣:“科技公司面臨的外部環境正在變化,科技對社會的影響越來越大,這些因素決定了字節跳動‘需要突破業務的慣性去探索’。”與此同時,字節跳動的大模型敘事也搖身一變成了“逆襲樣本”,豆包的競爭優勢正逐步擴大。從使用者規模來看,2025 年初 QuestMobile 資料顯示,截至 2024 年 11 月底,中國 AIGC APP 整體月活使用者數量突破 1 億,較 2024 年 6 月實現翻倍;其中,豆包佔據行業一半的月活使用者份額,處於第一梯隊的 Kimi 智能助手、文小言與豆包的月活差距也在持續拉大。如今,豆包的 DAU 已突破 1 億,且使用者增長過程中的市場推廣成本是字節跳動歷史上所有 DAU 破億產品中最低的。資料來源:AppGrowing(2025年)據 DataEye 研究院資料,2025 年 11 月大陸市場原生 AI 產品投放素材達 89.1 萬組;其中,騰訊元寶素材量佔比 46%、千問佔比 34%、豆包僅 11%。從整體市場投放格局來看,2025 年騰訊元寶、阿里夸克、字節豆包穩居前三。其中,騰訊元寶的投放策略最為激進:AppGrowing 資料顯示,自 2025 年 2 月起,元寶的投放力度持續走高,尤其春節後,騰訊元寶憑藉高額投入在 APP Store 免費榜先後超越豆包、DeepSeek,最終於 3 月 3 日登頂中國區 APP Store 免費榜。阿里同樣來勢洶洶,千問 APP 於 11 月 17 日開啟公測,據第三方資料,其創下國內 AI 應用最快增長紀錄,成為不容小覷的“攻擂者”。至此,網際網路大廠在 AIGC 這一新賽點,似乎又回到了移動網際網路時代卷投放、搶管道入口的“暴力燒錢”模式。一位大模型行業從業者向虎嗅表示,字節跳動在 AI 領域展現出了體系化的執行力,核心體現在三方面:精準把握戰略方向、高效配置研發資源以及快速響應市場的迭代能力。“梁汝波內部反思至今不足兩年,字節跳動卻能快速鎖定關鍵戰略方向、調整資源分配,在大模型領域迎頭趕上——C 端推出豆包、貓箱(AI 虛擬陪伴應用)、剪映(視訊編輯工具)、扣子(AI 智能體開發平台)等貼合需求的產品;B 端通過火山引擎持續最佳化 AI 雲服務。相比之下,部分大廠在市場響應速度與技術支援上有所保留,導致其在競爭中逐漸顯現頹勢。”上述人士補充道。對此,火山引擎智能演算法負責人吳迪曾向虎嗅表示,AI 是一項需要長期投入的事業,未來 10 年、20 年才會逐漸顯現真正價值,眼下的快慢在漫長的歷史周期中影響有限——這一邏輯與移動網際網路 3G、4G、5G 的普及處理程序類似,技術變革需建立在使用場景充分落地、使用者心智深度滲透的基礎上,只是 C 端使用者與媒體往往會過度關注短期進展並加以解讀。“做好產品本身更為關鍵:B 端客戶注重產品性價比,C 端使用者則關注使用體驗,本質是讓使用者無論選擇那款產品,都能獲得更便捷、實用的服務。”吳迪強調。事實上,從抖音到紅果,從豆包到即夢、貓箱,字節跳動全面的產品策略與靈活的市場定位,使其能夠覆蓋不同使用者群體需求,持續強化對流量入口的掌控力:一方面,豆包、貓箱、剪映、扣子等 C 端應用通過使用者互動沉澱資料,反哺模型性能最佳化,進而提升使用者粘性與忠誠度;另一方面,AI 應用的“幻覺”問題需通過持續最佳化資料質量、模型架構與評估機制來解決,而廣泛收集、清洗、標註資料是關鍵,這能有效避免模型過度擬合,提升泛化能力。尤其隨著市場競爭格局逐漸明朗,大模型的核心競爭力已轉向推理效率、精準性與即時性,頭部大廠紛紛推出模型開發平台,建構開放生態:火山引擎 2023 年 6 月推出 MaaS 模式大模型服務平台“火山方舟”,整合多家 AI 科技公司及科研院所的大模型,提供企業級精調、推理、評測全流程服務,同時逐步向個人開發者開放。阿里雲 2023 年 10 月上線“阿里雲百煉”,整合通義千問系列、DeepSeek 等主流模型,支援文字生成、多模態處理、程式碼生成等核心能力,通過 MCP 服務等開放生態及行業解決方案推動 AI 規模化落地。騰訊雲 2025 年 5 月 21 日將“大模型知識引擎”升級為騰訊雲智能體開發平台(TCADP/ADP),依託混元大模型與優圖實驗室演算法優勢,支援低程式碼/無程式碼搭建專屬智能體。一位大模型創業者認為,這些優質的模型開發平台,可以助力中小團隊向更垂直的細分領域突破:一是聚焦技術研發,深耕特定應用場景,最佳化模型性能,提供高品質專項服務;二是建構完整解決方案,圍繞模型打造資料採集、預處理、部署等全流程服務,提升使用者體驗;三是探索創新商業模式,積極佈局訂閱服務、技術支援、定製化開發等增值服務,增強盈利能力。這與火山引擎總裁譚待的期待不謀而合。他認為,AI 如同一場馬拉松,早期階段無需緊盯最終目標,而應聚焦“成功的早期訊號”——基於這一理念,團隊重心會放在產品最佳化上,通過與客戶高頻互動、響應市場迭代,持續驗證產品是否走在正確的發展軌道上。一個獨特的全球化樣本隨著豆包一路狂飆,市場浮現了一個不容忽視的訊號。誠然,阿里雲、騰訊雲、百度智能雲憑藉自身資源已然佔據先發優勢與人才優勢,火山引擎晚了近十年才“上桌”;但憑藉豆包的爆發式增長,其大模型日均 Token 呼叫量已超 50 兆(半年內增長 200%),規模全球僅次於 OpenAI 和 Google Cloud,以至於被媒體調侃:字節跳動正在變成“Token 跳動”。對此,火山引擎總裁譚待表示,不同於雲端運算時代,AI 雲時代模型是軟體核心,尤其隨著大模型能力持續提升,偏向 C 端的行業增長更快,例如網際網路、C 端零售(含手機、汽車)、教育等領域。“但 B 端也不錯,有個客戶內部做了大概 100 多個智能體,每天有幾十億 Token 消耗。”他進一步補充,雲端運算時代 Token 消耗符合二八定律,企業與個人的用量佔比約為 8.5:1.5,而在 AI 雲時代,這一比值正動態調整至 7.5:2.5,“我覺得未來,個人可能還會再高一點”。究其本質,大模型時代的 AI 應用開發是全新的技術範式,核心競爭力聚焦三點:模型智能度、響應速度、成本控制——這三大因素直接決定 AI 應用的使用體驗與使用者普及度,也成為 AI 雲廠商競爭的 “新賽點”。譚待還透露了一組關鍵資料,“我們內部算了一下,火山兆 Tokens 客戶有 100 個,比 AWS 多一些,說明整個 AI 的進展還是比較好的”;至於客戶分佈,火山引擎曾對外公佈,覆蓋八成頭部咖啡茶飲品牌、九成主流汽車品牌、八成頭部券商、八成系統重要性銀行、七成 985 高校,以及 9 家全球出貨量前十的手機廠商。作為對照,2025 年 10 月 OpenAI 曾披露,其 Token 呼叫量過兆的客戶僅 30 家,且集中在教育、銷售、程式設計(Coding)等場景。“模型競爭日益激烈,每兩三個月就有新的 SOTA(最優性能)模型誕生;預計到 2026 年,全球 MaaS 賽道大機率只會剩五六家在第一梯隊。” 一位資深行業觀察人士向虎嗅分析,如此激烈的競爭格局下,基礎模型能力的提升將倒逼企業持續加大算力投入,而工程化升級則要求更低成本、更高易用性,兩者疊加比拚的仍是模型“性價比”。AI 業務的狂飆,也在推動字節跳動向著一家具備全球影響力的科技公司邁進。過去一年,字節跳動在電商、短劇、AI 領域的擴張速度明顯加快,旗下所有應用的月活躍使用者數預估超 40 億,商業化能力也節節攀高。先是 2025 年 7 月,外媒報導今年前三月,字節跳動收入超過 430 億美元,首次超過 Meta 同期的 423.1 億美元,成為 2025Q1 全球收入最高的社交媒體公司。圖源:Tech News Hub12 月 19 日,外媒援引知情人士消息,字節跳動 2025 年淨利潤或將站穩 500 億美元關口,超額完成全年盈利目標,營收也將從 2024 年的 1550 億美元增至約 1860 億美元。要知道,美國科技巨頭 Meta 2025 年的營收預計約 2000 億美元,利潤或將維持在 600 億美元,字節跳動在全球使用者規模、營收、利潤等核心指標上,均在持續縮小與 Meta 的差距。此外,12 月 23 日外媒報導,字節跳動計畫在 2026 年投入 1600 億元加碼 AI,其中一半預算將用於 AI 晶片採購——若按照 2025 年 500 億美元的預估利潤計算,字節跳動 2026 年的 AI 投入將佔 2025 年全年利潤的近一半。從 AI 賽道的加速狂飆到 AI 晶片投入的愈發激進,資本市場也給出了積極反饋:先是軟銀願景基金將字節跳動估值上調至 4000 億美元以上;隨後,富達投資與 T. Rowe Price 在各自的持倉與估值模型中,分別給予字節跳動約 4100-4500 億美元的估值區間。更高的估值溢價則來自近期的二級市場交易:今日資本創始人徐新掌舵的機構,以約 4800 億美元的整體估值買入字節跳動股份——即便如此,字節跳動的估值與 Meta 當前 1.7 兆美元市值相比,仍存在不小差距。對此,科技行業觀察者魏亞輝認為,字節跳動是中國網際網路領域一個獨特的全球化樣本——這家公司成立後兩三年便實現大規模盈利,這在之前的中國網際網路公司中屈指可數;同時,它在海外市場與國際巨頭展開勢均力敵的競爭,憑藉一年近 500 億美元的淨利潤(接近騰訊兩倍,基本與 Meta 持平),真正實現了全球級盈利水平。“此前中國部分網際網路公司盈利不佳,原因在於那一代創業者大多不以利潤為核心導向,指望這類企業在短期內實現高額盈利並不現實;而以字節、大疆、拼多多、米哈游為代表的新一代企業,顯著特點是盈利能力極強,應該把希望放到這些新公司上來。”魏亞輝說道。 (虎嗅APP)
豆包日活破億,中國國產AI大戰邁入新階段?
國產AI大戰或加速步入下一階段。中金公司援引市場資料顯示,國內豆包App日活躍使用者數(DAU)已突破1億大關。該機構認為,豆包目前的使用者規模、留存率、增速、DAU與MAU的比率,均說明其DAU邁向更高門檻的確定性強,甚至有望實現對Chatbot形態的產品使用者近乎全量的覆蓋;而競爭對手們無論是基於對產品的理解、定位還是投入,都很難影響這一路徑。而根據研究機構Quest Mobile發佈的《2025下半年AI應用互動革新與生態落地報告》,截至最新統計周期(12月8日至12月14日),豆包周活躍使用者數在全市場AI原生App中亦居榜首,達1.55億,實現了斷崖式領先。DeepSeek、元寶分別位居第二、第三,周活躍分別為8156萬、2084萬;螞蟻阿福、千問周活躍使用者量則分別為1025萬、872萬。豆包使用者數目增長的背後是大模型呼叫量的跨越式爆發。在前不久的火山引擎原動力大會上,火山引擎總裁譚待透露,豆包大模型日均使用量(Tokens)超過50兆,自發佈以來增長417倍。對此,中金公司如此強調:“國內所謂‘Chatbot入口之爭’似乎已然意義不大。”儘管如此,國內網際網路大廠所佈局的AI入口形態確各不相同:12月1日,字節跳動豆包團隊發佈豆包手機助手技術預覽版——一款通過深度系統合作而實現的AI手機;阿里將千問APP視作“超級入口”,並致力於接入高德地圖等生態場景;騰訊則是將元寶深度融入微信APP,其活躍程度甚至一度引發“評論區的元寶互動是小編輪班扮演還是AI”的爭議。基於上述背景,仍有眾多機構強調未來AI入口之爭的不確定性,如華源證券指出,AI入口競爭後續會持續演繹,手機端側、超級APP和垂直AI平台將從不同維度持續推進AI Agent入口使用者層面的教育和圈定,同時通過不同方式完成應用層生態的連接和統一。中泰證券最新研報則表示,越來越多的AI應用場景正被解鎖。AI會放大應用的價值空間,從效果工具走向勞動力服務市場,市場空間有望大幅提升。更多的專業門檻高、流程複雜、服務屬性強的場景不會被大模型廠商穿透。投資層面上,該機構判斷,基礎大模型廠商仍在加速卷能力天花板,對算力的需求持續旺盛,且伴隨AI應用的快速落地,更多的推理算力需求也隨之而生,隨著宏觀經濟好轉、AI應用落地以及人員調整與人效提升,電腦類股的基本面有望加速向好。 (科創板日報)
張一鳴全面出擊,抖音豆包徹底起飛
張一鳴已經勢不可擋。2024年初,豆包大模型橫空出世,許多人還帶著冷眼旁觀的審慎。沒想到短短一年,它已經實現了日均50兆次的呼叫數量。而豆包AI手機的問世,現在更是改寫了網際網路十年未變的互動邏輯。在這場AI手機的變革中,張一鳴帶著字節跳動,已然掀起巨浪。豆包大模型日均呼叫量已超過50兆昨天,字節舉辦了火山引擎原動力大會,會上總裁譚待透露,截至今年十二月,豆包大模型日均呼叫量超過50兆,自模型發佈以來增長417倍。圖源:財聯社譚待指出,目前已有超過一百家企業通過火山引擎平台實現累計呼叫量突破兆tokens。這裡的“token”是處理文字、圖像、音視訊資訊的基本單位,其規模之大,意味著豆包AI已深度融入企業核心業務,並能穩定支援億級使用者的實際需求。市場表現同樣印證了這一趨勢。目前在中國,月活躍使用者達億級的AI原生應用僅有豆包與DeepSeek兩款。資料表示,今年第三季度,豆包月活規模逆勢增長8%,反超DeepSeek位列第一,反映出豆包在基數較高的基礎上,依舊在保持穩定增長。圖源:QuestMobile會上,團隊還正式發佈了豆包大模型1.8版本,以及音視訊創作模型Seedance 1.5 pro。與以往相比,豆包大模型1.8發生了一些變化。在核心定位方面,該款大模型從側重於通用對話與生成,轉向強調規劃和執行能力,類似於由一個聊天夥伴,升級為一個主動思考並幫助使用者解決問題的管家。在性能方面,該模式處理視訊的能力變強,單次視訊理解幀數從640幀提升至1280幀,能像人一樣速覽長視訊並識別關鍵片段。同時,模型支援智能上下文管理,能在長任務中自動清理無效資訊,避免對話中斷或遺忘,讓創意生成、複雜任務執行更加流暢。此外,該模型在遵循複雜指令、進行多輪互動乃至直接作業系統層面都有明顯增強。這與前不久豆包AI手機的底層邏輯類似,或許暗示著字節對AI手機落地的決心。整體來看,無論是日均呼叫量的飛躍式增長,還是模型能力的持續迭代,都清晰指向AI已不再只是展示技術,而是真正成為支撐企業營運、服務億級使用者的基礎設施。而在規模化落地上,豆包顯然已經跑在了前面。拿下vivo,豆包手機的合縱連橫之術12月初,字節聯合中興發佈了一款豆包AI手機樣機。和尋常搭載智能語音助手的手機不同,它能像真人一樣,通過模擬點選在多個App間自動跳轉,完成複雜任務。例如,說一句“幫我全網比價xx品牌的牛仔褲”,它會自動打開淘寶、京東等App搜尋、比價,最後找到最優解,跳轉到支付頁等使用者確認。此外,能得到使用者授權後,它可以記住使用者的偏好,如常坐的航班座位,並能“看懂”螢幕內容即時互動。圖源:36氪這完全改變了智慧型手機的互動方式。以前是使用者自己點選,在不同App間手動切換完成任務,應用和應用之間是孤立存在的。而現在,手機成為中央調度器,AI打破了應用壁壘,使用者給AI下達指令後,由AI跨應用自動執行任務。樣機剛一上市,就引起業內熱議,在兩天內迅速售空。然而在測試中,出現了插曲,即用該款手機登錄微信時,出現了異常情況,導致使用者無法登錄。據瞭解,這大機率是觸發了微信系統的防控機制。事後,豆包官方團隊對此事進行了回應,異常登錄的問題被陸續解決。但是這件事,也讓大家紛紛猜測,這款手機是否觸及了網際網路巨頭的利益。一般來說,使用者在使用服務時,需要打開軟體app,比如美團、淘寶等,這時,app充當了一個流量入口,通過使用者瀏覽、點選、下單等資料,軟體可以推薦相應的資訊和廣告,從中獲取利益,並得到使用者的相關資料。而AI手機直接擊碎了這條線,使用者通過AI下達指令,不接觸應用介面就能完成需求,原有廣告、推薦等流量路徑被繞過,這相當於動搖了現有移動網際網路商業模式的根基。因此,這場微信風波也被業界解讀為一場關於未來流量入口和資料控制權的防禦戰。而字節跳動也因為缺乏硬體技術,面對此類平台級限制,似乎一時難以突破。就在外界認為字節跳動將暫緩硬體嘗試時,它卻迅速找到了新路徑,與 vivo 達成合作,再次引爆關注。據瞭解,字節跳動與vivo的具體合作模式,是字節跳動通過 “讓利換入口” 的策略,在vivo手機上預裝“豆包”AI助手,並共享未來的流量收益。據知情人士透露,字節跳動為吸引廠商,提出了一套“低門檻+高分成”方案。即前期零成本,計畫免除給vivo的定製開發費和AI使用(Token)銷售分成;後期共享收益,讓vivo參與其帶來的流量分發與會員訂閱等收益分成。這次合作,對字節跳動而言,這是獲取“關鍵入口”的戰略佈局,有助於扭轉其在AI競爭中處於“應用層”的相對被動局面。對vivo而言,這是快速提升AI競爭力的務實選擇。據瞭解,vivo曾謀求與騰訊在AI大模型的深度合作,後因遲遲找不到合適的商業化落地方式導致雙方不能達成一致,其中一點便是Token成本帶來的問題。同時,其自身AI業務進展也未達預期。因此,與字節跳動合作,既能快速為手機注入成熟的AI能力作為賣點,又能通過新的流量分成模式獲得收益,是一種高效且低風險的策略。資料顯示,今年第三季度,vivo以18%左右的市場份額重返榜首。圖源:Omdia此時選擇與字節跳動聯手,不僅是兩家企業的雙贏,更可能攪動整個手機行業的競爭格局。AI手機的戰爭已經打響除了vivo,字節跳動與聯想、傳音等多家硬體廠商正在推進合作。魅族更是主動向其拋出了橄欖枝。由此可見,AI手機領域的合縱連橫已全面展開。縱觀當前市場,AI手機的參與者可大致分為三個主要派別:一是全端自研派,以華為、小米為代表。圖源:微博它們從晶片、作業系統到端側大模型全程自主可控,如華為的麒麟晶片與盤古模型、小米的MiLM大模型。這類路線技術壁壘高,強調性能與隱私安全,掌控力強,但研發投入巨大。二是合作務實派,以vivo、OPPO為核心。圖源:微博它們在堅持自研大模型(如vivo藍心)的同時,也開放引入外部成熟的AI能力,以快速補齊體驗、搶佔市場。策略靈活務實,能借助市場佔有率推動AI落地。三是網際網路生態派,以字節跳動、阿里巴巴等大廠為主。圖源:微博它們通過預裝或深度整合,將自家AI助手變為手機的系統級能力,全力爭奪“第一入口”。不過,這一派別內部競爭也非常激烈。此前就有行業觀點認為,阿里、騰訊、美團等可能形成“聯合防禦”,共同限制AI對跨應用呼叫的權限。不過雖然目前大家都在投入,但清晰的盈利閉環,如訂閱制、流量變現、服務分成,尚未完全明朗。或許誰能率先找到可持續的商業模式,誰就能贏得持久戰。此外,誰能率先催生出真正顛覆性的、使用者離不開的AI原生應用,誰或許就能獲得決定性優勢。今年以來,各大廠已明顯加快佈局。小米引入AI專家羅福莉,騰訊挖來姚順雨,人才儲備戰悄然打響。這些動作為下一階段的競爭積攢著關鍵能量。最終會是“一個統一的AI助手” 勝出,還是 “多個專用AI助手” 並存?這需要時間驗證。 (科技頭版)
豆包大模型1.8正式發佈,擁有更強多模態Agent能力,豆包日均使用量超過50兆,推出成本節省計畫降幅達47%
豆包大模型1.8具備更強的多模態Agent能力,256K超長上下文使其能夠處理更複雜的資訊,擅長處理複雜多步任務。火山引擎正式發佈的"AI節省計畫",普惠覆蓋豆包大模型、豆包視訊及圖像創作模型與第三方開源大模型,全面最佳化使用者呼叫成本,最高節省幅度達47%。火山引擎在2025原動力大會上發佈豆包大模型1.8,具備更強的多模態Agent能力,256K超長上下文和原生API上下文管理,擅長處理複雜多步任務。火山引擎總裁譚待在12月18日的大會上透露,平台"兆Tokens俱樂部"成員已突破100家。並披露豆包大模型日均使用量超50兆Tokens,自發佈以來增長417倍,同時推出最高節省47%的AI成本最佳化計畫。除主力模型外,火山引擎同步發佈圖像創作模型Doubao-Seedream-4.5和視訊生成模型Seedance系列,進一步完善多模態能力版圖。新推出的Seedance-1.0-Pro支援2至12秒1080P自由生成,可實現多人語言對白和多鏡頭敘事。火山引擎正式推出"AI節省計畫",一次加入即可覆蓋豆包大模型、視訊圖像創作模型及第三方開源大模型,支援全預付、零預付等靈活付款方式。開源證券研報指出,此次發佈有望推動AI在企業生產場景中的落地應用。火山引擎總裁譚待在回應對明年模型行業的競爭時表示,“明年模型之間最重要的還不是競爭,最重要的是要把市場做大。明年這個市場可能還要再漲10倍,大家其實就不是存量的競爭,不是零和博弈,而是說大家一起把市場做大。同時,明年模型還需要進一步降價,這個市場才能做大。”01 核心模型能力全面升級豆包大模型1.8在多模態理解上實現顯著提升。模型的長視訊理解和安防監控場景能力得到增強,256K超長上下文使其能夠處理更複雜的資訊。通過更靈活的上下文管理,新模型可輔助公司處理複雜任務並支援決策。在圖像生成領域,火山引擎發佈的Doubao-Seedream-4.5具備多圖組合、創意寫真、圖片拆解、複雜組圖、虛擬試穿與海報設計等能力。視訊生成能力同步增強,Seedance系列包含兩個版本:Seedance-1.0-Lite以成本優先兼顧速度,適配高頻創作;Seedance-1.0-Pro提供影視級畫質與原生音效,滿足電影級感官敘事需求。豆包大模型已落地智能硬體與語音助手,應用場景覆蓋日常溝通、專業服務與報告解讀、聯網搜尋等。配合使用者認證的邊想邊搜互動體驗,使豆包成為隨身智能夥伴。02 推理與開發服務生態完善火山引擎推出"火山方舟"推理代工服務,已接入Qwen、GLM、Seed-OSS等主流開源大模型,支援企業將精調後的模型一鍵Serverless部署。平台提供海量資源、專屬推理加速與極致彈性調度,承諾"你訓練,我推理"。Viking系列產品在大會上亮相,VikingAI搜尋與VikingDB向量資料庫雙輪驅動,為終端使用者提供優質輸入,為模型與Agent快速建構知識庫和記憶庫。配套的多模態搜尋支援文字、圖像跨模態檢索,個性化推薦實現"千人千面",Agentic問答基於豆包大模型精準識別意圖。在Agent開發方面,火山引擎發佈企業級AI Agent平台AgentKit與TRAE(CN)企業版,已獲NIO、PwC、匯付天下、銳捷、軟通動力、高頓等頭部客戶採用。平台依託企業級GPU叢集,支援10萬檔案、5億行程式碼超長上下文,可靈活配置企業規則、知識庫與Agent,即時追蹤AI生成率與程式碼量,程式碼全鏈路加密傳輸、雲端零儲存。03 成本最佳化計畫釋放普惠紅利火山引擎正式發佈的"AI節省計畫"採用一次性加入機制,普惠覆蓋豆包大模型、豆包視訊及圖像創作模型與第三方開源大模型,全面最佳化使用者呼叫成本。最高節省幅度達47%,支援全預付、零預付等多種付款方式,實現"多用多省"。火山引擎此次還發佈了MaSS on AICC服務。開源證券研報稱,火山引擎此次發佈有望實現性能提升與成本降低,特別是視訊生成模型的進一步升級。研報建議關注字節產業鏈及AI應用投資機會,認為Agent開發工具的升級與Agent生態的擴容將推動AI在企業生產場景中的落地應用。 (硬AI)
從DeepSeek到豆包手機助手:中國AI下一程何去何從?
在中國AI發展史上,2025年註定會是里程碑式的一年。1月27日,DeepSeek憑藉發佈僅一周的開源推理大模型DeepSeek-R1,在蘋果應用程式商店中國區和美國區的免費榜上雙雙獲得第一,震驚世界。儘管隨著千問、豆包等大模型的崛起,DeepSeek在很多排名中不再名列前茅,但其貢獻將永載史冊。12月5日,張亞勤教授在人文清華講壇演講時說,DeepSeek在演算法、技術、系統架構上都有創新,它用1%的算力就可以達到和美國前沿大模型相似的能力。“DeepSeek出來之後,咱們和美國的差距可能就從之前的2~3年縮短到2~3個月,而且在有些應用方面,我們可能做得更好”。中國網際網路從1995年左右起步,先後經歷了PC網際網路、移動網際網路和物聯網時代。張亞勤認為,現在進入了智能體網際網路(Internet of Agents)的新時代。所謂智能體(Agent),就是具備自主智能的系統——你只需要給它設定一個目標,它就能自主規劃任務、不斷迭代,甚至自我試錯,最終達成目標。這非常像人類的行為:有個目標,自己就會去規劃路徑,依靠各種記憶和判斷去實現。未來已來。12月1日,字節跳動豆包團隊發佈了“豆包手機助手技術預覽版”,通過和中興通訊努比亞手機合作,展示了一系列驚豔表現——豆包手機助手根據使用者指令,可以在多款App應用之間自動跳轉,完成查票訂票、商品多平台比價下單、定製出行攻略、批次下載檔案等任務,完全自動化執行。智能體網際網路真的來了?毫無疑問,是的。智能體網際網路的“Aha moment”手機助手本身並非新生事物。2011年蘋果就發佈了siri,使用者可通過語音指令完成資訊查詢、電話撥打、消息傳送、裝置尋找等功能。但這樣的助手只能呼叫單個App應用,比如你要它“打開微信”它就給你打開微信。而當你提出一些跨應用、多步驟的複雜指令,如“對比一下淘寶閃購、美團、京東同款麥辣雞翅的價格,選個最低價,下單到指定地址,然後截圖發給指定聯絡人”,又如“下周我要出差,先去北京再去廣州,幫我訂一下機票和酒店,最後生成一張清單”,等等,它就一籌莫展了。這樣的多步驟複雜任務,恰好是豆包手機助手的用武之地。你只要說一聲,它就會在你手機所有的購物App裡搜尋同款商品,對比價格和規格,自動領券,選擇最低價,最後通知你“接管操作完成支付下單”;當你準備出差,它會按你的吩咐,在公司辦公軟體上向經理提交出差申請,然後訂好機票酒店;當你想給女兒推薦幾個禮物放進購物車時,如果你設定開啟的記憶中已儲存有女兒的年齡、興趣等資訊,它可直接查詢符合女兒年齡、偏好的方案,無須你再逐一交代細節……這些前所未有的新體驗,讓豆包手機助手初出茅廬就成為智能體網際網路的一個“Aha moment”,也為2025年的中國AI發展貢獻了一部“收官之作”。一石激起千層浪然而,和年初DeepSeek發佈時贏得的普遍都是掌聲相比,豆包手機助手發佈後,則是一石激起千層浪。有人盛讚,AI操作手機、AI助手一定會遍地開花,我們的生活也會完全離不開它,將來的人們會記住這歷史性的一天;有人評價,豆包和中興通訊做的這件事,是通過跟系統、跟硬體廠深度綁在一起,讓豆包獲得系統級權限,可以橫跨所有App看通知、讀頁面、點按鈕,從一個App升級成手機系統內常駐的大腦,成為作業系統的一部分而不是普通的第三方軟體,這是AI時代的手機新入口;有人擔心,AI手機助手依賴高等級的系統權限,能在執行使用者指令的操作過程中讀取到螢幕內容——包括銀行卡資訊和聊天記錄,會帶來安全隱患;也有一些國民級應用App、金融機構App迅速截停了豆包手機助手,使用者在手機上無法呼叫,或遭遇異常退出、無法再次登錄。更深層次的討論也開始了——若使用者習慣將操作完全交由AI助手代理,各種App都將被“管道化”,以流量分發為核心的網際網路商業模式將會被顛覆;而對手機廠商來說,將從“硬體製造商”變為“AI服務分發商”,其賣點不再是硬體參數的堆積,而是能否接入最強AI能力,提供最豐富和高效的場景服務。豆包手機助手到底是什麼?其實,它是在豆包App的基礎上,和手機廠商在作業系統層面合作的AI助手軟體。目前還只有一款和中興通訊合作的工程樣機,也只面向開發者和科技愛好者少量發售。在官方視訊的結尾,豆包手機助手特別提示,“儘管演示內容均為真實錄製,但受限於大模型技術的不確定性,相關場景無法保證百分百復現。當前產品實際可用性與團隊預期仍有差距,未來仍將持續迭代最佳化”。可見,它還是剛剛起步。但沒想到,發佈當日,中興通訊A股漲停,在行業和社會迅速引起巨大波瀾。在被一些App截停後,豆包手機助手發佈了《關於微信登錄異常的情況》《關於調整AI操作手機能力的說明》等公告,澄清了所謂“未經授權獲取系統權限”的謠言,指出豆包手機助手在努比亞手機上擁有系統級的INJECT_EVENTS權限,所以其相關產品才能跨屏、跨應用模擬點選事件,完成使用者操作手機的任務需求,它也不會代替使用者進行相關授權和敏感操作。關於使用者隱私,豆包手機助手表示,不會在雲端儲存任何使用者螢幕內容。“當使用者給助手指令,要求操作手機時,助手確實需要讀取螢幕,否則無法完成使用者任務,但螢幕和操作過程都不會在伺服器端留下儲存,且所有的相關內容也都不會進入模型訓練,確保使用者隱私安全。”豆包助手再次強調,此次發佈的是“技術預覽版”,是面向行業、AI技術愛好者的探索產品,提示普通消費者謹慎選擇。豆包助手還表示,計畫在接下來的一段時間,在部分場景對AI操作手機的能力做一些規範化調整,如限制刷分、刷激勵的使用場景,進一步限制金融類應用的使用,限制部分遊戲類使用場景等。顯然,豆包手機助手的社會影響大大超出了團隊預想,因此團隊開始採取一種“退”的姿態。退一步,進行調整,並努力和App們以及手機廠商達成共識,找到合作模式。一場技術上的顛覆式創新,開始步入社會化共識與服務規則的形成期,以及新舊利益如何分配的磨合期。但無論如何,因為豆包手機助手的發佈,中國的網際網路服務掀開了新的一頁,即從App主導到智能體驅動。這一頁既已掀開,就不可能再倒回去。為什麼是豆包?豆包手機助手和中興通訊合作的AI手機,顯示出“大模型+手機廠商”的清晰趨勢。在國內,華為、vivo、小米、OPPO、榮耀等手機廠商都在佈局AI智能體賽道,都有自己的AI助手,都在個性化互動、跨應用執行方面探索。大模型初創公司智譜去年10月也曾官宣推出了端側AI智能體,可以訂外賣、訂票、回覆微信,智譜還與三星在AI手機領域達成戰略合作;在國際上,蘋果去年6月發佈了Apple Intelligence,定位為系統級AI助手,但直到iPhone 17系列仍未完全落地。GoogleGemini也在與三星深度合作,強化其語音助手Bixby。大家都在做AI手機助手,為何唯有豆包一鳴驚人,真正讓使用者眼前一亮?單從技術實現路徑看,豆包助手和別的助手採用的都是圖形使用者介面智能體(GUI Agent)技術。該技術通過多模態大模型,即時解析手機螢幕截圖,識別出按鈕、文字、圖示等UI元素,然後呼叫作業系統提供的服務,模擬人的手指動作。只要人在螢幕上可以手動完成的操作,從理論上說,GUI Agent都能代勞。在過去,使用者必須通過手動方式在不同App間切換,才能完成複雜任務。這是因為,如果使用者想讓AI與App互動,App開發者必須主動開放資料和功能介面,而基於安全、商業利益等考慮,App們並不會開放。GUI Agent的邏輯不是請求App們的許可,而是直接模仿人的點選、滑動、輸入等動作,跨應用完成操作。當然,這裡有一個前提,就是與手機作業系統在系統層面深度整合,獲得系統級權限來呼叫各種App。那麼,是不是有了GUI Agent,再加上擁有系統級權限、避免了APP的“玻璃牆”限制,就能做好AI手機助手呢?也不是。否則,手機廠商已經先發先至了。其實,在手機助手跨應用自動執行任務的背後,涉及到多種技術能力,如通過自然語言精準理解使用者的複雜、多步驟指令,將使用者需求拆解成多個子任務,知道呼叫什麼App去執行什麼任務,以及在自動完成操作後根據結果進行反饋調整、持續改善。並不只是獲得系統級權限去呼叫App那麼簡單。AI手機助手的本質,是基於大模型技術,通過模擬人類點選和圖形處理實現智能互動。其關鍵在於預訓練模型的研發,以及在預訓練、後訓練和業務理解這三個環節上是否有突破,有創新。在中國網際網路公司中,字節跳動是對AI技術投入最大、時間最久的之一。除了眾所周知的推薦技術,在大模型之前,字節跳動也在量子化學、AI蛋白質設計等領域有諸多投入。為了發展大模型業務,字節跳動單獨設定了“豆包股”長期激勵,鼓勵內部創新,鼓勵開展有技術高度的創新,以建立壁壘。雖然字節跳動的大模型業務不是全球最早,但轉型迅速,在基礎設施如萬卡叢集訓練等方面投入巨大,且穩定性很好,為技術實現奠定了基礎。豆包手機助手一出生就與眾不同,極大刷新了使用者體驗,和豆包大模型在視覺理解、推理、GUI(圖形介面)識別等方面均處於國際第一梯隊是分不開的。在中國大模型公司中,豆包對“蒸餾”的限制最嚴格,這也避免了依賴他人的模型導致“屋下架屋”、效果受限等問題。“通過模擬人類點選進行圖形處理”,這個概念早就有人提出,並不新鮮,其他手機廠商和App廠商也都在做,但從豆包手機助手的實測和使用看,字節跳動是國內首個從技術能力上能把這一技術真正做到可用程度的企業。當有些廠商還在為“如何讓助手生成更流暢的文字”努力時,豆包手機助手已經能自主絲滑地完成複雜操作,這就是技術優勢所拉開的代際差距。所以,豆包手機助手的超常表現,歸根結底在於技術領域的硬核創新。這和之前DeepSeek在混合專家模型(MoE)架構和多頭潛在注意力機制(MLA)等方面的自主創新頗為相似,都是先站上技術的高地,接著才有出眾的產品。AI手機助手的下一步儘管豆包手機助手展現出了新互動模式的巨大潛力,但它要真正進入千家萬戶,還有很長路要走。除了自身的產品迭代最佳化,以及讓使用者更加放心(比如爭取在不久的將來,在本地端側模型上實現和雲端同樣的效果),它還需要和行業各方有更充分溝通,以共建更清晰、可預期的規則。就眼前遭遇的被一些App封禁的問題,豆包手機助手需要將心比心,和它們坦誠協商,以解決在技術預覽版手機上的使用限制問題。長期而言,則要努力探索合作與分享的具體機制安排。豆包手機助手已明確“無自研手機計畫”,而是希望通過生態合作模式,嵌入不同品牌的手機機型。這是一種開放的態度,將有利於合作的達成。有專家預測,在智能體網際網路時代,有可能形成“使用者付費+廠商分成”的模式:使用者為智能助手的便捷服務支付少量費用,豆包與合作的App廠商按一定比例分配收益;對於免費的App應用,則可通過流量導流、資料共享等方式實現共贏。在這個過程中,最難跨越的關隘,還是現有App生態的流量與利益格局。同時,手機大廠是否願意合作,以何種方式合作,也存在大量博弈空間。可以設想的是,不管豆包手機助手有多麼強大,未來都不可能只有一個AI手機助手。既然是大勢所趨,必然會引來多個參與者。就像電商App,有淘寶,也有拼多多,有京東,有抖音電商,等等。當然,因為手機助手更像“大腦”,使用者在使用、比較之後,大機率會選擇某一個可信賴的助手,長期使用,越用越習慣,而不太可能像電商App一樣,同時使用幾個。騰訊總裁劉熾平在2025Q3財報電話會上表態,微信最終將推出自研AI智能體,讓使用者在微信生態內即可利用AI完成多項任務。當豆包手機助手點亮了一盞燈,一定會帶動和加速更多盞燈亮起來。這對於廣大使用者一定是好事。就此而言,無論怎樣的超級App,都應該避免簡單基於商業競爭的考量,用“一刀切”的方式否定使用者合理使用AI的權利。因為當它們將來要推出手機助手的時候,也會面臨和今天豆包類似的問題。無論最終模式如何,豆包手機助手的創新都值得鼓勵。App時代的“多應用切換”是使用者的痛點,誰能更好地解決這個痛點,誰就會得到使用者的認同。使用者也將成為這場智能化變革的最大受益者。從生成式AI到智能體AI,從移動網際網路到智能體網際網路,從App林立到AI手機助手統籌,豆包手機助手用一個個具象化的場景,讓使用者感受到大模型等技術帶來的便利。它雖然還沒有正式發佈,卻已讓人們看到,智能體AI將徹底改變我們與手機的互動方式,讓科技真正服務於生活本身。人工智慧時代的新黎明正在降臨。不管還有多少挑戰和難題,新質生產力都將穿越,也必將穿越。 (秦朔朋友圈)
豆包手機逼出一個“死局”,但遊戲才剛剛開始
01怎麼理解豆包手機的“系統級權限”?你不妨把手機想像成一座大樓。平時我們安裝的AI應用,就像訪客,只能在大堂裡活動。但豆包助手不一樣,它拿到了一把萬能鑰匙,可以自由進出所有房間,可以操作房間裡的裝置。比如,你對它說“幫我在招聘軟體上找產品經理的工作,然後投簡歷”。它會自己打開招聘軟體,篩選崗位,然後一個一個投簡歷。有人測試過,10分鐘能投30份簡歷。再比如,你說“幫我點個外賣,要少糖少辣,餐具分開裝”。它會自己打開外賣軟體,選餐廳,選菜品,在備註裡寫上你的要求,然後你下單支付。這就是所謂的“系統級權限”。但問題是,華為、小米、OPPO、vivo、榮耀,那家沒有自己的AI團隊?它們會把系統的核心權限,交給一個外部公司嗎?不太可能。因此,字節跳動要想讓自家的AI具備“系統級權限”,大機率上就只能自己造手機,至少是作為聯合製造方參與手機製造。這回的豆包手機,就是字節和中興合作的。那麼,這條路走得通嗎?我從卓克老師那看到一個觀點,很難。為什麼?首先,技術水平不夠。現在的大語言模型理解不了人需求的多樣性,錯誤率太高。10次任務出3到4次錯,錯誤率大概30%到40%。注意,假如是作為聊天助手,這個錯誤率好像也能忍忍。但是,作為一款負責執行的消費級應用,這個錯誤率幾乎是災難性的。比如,你讓AI幫你點外賣,結果它點錯了餐廳,你還會繼續用嗎?一般來說,消費級產品的可靠性,至少要達到95%以上,使用者才會覺得“可以用”。要達到99%以上,使用者才會覺得“好用”。從“能用”到“好用”,是一道鴻溝。卓克老師認為,這需要下一代全新原理的模型才能解決。其次,很多App廠商都會抵制。你想想,假設你打開電商應用,想買個手機殼。但看到其他感興趣的東西,你也會點進去看看,可能順手加購。但假如用AI助手操作呢?你說“幫我買個手機殼”,AI直接搜尋,直接下單。不看推薦,不看廣告,不看其他商品。你的停留時長,從10分鐘變成10秒。瀏覽頁面從十幾個變成1個。電商平台的廣告收入、推薦轉化、交叉銷售,全都沒了。比如,網上傳言,微信團隊封禁了搭載豆包助手的手機,使用者啟動助手後微信會自動退出登錄。微信官方回應說,沒有做任何特別動作,可能是助手觸發了原有的安全風控措施。但不管是主動封禁還是被動觸發,結果都是,AI助手在微信上用不了。而微信,是中國使用者使用頻率最高的App之一。假如微信不支援,豆包手機助手的價值恐怕就要大打折扣。當然,關於目前的消息,估計你已經看到很多了。因此接下來,咱們換個角度。02從博弈論角度看“系統級AI助手”你看,即使現在的“AI助手”會出現問題,即使現在的手機算力,還不足以支撐一些大模型的本地部署。但是,這些都是技術問題,將來或許可以解決。AI的錯誤率會繼續降低,大模型的本地部署門檻也會降低。因此,我們姑且假設,未來早晚會出現大量搭載“系統級AI助手”的手機。那麼到時候,這些AI手機和之前的各大App之間,會如何共存呢?會出現那些可能性呢?關於這個問題,我們或許可以參考“博弈論”的視角。從短期到長期,行業也許會經歷幾個不同的階段。第一,先說短期。行業也許會進入“囚徒困境”的博弈。假設,有10個購物平台。AI助手來了,要求接入。這時,每個平台也許都會想,“假如我開放了,AI會把使用者直接帶到商品頁面。使用者不看廣告,不瀏覽其他商品。我的流量損失會很大。”所以,抵制更“安全”。假如所有平台都這麼想,結果就是,大家都抵制。這就是囚徒困境的經典場景,每個人都選擇對自己最安全的策略。但這個均衡,非常不穩定。為什麼?你看,假如9個平台抵制,1個平台開放,會發生什麼?那個開放的平台,會獲得AI助手帶來的全部購買需求。比如,你對AI說“幫我買個手機殼”。AI去查詢各個平台,發現9個都不讓它操作,只有1個開放。那麼它會把所有訂單都導向那個開放的平台。那個平台在AI管道裡的市場份額,可能從10%,直接跳到100%。而且,這個優勢會越來越大。因為AI會學習,會記住“那個平台最好用”,下次會優先推薦它。而那9個抵制的平台呢?它們會發現,自己的流量在快速流失。它們會被迫跟進,也開放介面。這就是連鎖反應。所以,“大家都抵制”這個均衡,看起來穩定,其實非常脆弱。只要有一個平台率先開放,整個局面就會被瓦解。當然,也可能出現分化。微信、淘寶之類的大平台有資本抵制,還可能會做自己的AI手機。但不管是那種結果,有一點也許是確定的,命運的齒輪已經開始轉動了,它不會因為當前的某款手機不好用就停下。第二,再說中長期。行業也許會進入一個“演化博弈”的階段。簡單說,就是在一個生態系統中,不同的策略會相互競爭,市場會自然選擇出最適應環境的策略。比如,在AI助手這個新環境下,會不會出現一種全新的“AI原生App”?現在的App,介面是給人看的。精美的圖片、吸引人的視訊、精心設計的互動。這些都是為了吸引“人”的注意力。但AI不需要這些。AI需要的是:結構化的資料、清晰的邏輯、標準化的介面。這樣的苗頭已經出現了。比如,有家公司叫Stripe。它是一個支付服務平台,據說估值大幾百億美元。但它沒有複雜的介面,開發者只需要一行程式碼,就能呼叫它的支付功能。據說,80%的美國消費者都用過Stripe,只是絕大多數人根本不知道。因為它是“藏”在各個網站和App背後的。你在亞馬遜、優步、Shopify上支付,背後可能就是Stripe在處理。這就是一個典型的“給機器用的服務”。它不需要吸引人的注意力,它只需要提供標準化的介面,讓其他系統可以呼叫。再比如,亞馬遜的子公司Alexa,你對著它的AI產品說“幫我買衛生紙”,它就能幫你下單。亞馬遜現在還要求,商家不能只填商品名稱和價格,還要填寫所有屬性:顏色、材料、容量、尺寸、技術規格。而且,這些屬性要用“日常對話語言”來描述,因為使用者可能會問“那個微波爐功率最大”,AI需要能理解並回答。再比如,最近有個概念叫“無頭電商”。什麼叫無頭電商?就是前端和後端完全分離。後端通過API提供所有電商功能,包括商品管理、訂單處理、物流等。前端可以是任何裝置:App、智能手錶、車載系統。所有資料都是高度結構化的,任何裝置都可以通過API呼叫。你看,這些都是“AI原生”的苗頭。它們的共同特點是:不是給人看的,是給機器用的。介面不重要,資料結構才重要。從這個角度看,假如有人專門做一個“給AI用的購物平台”,會怎樣?這個平台可能沒有漂亮的介面,甚至沒有介面。所有商品資訊都是結構化的,AI可以直接讀取,可以秒級完成交易。將來傳統App和AI原生App,最終的結果,也許不是“一方消滅另一方”,而是“共存”。就像線上購物和線下購物一樣。也許有些場景適合AI原生App,比如買菜、點外賣,也有些場景適合傳統App,比如買衣服、買家具,對這類商品來說,“逛”是個必備環節,使用者是不想讓AI代勞的。未來假如AI手機普及,會有那些人參與呢?可能是手機廠商,比如蘋果、華為、小米。它們控制作業系統,可以內建AI助手。也有可能是做AI的公司,比如字節、百度、OpenAI。它們有AI能力,關鍵是能不能說服手機廠商預裝自己的AI助手。還有可能是超級App,比如微信。微信有最多的使用者和最高的使用頻次。假如微信內建AI助手,使用者可能根本不需要系統級的AI助手。就像微信小程序,創造了一個新的App生態。這背後的可能性還有很多,我們就不展開了。最後也強調一句,今天的很多內容,都只是基於現有資訊,借助“博弈論”這個工具所做的推演。未來的事誰都不敢百分百確定。但是不管未來如何,我們或許都可以說,命運的齒輪已經開始轉動了。它會帶來很多摩擦,也會催生更多的機會。 (羅輯思維)