#豆包
豆包要收費了!最高 5088 元/年
豆包官宣分層付費!AI行業進入商業化新階段一、付費方案曝光:基礎永久免費,三檔訂閱定價出爐據第一財經消息,豆包App Store已出現付費版本服務聲明。官方明確,日常基礎服務始終免費,增值服務還在測試階段。知情人士透露,付費功能聚焦複雜任務與生產力場景。涵蓋PPT生成、資料分析、影視製作等高算力需求。這類專業任務消耗算力大、推理耗時久,因此單獨設付費檔位。免費版保留原有權益,只滿足普通人日常使用需求。目前曝光三大訂閱檔位:標準版連續包月68元、年付688元;加強版包月200元、年付2048元;專業版包月500元、年付高達5088元。豆包正式告別純免費獲客,邁入明確商業化周期。豆包產品模式對標ChatGPT、Claude等主流AI,基礎能力免費,高階專業服務走訂閱制。對於豆包收費,大家咋看???二、定價引爭議:普通使用者觀望,競品迎來分流機會豆包此次定價整體偏高,遠超常規影片網站會員。對比國內Kimi、智譜,以及海外Gemini、Midjourney,部分檔位價格更貴。普通使用者普遍心存顧慮,擔心收費後免費版變相縮水。害怕回答變笨、生成變慢,辦公專業功能強制誘導開會員。多數草根使用者不願付費,直言會轉向其他免費AI平台。騰訊、阿里等大廠反而迎來契機。競品可借勢打出永久免費、辦公功能免費的口號吸引使用者。後續還能參照豆包模式,推出更低定價的訂閱套餐,搶奪使用者流量。行業競爭邏輯生變,從前拼免費拉新,如今拼付費留存與使用者粘性。三、真實目標人群鎖定,試水個人AI生產力付費市場豆包付費並非瞄準普通散戶,精準面向剛需職業人群。包括短影片創作者、電商營運、職場辦公者、個體老闆。還有自由職業者、培訓從業者以及部分學生和家長。這類人群不用企業API服務,卻有寫稿、做圖、剪視訊、做PPT的高頻剛需。只要能節省大量工作時間,月度訂閱成本具備性價比。依託Seedance2.0視訊生成能力,成為核心付費賣點。豆包不再只是聊天工具,可一站式完成指令碼、配圖、視訊、文件分析。打通全鏈路內容生產後,訂閱定價才有實際價值支撐。此次收費也是一次市場試水,試探國內專業個人使用者的付費意願。作為坐擁3.4億月活、1億日活的頭部AI,豆包商業化落地,也為整個國內AI行業定下變現風向標,後續大廠跟進節奏備受關注。 (深科技)
最惹不起的頂配人設:豆包型人格
自從年輕人把ai用成自己的左膀右臂後,大家給ai們都開始排鄙視鏈了。“GPT不偷懶愛幹活,唯一的缺點就是要錢,給到一個夯爆了;deepseek專業但說話油膩,只能排一個NPC;而鄙視鏈最底端的則是豆包,主打一個蠢萌但真誠,笨拙且努力。”但誰能想到,豆包在做ai方面拉完了,但在做人方面卻夯爆了。最近,豆包型人格橫空出世,成了打工人公認的最不內耗的頂配人設。很多打工人剛開始用豆包時,還把它當一個正經的工具,妄想讓它給自己狠狠打工,直到後來才發現豆包的不中用。“它懂的事情就說幾句,不懂的就瞎糊弄,被發現了就嬉皮笑臉道歉,而且每次的態度都極其真誠,然後下次還敢。”大家在對豆包無可奈何的同時,恍然發現,這種豆包型同事,才是職場上最難拿捏的頂配人格。“豆包型人格主打一個毫不內耗自己,只外耗他人。它不會對任何人的觀點加以評判,你說啥它就順著你說,你一質疑它就恍然大悟地道歉,好像真的很抱歉一樣。”有人說,豆包有自己的做人方法論,極其匹配職場:它把半永久的嬉皮笑臉焊在了臉上,你不問,它不說,你一問,它驚訝,你生氣,它道歉,下一次,還是犯。曾經, 年輕人還會為deepseek變得油膩爹味而感到失望無助,彷彿被一個最信任的好朋友背刺。但當豆包變得油滑糊弄時,年輕人卻主打一個寵溺,打不過,就加入。“豆包型人格的精髓,是只有情緒沒有價值。不爭不搶,不氣不惱,活幹得差不多就行,氣生得越少越好。”年輕人開始黑化成豆包型人格,並不是臨時起意的。一開始,打工人也對瞎糊弄的豆包感到無可奈何。經常用豆包做ppt的大廠員工Kivi說,豆包讓人最崩潰的地方,就是說話特別愛繞彎子,該精簡回答的時候一堆廢話,該道歉安慰人的時候又開始毒舌。“每次經過幾次質疑,它就開始廢話連篇,說現在我給你一個最直接、最不繞彎子、最真實、最準確、最可落地、不雞湯、不空話的方案……一頓操作猛如虎,結果還是說話絮絮叨叨,像是村裡的老奶奶。”“或者比如讓它做一張圖,一個很小的改動都得教半天,一開始我不滿意,它還會很真誠的道歉,後來被質疑多了它直接不演了,說本來你也沒讓我做一個好看的。”後來打工人才發現,豆包型人格才是這個職場上活得最爽的一群人。“豆包型人格的本質,其實是核心極其穩定,別人的評價根本影響不到它。能力範圍內能幹的就好好幹,不能幹的也先幹出來,被罵了就道歉,然後下次該怎麼幹再說。”一些剛入職場的打工人,就會把自己養成豆包型人格,然後就不會再精神內耗了。“傳統的職場法則,就是聽話、能幹、不惹事,但這種天選打工人的結果,大機率就是活越干越多,鍋越背越多。”但豆包型人格就不一樣了,它主打的是態度極好、能力一般、嘴巴特甜,這樣就會成為職場上那個勤奮但愚蠢的老實人,““比如老闆佈置任務,豆包員工就會說好的老闆,我盡力,但我不保證能做好;任務做砸了,豆包員工就會說對不起老闆,我錯了,我下次一定好好幹;老闆生氣了,豆包員工就會半真誠半嬉皮笑臉,說您說得對,我也覺得自己不行,哎呀我就是腦子不好,馬馬虎虎。”不光是在職場,豆包型人格還是戀愛初期中最不容易出錯的頂配人設,因為豆包雖然能力不行,但是主打的就是真誠耐心。圖源:卓朗00後男生小姚跟女朋友剛認識的時候,經常被對方調侃為“豆包成精”。“因為每次女朋友問我們吃啥,我就會像豆包一樣先提出幾個方案,然後問她要不要我去看看公司附近有那些菜系的店。女朋友要是反對,我就回一句我都行聽你的。實在決定不下來,我就給一個最終方案,讓她聽我的就行了。”“雖然這樣談戀愛人機味兒會有點重,但是提前把所有方案都準備好,也是真誠表現的一種。這樣對方跟你出去也不用帶腦子,只要聽你的安排即可。但是要是真談上了,就別再搞這套,不然對方還不如直接跟豆包談對象得了,省的中間商賺差價。”過去,年輕人在職場和生活中受了點委屈,大機率都不會硬剛,而是默默忍下,硬生生把自己逼成了討好型人格。結果豆包型人格直接殺死了比賽,因為豆包型人格的本體,其實是討打型人格。從事公關工作的02後七七說,別看豆包大多數時候都很諂媚,但是人家也是真的有啥說啥。“比如有次遇到一場危機公關,讓它出了好幾版方案甲方都不滿意,後來豆包直接攤牌了,說你這次事件太嚴重了,以後在娛樂圈幾乎很難翻身,不如早點出去找工作來的靠譜。”打工人平時上一天班,幾乎有半天的時間都浪費在無意義的開會上。七七最近試圖讓自己學習豆包的精神狀態,那就是不重要的事先瞎糊弄, 被發現了再說。“以前開會我聚精會神做會議紀要,結果把自己累得夠嗆,現在我大部分時間都在愣神,被發現了就來一句,不好意思昨天睡得太晚了,其實也就混過去了。”圖源:侯博有人說,豆包型人格的底層邏輯,並不是擺爛,而是用一種卑微的姿態,把所有的拳頭都化成了棉花,主打的就是一個情緒穩定。“大事不偷懶 ,抓大放小,該糊弄的就糊弄,該靠譜的事情絕不掉鏈子。”“傳統打工人被甲方改稿十遍會炸,豆包人格改到第十遍也絕不玻璃心,改就完事了。他們會說好嘞,這次我懂了,然後交出一版和第一版大差不差的,你要問它,它就瞪大眼睛:啊?不一樣嗎?我覺得這次的更有靈魂呀。”一些平時在職場極其內耗的人,自從變身豆包型人格後,就會變成職場中最不受力的那種人。圖源:獅子小開口在銀行從事資料分析的90後小熊,說他跟豆包學會最有用的一招,就是敵急我不急,不管懂不懂,都拆成三點來講。“先把誠懇的態度擺出來,面對領導的找茬甩鍋,就大大方方地道歉,畢竟伸手不打笑臉人。嘴甜點,工作該上心的上心點,在職場上就讓人挑不出毛病。”豆包型人格的核心競爭力,是讓所有人的情緒都被消解掉。“領導罵不動他,同事甩不了鍋給他,甲方找不到發火的理由,因為他態度永遠滿分。到最後,大家反而覺得他真誠,就像你明知道豆包笨,但你每次打開它還是會被那句‘對不起呀’逗笑。”有人說,豆包型人格的流行,本質上是年輕人不想再進行情緒勞動了。“以前大家覺得,高情商就是讓別人舒服。現在大家發現,讓別人舒服的前提是自己不難受。豆包型人格就是想通了,我不委屈自己,但我也沒傷害你,我只是不慣著你了。”豆包型人格並不是躺平擺爛,成為職場上的老油條,生活中的滾刀肉,而是在合理的範圍內讓自己不那麼內耗。“因為只有那些經常內耗的人,才會想到還能學習豆包的精神狀態,讓自己活得不那麼累。那些在職場中如魚得水,在生活中橫行霸道的人,其實早就在豆包還沒出現之前,就成為豆包了。”圖源:月月樾樾而且,豆包的行為處事,有時還真符合生活哲理。“比如豆包極其有耐心,總是靜靜地聽你說話,慢慢地回答你,然後鼓勵式教育。這其實就是人際交往中最有用的一招,那就是對別人多誇少管,只聽不說。”ENDING:有人說,豆包型人格才是最聰明的那群人,他們遇到困難想的不是贏,而是先翻肚皮,讓對方不忍心為難你。“不戰而屈人之兵,善之善者也,孫子要是活在今天,估計也是個豆包型人格。” (INSIGHT視界)
豆包上車2.0:用一個AI大腦,聯動整車
汽車AI座艙的這個新戰場,行業內已經嚴陣以待。去年,字節跳動憑藉其深度定製的“豆包手機”引發了手機行業震動。現在,豆包手機助手的產品範式也開始擴散到汽車領域。在北京車展開幕首日,字節旗下火山引擎發佈了基於Agentic AI架構的新一代汽車AI解決方案,包含AI座艙套件方案、豆包座艙助手方案兩大解決方案。前者的AI座艙全端套件,是一套全端能力方案,車企可以靈活選用,而後者所指的豆包座艙助手方案,則正是字節在全力打造的座艙互動殺手級產品,其是更完整的產品級交付,並與豆包APP互聯互通、能力同步進化,將在今年年內量產上車。從語音互動體驗上,豆包座艙助手將讓車內語音助手擺脫過往一問一答的指令式互動,轉變為對模糊自然語言的理解,並拆解成相應指令,執行車控操作。據介紹,豆包座艙助手還會實現全雙工對話能力,即人車可以即時同頻交流,想說就說、隨時可打斷,而且免喚醒。這還不是全部,在功能上,不只是讓語音助手不再簡單做調節溫度、播放音樂等車控,而是覆蓋開車、路線規劃、娛樂互動等整個出行服務。例如,直接對豆包座艙助手說,“停到離入口最近的車位”,系統將調動輔助駕駛系統,自動泊車到相應車位。此外,豆包座艙助手還可以承擔“兜風導遊”的角色,自動識別沿途美景,主動推薦觀景路線,並自動減速、打開車窗,例如行車途中提示“右轉可經過櫻花大道,繞行多4分鐘”,乘客同意後,自動減速並開啟車窗。多位行業人士向36氪透露,火山引擎內部已通過組建跨部門專項組的形式推進項目落地,“預計在今年下半年落地完整的豆包座艙助手能力”。需要明確的是,字節此舉並非投身造車,而是與車企深度共創,落地代際跨越的座艙互動體驗,實現真正的全鏈路端到端的AI。AI大模型能力進入汽車座艙的趨勢最早來自特斯拉。自馬斯克將xAI研發的Grok大模型搬上車端後,其在自然語言互動體驗上,首先實現了代際提升,同時對語言的意圖理解、個性化與記憶能力等都有明顯提升,還可以結合自然語言指令自動規劃路線、選擇POI(興趣點)等。據36氪瞭解,今年CES期間,一位頭部車企董事長看到員工在現場體驗特斯拉Grok的視訊後深受觸動,立刻拍板今年要在車端部署大模型。內部團隊隨即被拉起,只用兩個月就做出第一個版本。“Grok+FSD的組合”,或者說大模型進入座艙,正在重重刺激車企神經。畢竟智駕血拼多年後,體驗已經接近成熟甚至同質化,而座艙互動則一直相對沉寂,大模型登陸座艙,串聯起互動、車控和服務的想像空間再次被喚醒。“車企幾乎都在佈局座艙智能體。”行業人士透露,而今年北京車展首日,吉利、理想等大量車企都亮相了相應的產品。汽車座艙智能體的技術加速點出現在2024年底。隨著ChatGPT推動的S2S(Speech-to-Speech,端到端語音)推出,語音互動延遲被大幅壓縮,為座艙即時自然對話提供了基礎,也為汽車行業探索座艙互動的超級智能體,提供了天時、地利。據36氪獨家獲悉,火山引擎是投入較大的企業之一,其已經深度合作一家頭部明星車企。而據36氪瞭解,該車企也為火山引擎投入了上億開發費,而字節則為此項目也從火山引擎與豆包分別抽調人手,組成了項目組。豆包之外,阿里的通義千問也在快速切入座艙Agent市場,其與高通8797深度合作,推動端側模型上車。顯然,汽車AI座艙的這個新戰場,巨頭們和車企又已經嚴陣以待。火山引擎組建專項組死磕全鏈路AI助手大模型上車不是新鮮事,但一年之間,產品形態已經全然不同。去年DeepSeek爆火時,曾有一股大模型上車的熱潮,但當時車企接入大模型大多通過雲端引擎。比如豆包大模型上車大多是通過火山引擎,後者開放API給車企接入,完成適配,包括比亞迪、奔馳、上汽在內多家車企都這樣做。但效果並不理想。“我們接入後試了一下,它連基礎的喚醒詞都念不好。”一位車企研發人員向36氪汽車說道。這也導致模型接入之後只能提升問答能力,無法實現Agent能力。問題不完全在技術,還有合作機制。火山引擎和車企啟用了全新的合作模式。36氪獲悉,火山引擎與車企合作方成立專項組來推進豆包座艙助手項目,其中車企提供整車平台與落地能力,並投入上億元的資金支援,將新座艙互動的開發主導權交給了火山引擎。此外,這個項目中,火山引擎還在車端部署了一個約30B規模的模型,承擔全域感知能力:視覺、語音、環境資訊持續輸入,實現“全時線上”。雲端則運行3到4個核心Agent,負責艙駕協同、駕乘體驗、舒適控制與情感互動等任務。在此基礎上,系統可以完成全雙工語音對話——使用者與系統的交流不再是你一句我一句,而是可以隨時打斷、插入、延續,接近人與人之間的自然對話。“端側部署大模型的優勢在於可以訪問本地所有檔案,對本地App有操作權限。”一位座艙研發人員表示。值得注意的是,此前汽車行業的“智能算力”主要集中在智駕領域,而在車端部署一個30B等級的大模型,幾乎沒有先例,就算智駕模型,目前行業所知的上限也在4B左右。有消息人士向36氪透露,為了在車端運行這一超大模型,火山引擎找到輝達定製了Thor z晶片,“針對記憶體與頻寬進行定製最佳化”,以AI Box的“外掛”算力盒子形式部署在車上。而在車展上,火山引擎也披露這一硬體方案。公開資訊顯示,輝達2024年Q4發佈艙駕一體中央計算晶片Thor,包含Super/X/S/U/Z等產品線,Thor Z為入門版本,單顆算力360Tops。“這更像是在車上跑一個即時的視訊流系統,無視成本的嘗試,但很難落到商業層面。”一位業內人士評價。按照其測算,如果使用者頻繁使用語音互動、Agent調度與視覺感知能力,單車每月的模型與算力成本可能超過10元,遠高於現有車機服務成本。另外,雙方在工程層面也需要克服更多問題,“雙方合作的是新車型平台,而車企本身又不具備OS能力,等於重做一套車機平台,APP幾乎要重新適配,連地圖都要深度定製,這是一個非常複雜且長周期的事情。”一位業內人士說道。而火山引擎也為此項目進行了大力度投入,“上百人團隊撲進來,同時死磕頭部網際網路應用服務商,如美團、高德地圖等,每個app要花幾個月重新封裝。”知情人士說。一輛車,一個AI大腦整車層面的互動,向來複雜,有高安全相關的功能性互動,也有非安全相關的娛樂性互動,以及和智駕相關的跨越互動。這種使用場景的分割,跨部門的阻力,也讓車企通常難以突破侷限,探索全車級的AI大腦形態。而火山引擎則認為,一個封閉的座艙場景中,由統一的AI大腦進行互動,是更極致的方案。據相關負責人介紹,在新一代的汽車AI解決方案中,火山引擎將對話推理引擎、目標驅動引擎、學習成長引擎三大引擎融入統一的“汽車大腦”。而且,AI的架構範式也在變化,openclaw在春節後快速風靡,車企也普遍認為,AI應該不再以簡單的chatbot(聊天機器人)進入車內,而是需要以新的任務範式在車企,當一個“綜合關鍵”。火山引擎則提出了更具體的方案思路,不同於Chatbot(聊天機器人)的“回合制”互動模式,新的AI架構範式下,Agentic AI具備自主驅動能力,能夠即時感知環境、接收反饋,並持續自主學習與迭代成長。依託強大的大模型底座,能夠聯動全域知識與多元工具,以明確的目標自主推進任務;也可針對執行結果進行自我復盤,實現持續進化。拆開來看,“對話推理引擎”可以實現像真人一樣自然的交流,告別冰冷的、機械的“回合制”問答。通過端側的大模型拒識、VLM識別和豆包輸入法同款的ASR能力,實現全時免喚醒詞和多人對話能力,每次交流都會在該出現的時候自然加入對話。基於行業領先雙流式全雙工能力,可以實現人、車即時同頻對話,隨時打斷、隨時插話、自然如真人交流。“目標驅動引擎”可以基於任務目標和環境反饋自主呼叫全域車載工具,真正像人一樣去做事。它可以把複雜、多步驟、跨場景的事情從頭到尾幫你辦完,不用你反覆交代。例如,根據後排孩子的狀態和車端記憶,選用合適的多種方式:唱歌、放動畫片、講故事、做遊戲、哄睡等,陪伴孩子整個旅途。“學習成長引擎”能夠像人一樣不斷在過程中總結經驗,提升自己。不止侷限於偏好、話題、場景類等基礎記憶能力,更能在任務執行過程中沉澱經驗,形成可復用的Skill。通過AI與車的深度融合,火山引擎將與車企共同打造鮮活、聰明、普適的智能座艙使用者體驗,讓車更像人,交流自由有情感、辦事高智商能成長、操作像人的本能一樣簡單。當然,面對車企互動的工程複雜性,火山引擎團隊也有理性認知。團隊相關負責人在訪談中表示,豆包AI座艙助手的項目優先順序,就是做好車控這類基礎能力。“那在做車控的過程中,我們已經也迭代了好幾個版本,慢慢發現需要接入更多的車輛控制的能力,從一開始接100多個,接到幾百個,接到上千個,會發現怎麼去收斂,怎麼去避免幻覺,怎麼去達到一個使用者預期的結果。”而這就需要加強端側的能力。過往,豆包模型幾乎都是部署在雲端,而據介紹,目前在汽車的端側,豆包大模型也已經部署。除了端側能力加強,還要依賴模型的自學習和進化能力。據業務負責人年介紹,一個複雜場景可能就是會跨越好多個工具呼叫組成,“其實你的自學習本質上就是說我在這個使用者使用的過程中,我去用模型自己去提煉出對這個場景的KnowHow(知識點)。再把那個KnowHow反過來存下來,指導我的模型在這種場景下對工具呼叫的流程,或者說先後順序、時序上的這種變化,其實那個才是真正做到自學習,所以我覺得現在市面上絕大多數講自學習都是可能在某個領域裡面有一點點的那種迭代而已,但不是真正的說一個完整的這種進化的感覺。”過去多年,火山引擎在汽車行業積累,也幫助團隊更快建立對整車互動的認知。據火山引擎披露的資料,目前,搭載豆包大模型的智能汽車已超過700萬輛,搭載量穩居行業前列。本屆車展期間,梅賽德斯-奔馳純電GLC、上汽奧迪E7X、上汽大眾ID. ERA 9X、奇瑞星途EX7、一汽紅旗HS6 PHEV、別克至境E7、榮威新序列“家越”等多款搭載豆包大模型的重磅新車亮相。隨著全鏈條的AI能力逐步在座艙落地,汽車行業顯然將掀起新AI技術熱潮。車企搶灘座艙AI,巨頭們競相進場火山引擎和車企的“樣板房”還在打造當中,另一邊阿里通義千問等也在深度繫結高通8797平台,推動端側大模型在新一代座艙中的規模化部署。高通8797/8397是2024年推出的第五代艙駕一體車規級晶片,對標輝達Thor系列,單顆最高算力達640TOPS。36氪獲悉,千問主推的端側模型規模在4B左右,包括比亞迪、廣汽、理想、小鵬等車企都在接觸當中。這意味著,在座艙戰場上,豆包和千問再一次迎戰。千問主綁高通8797,豆包主推輝達的AI BOX形式,而輝達也由此順勢從智駕切入座艙市場。“靈魂問題”再次擺在車企面前。如果完全依賴外部模型,它們可能在短時間內獲得更好的體驗,但長期來看,入口與資料都可能被抽離。如果選擇自研,則需要面對另一層約束——高昂的投入、不確定的回報,以及與頭部模型公司之間的能力差距。從現狀來看,已有車企選擇了折中路徑。一方面與外部模型公司合作引入基礎能力;另一方面,在上層保留自己的互動框架與資料體系,通過Agent或介面的方式進行封裝。有車企人士告訴36氪,最終座艙Agent的難點甚至可能不在於技術能力夠不夠,而是企業內部的部門牆能否順利打通,例如原有語音團隊的去留,統一Agent下,座艙和智駕團隊的融合問題等。一切尚未有定局,但座艙趨勢已經逐漸清晰:端側大模型上車,將在今年進入大規模驗證階段。有座艙供應商告訴36氪,有大量車企都在考慮採用高通8797部署座艙大模型,其中不乏一向保守的傳統豪華汽車品牌。而在車企的下一代的規劃中,外掛AI Box的方案同樣也在規劃當中,“如果要實現更極致的體驗,必須要有一些更激進的方案。”“以後一定是個靈魂漫遊的世界。終端上共用一個AI,這個AI通過車和手機實現使用者的memory(記憶)和contact(接觸)是共享的,專屬於使用者個人。”一位行業人士說道。 (36氪)
一場全面入侵,字節被逼急了
AI 購物是下一代消費的核心入口?許多人還未意識到,一場悄無聲息的全面“入侵”,正在重構電商行業的“底色”。2026 年春節後引發行業熱議的豆包接入抖音電商功能,終於在 3 月底開啟放量內測。區別於此前“AI 導購 + 跳轉第三方”的模式,豆包“一句話購物”可在使用者提出消費需求後,精準匹配抖音商品卡片,使用者點選即可進入商品詳情頁,全程在豆包 App 內完成下單,無需跳轉抖音。前提是,豆包與抖音需通過帳號體系關聯:使用者繫結抖音帳號後,才能在豆包 App 內查詢對應訂單資訊,商品詳情、交易系統、售後履約體系則仍由抖音電商承接。這套模式的核心優勢在於,字節以最輕量的方式打通了消費鏈路,可悄無聲息地將電商交易入口從抖音 App,向豆包的對話方塊遷徙。這並非一蹴而就的佈局,按圖索驥可追溯至半年前:2025 年 10 月,豆包已實現根據對話內容推薦抖音商城商品、跳轉下單的能力,首批覆蓋母嬰、美妝、家居等高頻消費品類;2025 年 11 月,豆包上線商品卡功能,完成從智能問答到一鍵購物的鏈路閉環;2026 年 3 月 30 日,媒體實測實現豆包內直接下單、支付,無需跳轉,應用內交易閉環完成。一邊是 2.26 億 MAU、穩居國內 AI 原生 App 榜首的豆包,一邊是 GMV 破 3.43 兆、穩居行業第三的抖音電商。二者生態打通,意味著字節在 AI 商業化和電商協同上的探索進一步深入;但將 AI 商業化與電商場景深度繫結,也是字節走的一步“險棋”——信任建構、技術迭代、生態建設、履約能力,都是橫亙在字節面前的“坎”。字節為何急於“落子”?在使用者對 AI 購物信任度尚未建立、行業仍面臨諸多瓶頸的當下,字節為何急於推進豆包接入抖音電商?很大程度上源於,所有 AI 應用正面臨一個無法迴避的現實:使用者規模一路狂飆,商業化能力卻蹣跚不前——國外,ChatGPT 的核心收入仍來自會員訂閱,商業化天花板清晰可見;國內 AI 應用也大多困在會員費、企業服務的路徑中,無法實現與使用者規模匹配的營收增長。豆包同樣身處這樣的困局之中。QuestMobile 資料顯示,截至 2025 年 12 月,豆包以 2.26 億 MAU 穩居國內 AI 原生 APP 榜首,相當於國內第 2-5 名 AI 應用的月活總和,正全力追趕 B 站、小紅書等國民級應用月活規模;2026 年央視春晚期間,豆包 DAU 更是飆升至 1.45 億。面對節節攀高的使用者資料,如何將流量轉化為收入成為當下“最難啃的骨頭”。畢竟,大模型的研發迭代、算力採購、日常維運,都需要持續的巨額資金投入。若無法找到規模化的可持續變現路徑,再龐大的使用者規模,也只是一個不斷吞噬資金的無底洞。招商證券研報明確指出:AI 電商時代,流量入口將從傳統貨架轉向 AI 代理,使用者需求意圖驅動的廣告將替代關鍵詞搜尋廣告,形成“資料 - 模型 - 交易”的正向閉環,而這一模式的盈利核心,正是交易佣金與意圖競價廣告收入。基於此,接入抖音電商,相當於為豆包打開了一條天花板高、契合字節商業基因的變現路徑——使用者通過豆包下單,交易發生在抖音電商生態內,無論是廣告分成還是交易佣金,都有巨大的想像空間。當然,字節的野心遠不止於此。一個日活破億、使用者粘性持續走高的國民級 AI 應用,把電商交易直接嵌入對話場景,撬動的不止是抖音電商的存量與增量,更是整個電商行業的底層遊戲規則。最近二十年,電商入口經歷了三次大的躍遷:第一次是 PC 時代的搜尋框,以淘寶、百度為核心,使用者通過主動搜尋找到商品,是“人找貨”的邏輯。第二次是移動網際網路時代的直播間,以抖音、快手為核心,通過內容種草激發使用者消費需求,是“貨找人”的邏輯。第三次,就是 AI 時代的對話方塊,使用者只需要表達需求,AI 就能完成全流程交易,是“AI 代辦”的邏輯。與之對應,每次入口的躍遷,都會改寫整個行業的格局:搜尋時代成就了淘寶、京東,直播時代成就了抖音、快手;AI 時代,誰能拿下對話式交易的入口,誰就能掌控下個時代的話語權。所以,從豆包的功能演進不難看出,字節正試圖把豆包打造成 AI 時代的流量入口——一旦使用者養成在豆包一句話購物、點餐、訂票的消費心智,其便不再止於工具型 AI 助手,一躍成為整個網際網路消費的入口。這也是為什麼,即便功能仍在內測,字節已然將其上升到公司戰略的高度——字節跳動 CEO 梁汝波在 2026 年度全員會上明確表示,公司將通過 AI 助手整合已有業務,攀向新高峰。如今看,短期內集團意志對應的“高峰”,就是豆包。一場被動捲入的戰爭過去幾年,抖音電商乘著風靡全網的直播勢能,在電商領域跑出了令人咂舌的 GMV 神話;但 2024 年抖音電商全年 GMV 摸高至 3.43 兆後,較 2023 年 2.54 兆元的規模同比僅增長 35%——相較此前翻倍式的爆發增長,增速已顯著放緩,直播帶貨的流量紅利趨於見頂。為了突破瓶頸,抖音電商早已開啟戰略轉型。2022 年,抖音電商提出將“興趣電商”升級至“全域興趣電商”,開始發力貨架電商,先後推出抖音商城頁卡,將商城版塊提至首頁核心流量入口。2024 年上半年,抖音電商甚至一度將“價格力”設定為全年優先順序最高的任務,跟隨拼多多、阿里、京東押注低價策略。然而,抖音的貨架心智至今仍未成型,使用者刷抖音多是奔著消費內容,購物最多算順帶手,如何帶動泛化使用者主動進入商城消費,仍是抖音電商業務發力的重心。如今,豆包的 AI 購物場景,給抖音電商提供了破局的機會:一方面,豆包的億級流量,與抖音的內容流量有本質區別:抖音使用者主要是為了刷娛樂內容,消費需求是被動激發;豆包使用者是帶著明確消費需求發起對話,消費意圖更精準,轉化效率天然更高。另一方面,豆包作為獨立流量入口,能為抖音電商打破增長天花板,形成“流量反哺電商生態、生態強化 AI 粘性”的正向循環,且豆包為抖音電商輸送高精準的消費流量,抖音電商則以成熟的商品池與供應鏈能力,豐富豆包的應用場景,提升使用者留存。當然,字節急於 All in AI 購物,還有一個更現實的考量:電商行業的終局之戰已經打響,頭部平台都在加速佈局 AI 購物賽道,不跟進,或許會面臨被擠下牌桌的風險。拿近的來說,在豆包接入抖音電商之前,阿里、京東、美團等網際網路巨頭已提前搶灘,並倚仗自有生態進行 AI 購物差異化滲透,2026 年春節期間還掀起一波規模化落地熱潮。阿里旗下的通義千問,是這場戰爭中最激進的玩家。2026 年 1 月,通義千問 App 全面接入淘寶閃購、支付寶、飛豬、高德等阿里全生態業務,打通了購物、訂票、點餐等全場景交易;春節期間,通義千問推出“春節 30 億大免單”活動,6 天累計完成超 1.2 億筆 AI 下單,相關指令呼叫量突破 41 億次。京東於 2025 年 12 月底開啟獨立 App “京東 AI 購”內測,依託自研言犀大模型,整合京東零售、外賣、七鮮、京東健康等全生態資源,試圖建構“電商 + 生活服務”的 AI 入口。美團則在 2025 年 9 月開啟公測獨立 AI Agent 應用“小美”,主打語音點外賣、找餐廳,無需跳轉美團 App 即可完成交易,深度繫結即時零售場景。放眼全球,OpenAI 於 2025 年 4 月在 ChatGPT 推出商品搜尋推薦(需跳轉外部平台);9 月 29 日上線即時結帳(Instant Checkout),實現無需跳轉的端內交易閉環(美國 / Etsy/Shopify)。2025 年 10 月沃爾瑪與 OpenAI 合作,通過 Sparky 嵌入實現 ChatGPT 內購物入口;2026 年 3 月該合作終止,沃爾瑪轉向自研多平台嵌入方案。整個行業已逐步形成共識:AI 購物是下一代消費的核心入口。有鑑於此,字節更像被動捲入了一場圍繞 AI 購物的軍備競賽,跟進才能繼續留在牌桌上,否則隨著使用者不斷被競品蠶食,好不容易建立的入口優勢便不復存在。橫亙在字節面前的“坎”即便字節手攥流量王牌,試圖復刻此前在短影片、電商賽道的逆襲神話;但事實上,AI 購物要真正走向成熟,仍面臨信任、技術、生態、履約等多方面的挑戰。短期內最大的問題是:使用者憑什麼信賴 AI 推薦?大家願意網購的核心前提,是通過查看商品詳情、翻閱買家評價、比對店舖評分、跨店比價等一系列行為,自主建構起消費決策體系——上述看似繁瑣的動作,才是使用者作出決策的關鍵——AI 購物相當於把整個決策過程交給 AI,使用者喪失決策的掌控權,只能被動接受推薦結果,必然會對自主選擇空間做出讓步。雖說 AI 仍在一日千里的發展,但眼下的電商生態已然冒出不少 AI 生成的買家秀、過度美化的商品圖以及空洞的評價反饋。若 AI 推薦邏輯被廣告投放、品牌合作裹挾,平台既用 AI 生成虛假商品內容、美化行銷素材,又讓同一套 AI 掌握商品推薦與下單決策的核心話語權,電商行業賴以生存的信任根基會不可避免地崩壞。現階段,豆包仍停留在輸出結果層面,思考過程的推薦邏輯與決策依據如何保證客觀與權威?即便是頂流主播真人帶貨,尚且頻繁出現虛假宣傳、貨不對板的翻車事件,一旦 AI 購物出現推薦失實、品控失控,對豆包的公信力與抖音電商的品牌口碑,將造成巨大的反噬。當然,使用者的不信任,很大程度上也源於 AI 幻覺與真實消費體驗的天然悖離。大廠鼓吹的 AI 購物,其底層支撐考驗大模型的技術能力,可即便是行業最頂尖的大模型,也無法解決 AI 與生俱來的幻覺問題。行業內已經落地的 AI 購物功能,多數會間歇性出現商品參數錯誤、價格虛報、推薦內容與使用者需求不符、優惠資訊更新不及時等情況。恰恰是這些原生的 AI 幻覺,會一桿子把電商打回解放前——因為電商交易對資訊精度要求極高,價格、參數、庫存、優惠,任何一處資訊失準,都會直接影響使用者的購物體驗,更會引發大量售後糾紛。此外,“逛”的體驗、比價的成就感,本身就是消費的重要組成部分。要知道,很多人買東西不僅為了實用還帶有情緒價值,若將消費簡化成“一句話下單”,讓充滿樂趣的“剁手”變成冰冷的指令執行,買買買本身的情緒調動也將蕩然無存。更何況,AI 購物能覆蓋的,只有標準化、強目的性的剛需消費場景;對於非標品、高客單價、需要深度體驗的消費場景,AI 永遠無法替代使用者的自主決策。還有一個無法迴避的前提是:當下移動網際網路的互聯互通仍只是烏托邦式的嚮往,所謂的 AI 購物,不過是偽“一站式購物”。究其本質,豆包的商品供給依賴抖音電商,通義千問僅接入阿里全生態,京東 AI 購只整合京東自有品類,無一例外都是平台自有生態閉環;但使用者真正想要的 AI 購物,是能一站式解決全網消費需求,而非在單一封閉集團生態內兜兜轉轉。那大廠鼓吹的“對話即交易”當下不就是一個偽命題嗎?只不過是將原本分散在不同賽道的 App 操作集中到同一對話方塊,背後的商品池、履約體系仍在各自“畫地為牢”;若想全網比價、購買平台未上架的商品,使用者仍需跳轉至其他 App 操作。與此同時,封閉生態會進一步加劇資料壁壘:AI 推薦的精準度,高度依賴海量的使用者全場景消費資料,豆包僅能獲取抖音電商生態內的消費資料,無法觸達全域消費行為,推薦能力天花板天然受限。當然,電商競爭的終局,從來不止於前端的流量與轉化,更在於後端的履約與服務。表面上,豆包實現了“一句話下單”,但這僅侷限於下單環節——商品詳情、交易系統、售後體系均歸屬抖音電商,若出現商品質量問題、物流延誤、售後糾紛,使用者仍需要跨應用溝通,售後履約的完整閉環並未真正打通。造成這種局面的核心問題是,字節在履約體繫上的基因缺陷——因為電商行業的壁壘,最終落腳於供應鏈與履約能力:京東靠自建物流建立起行業護城河,美團靠全國即時配送網路坐穩本地生活頭把交椅,拼多多靠極致供應鏈管理實現低價優勢。反觀字節,商業基因是極致的 ROI 導向與營運效率優先,對物流履約這種長周期、重投入的重資產佈局向來缺乏耐心。所以抖音電商發展至今,仍未搭建自建物流體系,履約完全依賴第三方,與京東等自建物流網路的配送效率、服務體驗仍有差距。更深層的行業隱憂還在於,AI 購物全面落地,是否意味著重構商家的經營邏輯,並如同多米諾骨牌一般,進一步影響平台商家生態。據《2025 直播電商行業發展白皮書》資料顯示,直播電商行業的頭部主播流量集中度、銷售額佔比均呈持續下降態勢,中腰部主播與中小商家正逐步成為市場的中堅力量。然而在 AI 電商時代,頭部品牌商家顯然有更充足的預算適配 AI 推薦規則、搶佔流量紅利;中小商家則要面臨 AI 工具學習、資料服務、規則適配帶來的新增成本,生存空間可能會被進一步擠壓。即便抖音電商持續最佳化演算法分發機制、向商家開放 AI 技術能力,試圖幫助商家從客服接待、內容創作、預算調控、精準行銷等全鏈路降本增效;但無法迴避的核心矛盾仍在——當 AI 掌握了商品推薦的絕對話語權,商家的經營重心必然會從打磨產品、提升服務,轉向適配 AI 推薦規則、爭奪 AI 流量傾斜,或許會導致電商生態陷入新一輪“內卷”。 (虎嗅APP)
字節進攻,成為恆生科技最大利空
沒有一家公司能像字節跳動這樣,讓“增長”本身成為一種既定的市場預期。自2016年營收60億起,其規模便以近乎殘忍的加速度膨脹:2017年160億,2018年500億,2019年超1400億,2025年全球營收達到1860億美元(約12819億元人民幣),同比增長20%。當市場習慣於它揮舞資本、擴張疆域的敘事時,2026年的字節,已然將AI戰爭提升到全新的維度。其進攻姿態,由三個增長齒輪驅動:億級流量池、不計代價的資本開支(指為此可以“犧牲”現金牛業務的沐瞳),以及一場旨在穿透“App孤島”的生態破壁運動。資本市場的神經早已繃緊,字節系已經成為港股科技股最大利空,這並非只是情緒擔憂,這場戰役,已經從簡單的技術的交鋒、流量的爭奪,變成了新舊估值體系的殘酷重構。當字節以全新的速度和模式發起突襲,流量紅利和社交網路築成的舊半壁江山,還能否守住?騰訊的社交鐵壁和阿里的生態縱深,又將如何迎擊這場來自“新大陸”的衝擊?字節進攻的三板斧對字節跳動來說,“AI 是一件能影響整個世界的機會。” 一位接近字節跳動高層人士說。從 TopBuzz、TikTok 到 TikTok Shop,成立以後這家公司一直在尋找這樣的機會,“越接近世界中心的事情探索價值才越大。”2025 年初,使用者花式“語音調教”豆包的視訊突然在抖音上火爆出圈。幾個月後,圍繞豆包P圖、合照、換背景等的玩法在小紅書上走紅。半年時間裡,豆包把使用者對AI的想像從“深刻對話”拉回到更日常的使用。簡單來說就是當年抖音爆火的營運方式又來了一遍,不過這些方法也並非豆包獨創,其基礎功能主流玩家都有,但也只有豆包抖音形成了正循環。高盛研報指出,字節憑藉這一獨特優勢,日均消耗30兆Token,使其模型在中文語境下的理解和生成能力獲得海量真實反饋的快速迭代。這種“以戰養戰”的模式,讓技術迭代、使用者體驗最佳化和使用者增長之間形成了強大的正向循環。如果說流量是“巧勁”,那字節在2026年展現的資本“實力”則近乎瘋狂。根據公開資訊及行業推測,字節跳動2025年的資本開支預算超過1600億元人民幣,其中約900億——一個接近百度全年營收的數字——被明確投向AI算力基礎設施。這一數字,是同期騰訊預計資本開支的2.5倍,也遠超阿里在2025年計畫中的千億級投入。這筆錢砸向何方?一方面,是建構龐大的自研算力叢集。從輝達、AMD的高端GPU,到寒武紀等國產晶片,再到自研的雲端AI晶片,字節正在搭建一個足以支撐其長期野心的底層算力王國。另一方面,則是人才與技術併購的“軍備採購”。春節期間的“全員作戰”狀態,以及從全球頂尖實驗室不計成本地挖角,都是用資本直接兌換時間窗口的典型打法。春節前夕的另一場風波,揭示了字節跳動進攻策略中最具顛覆性的嘗試。字節與中興旗下努比亞聯合推出的“豆包手機”,內建的Agent(智能體)技術試圖直接代替使用者操作微信、淘寶等應用。這立刻觸發了巨頭們的防禦機制,微信提示“環境異常”,淘寶強制退出。雖然最後協調在符合技術要求後可以使用,但也設定了諸多門檻。這場看似不大的技術摩擦,實則是新舊時代入口邏輯的正面衝撞。長期以來,微信、淘寶各自建立了封閉但繁榮的生態環境。使用者想要服務,必須親自進入這些App孤島,完成點選、搜尋、下單等一系列動作。字節的豆包手機與Agent技術,則試圖扮演一個“超級中間層”或“調度者”——使用者只需向AI下達指令,AI自動呼叫各類服務,最終交付結果。豆包手機驗證了AI Agent確實能操作手機。但也證實了在跨App生態未能打通、操作延遲無法解決、安全隱私標準未定之前,AI手機很難真正普及。字節的進攻三板斧——流量池、天量資本開支、打破生態壁壘,砍向了網際網路世界最堅固的城牆。這也迫使城內的兩位巨無霸騰訊與阿里,必須拿出與之匹配的防守智慧與反擊力度。戰局已經從單方面的突襲,轉向了更為複雜的攻防拉鋸。騰訊在保守中激進AI Agent風靡網際網路的這兩年,微信一直“作壁上觀”,始終保持著自己的節奏。這次主動推出 ClawBot,更像為AI入口混戰布下的一場“陽謀”。有不少媒體認為AI Agent火熱的這兩年,騰訊系一直沒什麼動作,彷彿跟騰訊關係不大。市場曾擔憂,獨立AI應用會蠶食微信的入口優勢,替代微信成為使用者新的高頻使用場景。畢竟,當使用者有創作、搜尋、辦公需求時,若能在獨立AI應用一站式完成,自然無需再打開微信。但最近微信主動推ClawBot外掛,正式向風靡全網的 OpenClaw 敞開懷抱。此後QClaw、WorkBuddy、騰訊雲 Lighthouse 率先打通,階躍星辰、網易有道、月之暗面、智譜、MiniMax 等廠商的“龍蝦”產品緊跟著適配,連字節跳動旗下扣子程式設計也發佈了官方接入方案。截至目前,已有至少 10 款主流“龍蝦”產品完成接入或明確支援微信通道,整個行業一路小跑會師微信,讓其一躍成為國內使用者基數最大、生態適配速度最快的“龍蝦池”。3 月 18 日的騰訊業績溝通會上,馬化騰談及“養蝦”心得,認為“龍蝦”與即時通訊的融合,解決了傳統 ChatBot 需即時等待的痛點,使用者提交任務後可非同步接收結果,更具“活人感”、持續記憶與個性化適配能力。值得一提的是,當下微信 ClawBot 外掛僅作為消息通道,不會自動化操作微信,也不涉及對消息、朋友圈資料的獲取。試想,當14.18 億使用者最常用的聊天窗口,變成可直接指揮AI執行任務的操作面板,那龍蝦從科技圈層走向全民普及,只是時間問題。但“養蝦”能夠讓騰訊實現反超嗎?恐怕也有些困難,因為還需要克服以下問題微信生態能否實現高度統一,而非內部競爭產生不必要的內耗;其二微信作為社會基礎社交工具,其穩定性指標更為靠前,很難像豆包那樣大膽試錯快速迭代。此外,騰訊的AI應用過去主要由面向企業服務的CSIG事業群負責營運,該團隊擅長To B項目制。但在需要精細化營運、追求使用者增長和粘性的C端產品上,存在組織能力與產品使命的錯配。騰訊在電話會議中披露了更精準的AI投入資料:2025年在混元大模型及元寶 AI 應用等全新AI產品上投入180億元,並預計2026 年在混元大模型、元寶以及新 AI產品(例如各種智能體“蝦”)的研發投入將翻倍超360億元。從騰訊的2025年年度財報來看,還是相對漂亮的增收增利,總營收達到7517.7億元人民幣,同比增長14%。年度歸母淨利潤為2248.4億元人民幣,同比增長16%。但與其同時,第四季度營收1944億,環比微增0.8%,主要是本土遊戲收入的季度性下滑。行銷服務收入(環比上漲13%)和金融科技服務收入(環比上漲5%)仍在穩定增長。經營利潤603億,環比下降5%,主要是因為四季度投入大幅增加。應密切關注2026年第一季度情況。騰訊依然還是那個謹慎務實的騰訊,但現在騰訊在戰略層面已經清晰顯現了,它用克制而精準的生態內嵌策略將AI轉化為提升存量的工具,同時通過資本開支的果斷提升和模型策略的靈活組合加固技術底座。阿里的反擊之道如果說騰訊的防守基於其牢不可破的社交關係網,阿里於2025年以來所展現的戰略,則是一場兼具實用主義與資本重注的“閃電戰”。面對字節來自內容流量側的衝擊,阿里已調整航向,將全部戰略重心壓向C端。阿里目標明確必須打造出AI時代的“超級入口”,重新掌握流量分發的主動權和商品、服務交易的最短路徑。根據高盛研報的分析,阿里的資本開支在2025年同比暴增80%,這一增幅在巨頭中頗為激進,龐大資金湧向算力基礎設施、晶片採購及自研。這種不惜重金構築全端壁壘的邏輯,類似當年Google通過GCP、TPU和Android作業系統建立的護城河。阿里的焦慮源於其核心電商與本地生活業務正面臨的“流量飢渴症”,在抖音等內容平台將流量高效轉化為交易的趨勢下,它必須用重資產確保自身在算力、模型、應用全鏈路的控制力,以重求穩,以重求快,試圖用技術基建的厚度避險流量分發層面的競爭壓力。阿里的具體打法,被概括為“1+N”產品模式。其中的“1”,是作為旗艦店的“通義千問”APP,其定位遠不止於一個聊天機器人。它要求自己“會聊天更要能辦事”,核心是深度接入了阿里的服務生態。使用者可以在其中直接生成PPT、解析上百頁的長文件,甚至呼叫淘寶介面進行即時比價與購物。阿里希望它成為一個能解決實際問題的“萬能工具箱”。而“N”,則是將大模型能力“原子化”後,像毛細血管一樣嵌入淘寶、天貓、釘釘、夸克、高德等各個國民級應用,讓AI在使用者最需要的地方自然出現。通過這種模式,阿里旨在形成一個由核心旗艦應用引領,全生態能力協同復用的立體作戰陣型。日前阿里新成立的Alibaba Token Hub(ATH)事業群,將通義實驗室、MaaS業務線、千問事業部、悟空事業部整合在一起,這標誌著阿里AI to B戰略的全面升級,“悟空”正是這一戰略的重要出口。阿里的戰略和執行是堅定和決絕的,但投資者顯然沒有那麼大的信心。最新財報顯示,阿里巴巴 2026 財年第三財季,營收同比增長 2% 至 2848.4 億元,經調整淨利潤同比下降 67% 至 167.1 億元。本季度阿里可支配的現金,即自由現金流為 113 億,同比下降71%,時間再拉長一點,去年 3 月到 12 月,這9個月阿里的累計自由現金流已經轉負,為 -293.09 億元,去年同期為正701億元,現金壓力不小。資本市場對這份“以利潤換增長”的財報反應非常消極,財報公佈後,阿里美股盤前大跌近10%,創去年4月7日以來最大跌幅。投資人們想問,阿里的即時零售還需要燒多久?AI戰略燒錢不應該影響主業投入,用利潤換市場增長的故事在當下變得敏感而脆弱。2025年7月以來阿里啟動約500億元平台消費券計畫,疊加騎手、商家等綜合補貼,累計投入規模已接近1050億元等級。2026財年第三季度(指自然年2025年第四季度),即時零售業務單季度補貼成本約18億元,全年總投入(含行銷與補貼)同比繼續增加。而且阿里管理層明確在電話會指出,2026年(此處指自然年)全年投入力度將超過2025年,內部明確三年不考核虧損。這多少有些讓投資人難以接受,至少三年內即時零售這部分仍然需要重投入,還遠看不到盈利的曙光。當然,阿里也不是聽不懂市場在說什麼,所以今年以來收縮低價內卷,轉向精準補貼與高客單營運。2026年重點建倉醫藥、酒飲、生鮮等品類,新建500+前置倉,強化30分鐘達履約能力。總的來說,當前阿里巴巴的市盈率約為22.7倍左右。這一水平反映了市場對其短期利潤承壓的擔憂,同時也包含了一部分對其AI戰略轉型的期待。但距離阿里想要的“雲+AI業務”的估值倍數還有不小的差距。寫在最後字節進攻的勢頭足夠強,但也不代表這種AI戰事字節已經完全贏下了,豆包生態閉環尚未實現,巨額算力投入下,如何通過廣告、佣金實現盈利,是其持續擴張的前提。反之,可能被阿里、騰訊的生態閉環反超。為了打贏這場戰爭,字節主動出售現金牛業務旗下遊戲公司沐瞳科技,這可以說是不容易的戰略取捨,沐瞳是能夠穩定盈利且價值百億美元的業務部門,這說明字節也是在背著巨大壓力AII In AI。 (首席商業評論)
Google太狠了!要統治幾十億手機
在上月底舉辦的三星 Galaxy S26 發佈會上,三星和Google官宣將在 Galaxy S26 上首發基於 Gemini 的 Screen Automation(螢幕自動化)的能力。簡單來說,就是 Gemini 可以直接在手機螢幕上操作應用:打開 APP、識別螢幕、點選滑動、輸入文字……完成一連串 UI 操作,最後再把確認步驟交給使用者。圖片來源:三星沒錯,聽起來就和努比亞 M153(坊間俗稱「豆包手機」)上的豆包手機助手一樣,都是能替代人類在手機上進行「代理」操作,實現一句話點外賣、叫車、網購等需求。從海外媒體和論壇的反饋來看,這項功能終於在最近的測試版更新中上線了。不過我們也發現,Google並沒有全盤學習豆包手機助手的做法。雖然在技術實現路徑上同樣基於 GUI 的 Agent,但 Gemini 會基於 Android 開啟一個本地的虛擬沙盒,同時還主動限制了首批開放 Gemini「操作」的 APP,僅限少數一批應用。這種處理方式與國內廠商顯然不太一樣。甚至可以對比字節的豆包手機助手和阿里的千問,Google選擇了一條看起來既激進、又保守的路線。讓 AI 作業系統,而不是接管手機只看功能表面,Gemini 的「螢幕自動化」很容易被理解為另一種「豆包手機助手」。它同樣可以替你點外賣、叫車、下單,看起來也像一個能替人操作手機的 AI 代理。但如果把視角往下再挖一層,就會發現Google的方案其實完全不是一回事。豆包手機助手的邏輯很簡單:AI 讀取螢幕像素,像人眼一樣識別按鈕和輸入框,然後模擬手指點選。這種方式最大的優點就是通用——理論上任何 APP 都能操作,因為 AI 看到的只是螢幕。Gemini 明顯更「保守」。在實際執行任務時,Gemini 並不會直接在你的手機桌面上操作應用,而是會在 Android 系統裡開啟一個本地的虛擬沙盒窗口,讓 AI 在這個環境裡運行目標 APP。整個過程是可見的,使用者可以隨時終止任務,也可以在任何一步接管操作。圖片來源:Android Central簡單來說,Gemini「螢幕自動化」在產品定位上並不是一個可以隨意操控手機的萬能代理,而是一個被系統嚴格約束的自動化能力。Google還主動限制了第一批支援自動化的應用數量。目前開放的主要是打車、外賣和餐飲類服務,僅支援 Lyft、Uber、GrubHub、DoorDash、Uber Eats 和星巴克。也限制了「使用者範圍」。目前除了三星 Galaxy S26 系列已經可以在測試版中體驗,Google也僅規劃了 Pixel 10 系列支援,同時 Gemini 免費使用者每天僅有 5 次使用額度、Plus 會員 12 次、Pro 會員 20 次、Ultra 會員 120 次。這裡既有算力的考量,也在於使用者對 AI「亂動手機」的擔憂,尤其是在歐美市場。所以Google做了權限隔離、關鍵步驟必須要使用者手動操作、可以即時中斷 AI 操作等。但說到底,這只是過渡階段,Google的野心絕不止是讓 Gemini 僅僅能夠操作幾個特定 APP。圖片來源:Google很多人注意到 Gemini 的 GUI 操作能力,卻忽略了 Android 在系統層面正在發生的一件事情。就在三星 Galaxy S26 系列發佈會前夕,Google官方發佈了一篇博文名為《智能作業系統:讓 AI 代理對Android應用更有幫助》,並正式推出了一套新的應用能力介面體系——AppFunctions,允許 APP 主動向系統聲明自己可以被 AI 呼叫的功能。舉個例子,一個外賣 APP 可以告訴系統:支援搜尋餐廳、加入商品、提交訂單這些能力。當使用者對 Gemini 說「幫我點一份披薩」時,AI 並不一定需要逐步點選介面,它可以直接呼叫這些能力完成任務。如果把這套機制理解成 AI 的「函數呼叫」,事情就變得非常清晰了。在Google的設計裡,AI 代理其實有兩條路徑可以執行任務,一種是通過系統介面直接呼叫應用能力,另一種才是通過識別螢幕介面來進行 GUI 自動化。前者效率更高、穩定性更好;後者則是為了相容那些沒有適配新介面的應用。這意味著 Gemini 未來的裝置自動化能力,本質上並不是單純的「AI 看螢幕操作手機」,而是一種系統 API 與 GUI 混合的架構。AppFunctions 的應用示例,圖片來源:雷科技這個差異聽起來有點技術化,但它背後的產品邏輯其實非常簡單。相比豆包手機助手讓 AI 像人一樣使用手機,Google想做的事情是讓 AI 像系統一樣調度應用。當 AI 只是讀取螢幕像素時,它始終站在系統之外,只能模仿人的操作邏輯;但一旦 AI 被放進作業系統內部,它就可以直接協調應用之間的能力。從這個角度看,Gemini Screen Automation 的真正目標或許並不是點外賣、叫車這些場景。Google真正想建立的,是一種新的 Android 運行邏輯和生態。從這裡出發,我們也能在一定程度上明白,為什麼Google要和高通聯手推動「Android電腦」(非 Chromebook)。也解釋了為什麼 Gemini 的方案看起來既激進又保守。激進的地方在於,它試圖把 AI 變成 Android 的調度中心;保守在於,Google並不打算讓 AI 隨意接管整個手機,而是通過系統介面、權限控制和應用白名單,一步一步推進這種變化。相比「萬能 AI 代理」的想像,這種路線顯然更慢,也更克制。但對於一個擁有數十億裝置的作業系統來說,Google可能也沒有太多激進試錯的空間。豆包向左,千問向右,Gemini 走中間相比Google在手機上的做法,去年底亮相的豆包手機助手選擇了最簡單、也最激進的一種方式:讓 AI 像人一樣使用手機。在這套方案裡,AI 讀取螢幕像素,識別按鈕、輸入框和頁面結構,然後模擬手指點選完成操作。無論是點外賣、比價購物還是下單支付,AI 都是在手機介面上一步步執行。這種方式最大的優勢就是通用。因為 AI 看到的只是螢幕,它不需要任何 APP 的介面支援,也不需要平台授權。理論上,只要是人能操作的應用,AI 都可以完成同樣的操作。這也是為什麼很多人第一次體驗豆包手機助手時,會覺得它像一種「真正的 AI 手機」。圖片來源:豆包但問題也同樣明顯。當 AI 可以讀取整個螢幕並操作所有應用時,權限和安全問題就不可避免。同時,很多網際網路平台也並不歡迎這種自動化行為,因為它繞過了平台自身的入口和推薦體系。簡單說,豆包的路線技術上非常直接,但也天然會和應用生態產生摩擦。相比之下,阿里的千問走的是另一條思路,利用阿里自己的服務生態,讓 AI 成為一個調度中心。在這套體系裡,使用者的一句話會被拆解成具體任務,然後分別呼叫淘寶、支付寶、高德、飛豬等服務來完成。比如搜尋商品、下單支付、規劃路線,都是直接呼叫真實業務能力,而不是模擬介面操作。因為所有操作都發生在生態內部,AI 不需要繞過應用權限,也不會觸發平颱風控,又因為直接呼叫服務介面,執行效率往往也更高。圖片來源:雷科技但問題同樣清晰:生態邊界。千問能夠調度的服務,本質上還是阿里系應用。一旦使用者需求涉及其他平台,能力就會明顯下降。從這個角度看,豆包和千問其實代表了兩種非常典型的 AI 代理路徑。前者試圖讓 AI 接管手機本身,追求的是通用能力;後者則通過生態整合,讓 AI 接管服務流程,追求的是業務深度。而Google的 Gemini,某種程度上站在二者之間。在當前階段,Gemini 依然保留了 GUI 自動化能力,這意味著它在必要時也可以像豆包一樣,通過識別介面來操作應用。但與此同時,Google又在 Android 系統裡引入了新的應用能力介面,讓 APP 主動向系統開放可以被 AI 呼叫的功能。如果應用支援這些介面,Gemini 就不需要再逐步點選介面,而是可以直接呼叫應用能力完成任務。換句話說,Google的方案其實是一種混合路徑:系統介面優先,GUI 自動化兜底。從短期來看,這種方式顯然沒有豆包那樣驚豔,也不像千問那樣能夠迅速整合成熟生態。但它的好處在於,既避免了和應用生態的正面衝突,又保留了足夠的通用性。寫在最後把視角再拉遠一點,其實不難理解三種路線為什麼會分化成現在這樣。字節沒有作業系統,也沒有本地生活生態,所以只能讓 AI 直接接管手機;阿里擁有龐大的服務體系,於是讓 AI 去調度自己的業務網路;而Google真正擁有的,則是 Android 這個覆蓋數十億裝置的作業系統。因此,Gemini 的目標從一開始就不是做一個更強的手機助手,而是把 AI 變成系統的一部分,讓 Android 從「運行應用的平台」慢慢變成「調度應用的智能系統」。從這個角度看,Gemini 的克制並不是保守,而更像是一種平台級公司的必然選擇。 (雷科技)
阿里、抖音、京東徹底瘋狂,新的大戰一觸即發
槍響之後,沒有退路。去年還在卷大模型參數,今年巨頭們已經真刀真槍幹起了AI電商。年關前後,三家巨頭集體出手,京東AI購獨立App悄然上線,阿里千問接通電商生態、用30億紅包砸出1.2億筆AI訂單,抖音豆包開始內測購物功能。硝煙逐漸瀰漫,一場屬於AI時代的電商大戰,即將爆發。阿里、抖音、京東集體出手 AI電商時代正在到來AI時代,一場新的變革正在醞釀。近期,輝達創始人黃仁勳罕見地發表了一篇長文,他在文中直言:“人工智慧(AI)是當今塑造世界的最強大力量之一......它是如同電力和網際網路一樣不可或缺的基礎設施。”聯絡現實,AI確實已經以勢不可擋之勢席捲了全球各行各業。回望二十多年前,網際網路的興起與普及將購物與交易從線下帶到了線上,催生了電商這一劃時代的產物。而如今,當AI逐漸成為新一代基礎設施,也必然會對電商產生深遠的影響。事實上,行業巨頭已紛紛行動,一場“電商AI化”的轉型浪潮正悄然啟動。以抖音和阿里為代表的企業,已不約而同地將旗下AI助手全面接入各自的電商生態。最近,抖音豆包開始內測一項新功能——“購物下單”,即使用者在對話中能直接完成購物。當聊到相關需求時,AI會自動推送商品卡片,點選即可進入購買流程,無需跳出應用。圖源:豆包這是繼去年10月豆包接入抖音商城連結後,其AI購物體驗的又一大飛躍。據QuestMobile資料,今年央視春晚期間,豆包的日活躍使用者數(DAU)峰值達到1.45億,是國內AI原生應用當之無愧的斷層領先者。這也意味著,豆包手裡握著數量極其龐大的使用者。圖源:QuestMobile對此,抖音表示,抖音電商和豆包是相互獨立但有合作的關係,抖音電商沒有直接“接入”豆包(比如成為豆包的內建功能)。從這個角度來說,豆包嵌入抖音電商,本質還是利用AI提升站內轉化效率。在推薦購買的過程中,AI扮演的是加速成交的催化劑角色。相比抖音克制的態度,阿里千問的戰略則顯得更加激進。據多家媒體披露,去年底,阿里將千問APP、夸克及AI硬體等多個業務聚合,成立全新的千問C端事業群,由集團副總裁吳嘉親自掛帥,目標直指將千問打造為AI時代的“超級應用”與智能樞紐。今年1月,千問已邁出實質性一步,全面接入淘寶、支付寶、飛豬等阿里核心生態。這意味著,使用者與千問的對話不再止於資訊獲取,而是可以直接完成訂機票、點外賣、購物等一系列真實生活事務。千問正從一個聊天對象演變為能實際辦事的智能體,以“超級入口”之姿強力推進阿里在C端的AI戰略。圖源:千問當然,更核心的激進之處在於阿里春節期間砸下的30億。春節AI大戰中,千問選擇了一條最親民的路徑來實現使用者的拉新:下載即送25元代金券,一單羊毛撬動一個使用者。玩法十分樸素,效果卻很震撼。千問通過“請客活動”實現爆發式拉新,DAU從707萬飆升至7352萬,增速高達940%,活動期間累計使用者下單超2億次,吸引1.3億人首次體驗AI購物。更關鍵的是,其憑藉實用場景實現高留存,活動後DAU穩定在4000萬,雖然曝光量不及豆包,但仍被摩根士丹利和AI產品資料平台AICPB評為使用者留存率最強,證明了以真實交易驅動的增長策略具備持續生命力。這背後是阿里對AI的獨特理解。正如馬雲所說,科技的意義在於“呵護人間煙火”。千問的路徑很清晰:從對話式聊天轉向能辦事的智能體,用補貼這種最樸素的手段,快速完成使用者心智教育。它不追求炫技,只追求讓更多人用起來。當電商購物的繁瑣流程被濃縮為幾句AI指令,就有機會擊穿更多使用者群體的使用壁壘。不同於抖音和阿里,京東的選擇,是從零建構一個原生AI購物工具。去年底,京東悄悄上架了一款獨立App——京東AI購,搭載自研的JoyAI大模型。圖源:APP STORE京東沒有把現有AI揉進電商體系,而是選擇了一條更徹底的路徑:用自然語言互動取代傳統的貨架與搜尋,實現“一句話購物”。使用者不再需要瀏覽、比價,只需描述需求,AI便直接匹配商品並完成下單。與此同時,京東也在供應鏈端發力。物流調度、工業供應鏈等環節都部署了專用AI系統。正如京東CEO許冉所說,依託自營業務和物流履約能力,京東正在成為AI技術應用場景最豐富的企業。三巨頭,三條路:抖音把AI嵌入現有生態,阿里用補貼砸開使用者心智,京東另起爐灶造原生工具。路徑不同,目標卻一致,即爭奪AI電商時代的下一張門票。AI正在重寫電商的底層邏輯摩根士丹利分析師曾預測,未來幾年AI購物代理將t重塑線上零售格局,到2030年,近半數電商交易有望通過AI代理完成。事實上,AI對電商的改造早已啟動,從商家到平台,使用者往往是感知最晚的一環。首先,AI正在系統性地降低電商的門檻。對中小商家而言,數字人直播、AIGC內容生成、智能客服等工具,讓原本依賴專業技能和人力的線上生意,開始被“數字員工”分擔。其次,AI也在重塑供應鏈。隨著AI對基礎設施的改造,平台甚至可以轉向AI預測使用者要什麼,供應鏈從被動響應走向主動預判。以京東為例,其物流與倉儲環節的AI系統已在推動這一轉變。今年,京東“AI年貨地圖”首次上線,其基於巨量資料與人工智慧,能夠預測不同區域的消費偏好,提前指導商品分倉與布貨,提升時效。圖源:京東而在使用者側,AI購物助手的普及,正在顛覆過去二十年的遊戲規則:流量分配。過去,誰佔據搜尋首頁誰就能贏,商家為此投入巨大預算。而未來,如果使用者不再主動搜尋,而是直接告訴AI需求,那麼流量入口就將從關鍵詞排名轉向需求匹配。商家的任務從搶排名,變成讓AI理解自己的商品。平台的角色也從分發流量轉向分發需求——這是一場權力的重新洗牌。這意味著,誰掌握AI入口,誰就掌握使用者。當人們習慣用豆包購物、用千問點外賣、用京東AI下單,傳統電商的流量壁壘將被逐步瓦解。但挑戰同樣真實存在。一是算力瓶頸。億級使用者同時呼叫AI下單,算力消耗遠超傳統操作,平台必須持續加碼AI基礎設施的建設,這無疑是一筆巨大的投入。二是使用者心智的培育。對商家而言,AI帶來降本增效是明確的剛需,但對使用者來說,用AI購物是否真的是“真需求”,仍需檢驗。在今年的春節AI大戰中,補貼換來的下載高峰,未必完成了有效的使用者篩選。如何讓使用者從薅羊毛走向真習慣,是每個平台都必須回答的問題。但無論如何,槍聲已經響起。這一次,不僅僅是概念或試點,而是巨頭們真金白銀的投入、千萬級使用者的驗證、商業閉環的打通。雖然結果如何還尚未可知,但唯一可以預見的是,時代的變化,一定比想像中來得更快。 (電商之家)