AI競賽下半場,三巨頭的硬體卡位戰。
大模型雲端算力比拚進入白熱化,科技巨頭們的競爭邊界也加速向硬體終端蔓延。
其中,字節最早跳出軟體生態競爭,從AI手機、眼鏡乃至汽車,字節已將目光投向全場景終端。近日,騰訊、阿里也強勢入局。不同於字節的自研主導,騰訊以資本為矛,密集編織硬體網路。阿里則以通義大模型為核,繫結海量硬體產品,也借規模效應嘗試拉高Token消耗。
火山引擎大模型智能硬體負責人邢孝慈預計:2026年,AIoT(AI硬體)領域單一產品出貨量超過100萬台,單一品類出貨量超過1000萬台的客戶和產品會變多。
2025年12月1日,字節跳動上線豆包手機助手,打響了爭奪手機硬體入口的第一槍。此後,有媒體披露,豆包AI眼鏡已經在排產之中,預計2026年第一季度發售。甚至坊間傳言,字節跳動要造“豆包汽車”。
雖然這些消息相繼被字節否認,但硬體無疑已成為巨頭爭奪AI生態入口的核心戰場。
阿里也醒了。1月8日至11日,阿里在深圳舉辦了阿里雲通義智能硬體展,共吸引超過200家品牌參加,展出了超1000個類別的智能硬體,其品類包羅萬象,涵蓋了AI手機、AI眼鏡、AI陪伴玩具、寵物翻譯、AI調香等。
阿里雲通義大模型業務總經理徐棟在接受媒體採訪時說:除了Chatbot和Agent之外,硬體可能是大模型快速形成商業閉環的場景。他預計,2026年的智能硬體之爭將不侷限於手機、汽車和眼鏡,應該會出現新的品類,它們也將有可能成為新的入口。
阿里在硬體激戰中的策略,更多是扮演“生態賦能”的供應商角色:與模組、晶片廠商深度合作,將通義的多模態互動、語音識別能力封裝為解決方案,讓硬體商或開發者更易用、成本更低,生態更繁榮。
騰訊的策略則是瞄準頭部硬體廠商,比如同在深圳的拓竹與影石Insta360,延續其擅長的“資本+技術輸出”手腕。作為基石投資人,騰訊曾參與了影石Insta360的IPO配售。近期,影石又與騰訊雲合作發售了會議麥克風產品。
有消息稱,騰訊還參投了拓竹在2025年11月完成的、估值為100億美元的新一輪融資。雖然拓竹創始人陶冶否認了這一消息,但拓竹與騰訊互動頻繁:騰訊混元3D 3.0大模型接入了拓竹3D模型平台,並推出了名為“印你”的全新手辦生成器。
2026年,大公司的第一場“硬仗”圍繞端側入口打響。過去,這個入口更多被硬核聯盟(OPPO、vivo、華為、聯想等手機廠商發起)佔據。如今,互動的舊秩序正在被推倒。
2025年12月1日,豆包發佈手機助手,其搭載在中興nubia M153系列手機上,通過獲取作業系統層面的高權限,實現打車、買火車票等功能。雖然字節的嘗試被淘寶、微信等超級App火速“封殺”,但已清晰宣示了其爭奪入口的戰略意圖,也初步驗證了模型廠商與手機廠商深度合作的可行性。
雖初戰未捷,但豆包手機攪動的行業影響不斷擴大;應用也在持續更新,並且力度更大。《中國企業家》統計了其更新日誌,截至1月12日,豆包手機助手共進行了40多項更新和新增功能。
僅在1月12日這周,其新增的助手功能便有:系統相簿支援照片預覽時,底部按鈕快捷打開豆包助手,使用豆包P圖;在UI和系統層面新增“相機前後置視訊美顏”功能,且瀏覽器支援抖音搜尋。
字節的更新也透露出了其學習成為手機系統廠商的底層思維。除了在端側大模型能力上做小步快跑式的更新,字節將抖音搜尋、豆包輸入法、豆包大模型語音能力等灌入其中。在設計上,甚至關注到了手機鬧鐘響鈴和小睡時助手關閉鬧鐘這樣的細分需求。
阿里和騰訊則沿用了從軟體切入手機市場的整體思路,做法上仍帶有鮮明的大模型時代風格。
據悉,對於豆包手機助手的GUI(圖形使用者介面)方案,阿里也在同步探索軟體與手機結合的方案。2025年12月31日,阿里通義實驗室發佈開源“MAI-UI”,這是一個多模態的基礎GUI智能代理。不僅能實現人機互動,還能整合MCP工具使用。
阿里還在佈局另外一條技術線“A2A”(Agent-to-Agent)。該路線通過直接呼叫App裡的Agent能力,實現跨應用的調取。徐棟表示:GUI和A2A兩條路線都處於早期階段,齊頭並進。“A2A發展挺快,體驗更好,速度更快,模型消耗成本更低。如果全用GUI,成本可能會更貴。”
面對GUI變革浪潮,騰訊也做出了嘗試動作。幾乎在阿里開源“MAI-UI”模型的同時,2025年12月30日,騰訊開源了一款端側翻譯模型Tencent-HY-MT1.5-1.8B,該模型可以在手機等消費級裝置運行,量化後僅需約1GB記憶體。
2026年開年,微信小程序聯合騰訊混元、騰訊雲、騰訊廣告推出“AI應用及線上工具小程序成長計畫”。通過提供免費雲開發資源、1億混元大模型Token額度,以及資料分析、廣告變現及流量激勵等支援,幫助開發者快速落地AI應用。
手機入口之外,AI眼鏡是當前硬體競爭的最激烈戰場。今年的國際消費電子展(CES)上,據媒體統計:AI眼鏡展台已達23家,其中中國品牌商家佔了16席,包括阿里巴巴、雷神科技、韶音、Rokid、Xreal等。在政策端,智能眼鏡也首次被納入“國補”。
在AI眼鏡市場,阿里暫時佔據了先機。2025年11月27日,阿里正式發佈夸克AI眼鏡,首發提供S1、G1兩個系列共六款單品,最低到手價分別為3799元、1899元。上線不久,其天貓旗艦店已有超過9000人付款購買,京東商城售出超5000件,預售期也來到了45天。
但字節正在步步緊逼。根據媒體報導,豆包AI眼鏡即將進入出貨階段,無屏版AI眼鏡將於今年第一季度率先發佈,帶顯示功能的版本預計在今年第四季度推出。
對此,《中國企業家》詢問字節跳動方面,豆包相關負責人表示,傳聞不實,目前沒有明確的銷售計畫。但據媒體從供應鏈處瞭解的資訊,眼鏡將由龍旗科技代工,研發落地龍旗惠州工廠,量產則由龍旗南昌工廠承接。雙方分工明確:龍旗負責底層UI開發,字節則主攻上層App研發,以更好地實現產品與手機的互聯。此前,龍旗科技也曾在2025年半年報中披露:公司新承接了國內頭部網際網路客戶AI眼鏡量產項目。
此前,魅族前高管李楠在一檔播客裡預言,下一代個人計算中心的產品形態暫時不明確,因為技術能力在快速變化,眼鏡、項鏈、耳機都是可選方案,大模型能力也會強化其競爭。
圍繞AI眼鏡生態,騰訊則尚無明確的硬體製造計畫。2024年,曾傳出騰訊代理Meta Quest VR頭顯,但合作始終沒有見諸天日。
騰訊更多延續的是“投資槓桿+生態協同”的硬體佈局邏輯。比如2025年10月,騰訊應用寶與中國頭部AI眼鏡廠商影目INMO達成合作,聯合打造AI眼鏡專屬App Store。2025年7月,INMO宣佈完成1.5億元B2輪融資。
巨頭之間的硬體卡位戰,本質上還是對AI時代核心話語權的爭奪。當大模型能力泛化至物理世界,誰能佔據更多場景,掌握更多資料和使用者,也將讓模型更快迭代和進化,並消耗更多Token,緩解商業化壓力。
目前,阿里和字節分別推出了針對AIot裝置的開髮套件。阿里推出了多模態互動開髮套件,整合了千問、萬相、百聆三款通義基礎大模型,並預置了十多款生活休閒、工作效率等領域的Agent和MCP工具,可應用於AI眼鏡、學習機、陪伴玩具、智慧型手機器人等硬體裝置。
相比於字節,阿里的策略是通過標準化技術輸出,降低硬體廠商接入門檻,同時借助海量硬體終端,拉高通義大模型的使用量。近期的阿里雲通義智能硬體展上,從具身智能、AI潮玩,乃至AI包掛,幾乎所有主流AI硬體都有品類搭載了通義大模型,這也為阿里雲的算力業務帶來持續增量。
字節則推出了玩具AI框架、音訊AI框架等開髮套件,該套件基於新推出的豆包大模型1.8系列,採取三個月、一年與終身使用不限量等針對性優惠。字節甚至還提出了vibe interaction(氛圍互動)的概念,讓軟體定義硬體。
徐棟表示:IoT廠商十多年前強調連接,但沒有達成更多增值服務。但現在,大模型讓單點的IoT廠商有可能誕生相互通訊、相互協作的任務方式。“首先要把(模型使用)成本降下去,增加出貨量,不同的裝置之間找到更好的協作方式,有可能長出一些新的業態和生態。”
據徐棟介紹,很多硬體裝置的TTS(從文字到語音)成本佔75%,但有些語音模型可以降低擬人化要求,成本會低很多,這是通義大模型正在做的事情。
字節與阿里的相關負責人也不約而同地提到了AIoT裝置的網路連線、訊號傳輸、語音延時以及續航等問題。一位硬體從業者甚至說,“識別精準性就意味著產品的退貨率,每一次誤差可能是退貨率的一個開端。”
而音視訊技術騰訊在B端、C端積累多年,這也成為騰訊開展與硬體公司合作的基礎。
騰訊雲副總裁商世東在談到與影石Insta360的合作時,對《中國企業家》表示:在大語言模型和深度學習時代,很多任務訓練要求模組之間共同定義一個訓練目標。比如裝置延遲、裝置功耗、晶片算力,怎麼找到更好的平衡點,需要演算法、軟體和裝置廠商,大家共創和緊密協作。
在AI時代的下半場,硬體公司正在學著將模型公司的能力內化、規模化;平台型公司則要學習將網際網路的規模效應轉化為對新互動的爭奪——不久的未來,競爭的焦點可能將從使用者數量,走向裝置的數量以及呼叫規模。 (中國企業家雜誌)