字節硬體搶跑，阿里騰訊急了

2026/01/16

•

AI競賽下半場，三巨頭的硬體卡位戰。

大模型雲端算力比拚進入白熱化，科技巨頭們的競爭邊界也加速向硬體終端蔓延。

其中，字節最早跳出軟體生態競爭，從AI手機、眼鏡乃至汽車，字節已將目光投向全場景終端。近日，騰訊、阿里也強勢入局。不同於字節的自研主導，騰訊以資本為矛，密集編織硬體網路。阿里則以通義大模型為核，繫結海量硬體產品，也借規模效應嘗試拉高Token消耗。

火山引擎大模型智能硬體負責人邢孝慈預計：2026年，AIoT（AI硬體）領域單一產品出貨量超過100萬台，單一品類出貨量超過1000萬台的客戶和產品會變多。

2025年12月1日，字節跳動上線豆包手機助手，打響了爭奪手機硬體入口的第一槍。此後，有媒體披露，豆包AI眼鏡已經在排產之中，預計2026年第一季度發售。甚至坊間傳言，字節跳動要造“豆包汽車”。

雖然這些消息相繼被字節否認，但硬體無疑已成為巨頭爭奪AI生態入口的核心戰場。

阿里也醒了。1月8日至11日，阿里在深圳舉辦了阿里雲通義智能硬體展，共吸引超過200家品牌參加，展出了超1000個類別的智能硬體，其品類包羅萬象，涵蓋了AI手機、AI眼鏡、AI陪伴玩具、寵物翻譯、AI調香等。

阿里雲通義大模型業務總經理徐棟在接受媒體採訪時說：除了Chatbot和Agent之外，硬體可能是大模型快速形成商業閉環的場景。他預計，2026年的智能硬體之爭將不侷限於手機、汽車和眼鏡，應該會出現新的品類，它們也將有可能成為新的入口。

阿里在硬體激戰中的策略，更多是扮演“生態賦能”的供應商角色：與模組、晶片廠商深度合作，將通義的多模態互動、語音識別能力封裝為解決方案，讓硬體商或開發者更易用、成本更低，生態更繁榮。

騰訊的策略則是瞄準頭部硬體廠商，比如同在深圳的拓竹與影石Insta360，延續其擅長的“資本+技術輸出”手腕。作為基石投資人，騰訊曾參與了影石Insta360的IPO配售。近期，影石又與騰訊雲合作發售了會議麥克風產品。

有消息稱，騰訊還參投了拓竹在2025年11月完成的、估值為100億美元的新一輪融資。雖然拓竹創始人陶冶否認了這一消息，但拓竹與騰訊互動頻繁：騰訊混元3D 3.0大模型接入了拓竹3D模型平台，並推出了名為“印你”的全新手辦生成器。

2026年，大公司的第一場“硬仗”圍繞端側入口打響。過去，這個入口更多被硬核聯盟（OPPO、vivo、華為、聯想等手機廠商發起）佔據。如今，互動的舊秩序正在被推倒。

01 “封殺”擋不住豆包，阿里跟進入局

2025年12月1日，豆包發佈手機助手，其搭載在中興nubia M153系列手機上，通過獲取作業系統層面的高權限，實現打車、買火車票等功能。雖然字節的嘗試被淘寶、微信等超級App火速“封殺”，但已清晰宣示了其爭奪入口的戰略意圖，也初步驗證了模型廠商與手機廠商深度合作的可行性。

雖初戰未捷，但豆包手機攪動的行業影響不斷擴大；應用也在持續更新，並且力度更大。《中國企業家》統計了其更新日誌，截至1月12日，豆包手機助手共進行了40多項更新和新增功能。

僅在1月12日這周，其新增的助手功能便有：系統相簿支援照片預覽時，底部按鈕快捷打開豆包助手，使用豆包P圖；在UI和系統層面新增“相機前後置視訊美顏”功能，且瀏覽器支援抖音搜尋。

字節的更新也透露出了其學習成為手機系統廠商的底層思維。除了在端側大模型能力上做小步快跑式的更新，字節將抖音搜尋、豆包輸入法、豆包大模型語音能力等灌入其中。在設計上，甚至關注到了手機鬧鐘響鈴和小睡時助手關閉鬧鐘這樣的細分需求。

阿里和騰訊則沿用了從軟體切入手機市場的整體思路，做法上仍帶有鮮明的大模型時代風格。

據悉，對於豆包手機助手的GUI（圖形使用者介面）方案，阿里也在同步探索軟體與手機結合的方案。2025年12月31日，阿里通義實驗室發佈開源“MAI-UI”，這是一個多模態的基礎GUI智能代理。不僅能實現人機互動，還能整合MCP工具使用。

阿里還在佈局另外一條技術線“A2A”（Agent-to-Agent）。該路線通過直接呼叫App裡的Agent能力，實現跨應用的調取。徐棟表示：GUI和A2A兩條路線都處於早期階段，齊頭並進。“A2A發展挺快，體驗更好，速度更快，模型消耗成本更低。如果全用GUI，成本可能會更貴。”

面對GUI變革浪潮，騰訊也做出了嘗試動作。幾乎在阿里開源“MAI-UI”模型的同時，2025年12月30日，騰訊開源了一款端側翻譯模型Tencent-HY-MT1.5-1.8B，該模型可以在手機等消費級裝置運行，量化後僅需約1GB記憶體。

2026年開年，微信小程序聯合騰訊混元、騰訊雲、騰訊廣告推出“AI應用及線上工具小程序成長計畫”。通過提供免費雲開發資源、1億混元大模型Token額度，以及資料分析、廣告變現及流量激勵等支援，幫助開發者快速落地AI應用。

02 AI眼鏡阿里先下一城，字節後手兇猛

手機入口之外，AI眼鏡是當前硬體競爭的最激烈戰場。今年的國際消費電子展（CES）上，據媒體統計：AI眼鏡展台已達23家，其中中國品牌商家佔了16席，包括阿里巴巴、雷神科技、韶音、Rokid、Xreal等。在政策端，智能眼鏡也首次被納入“國補”。

在AI眼鏡市場，阿里暫時佔據了先機。2025年11月27日，阿里正式發佈夸克AI眼鏡，首發提供S1、G1兩個系列共六款單品，最低到手價分別為3799元、1899元。上線不久，其天貓旗艦店已有超過9000人付款購買，京東商城售出超5000件，預售期也來到了45天。

但字節正在步步緊逼。根據媒體報導，豆包AI眼鏡即將進入出貨階段，無屏版AI眼鏡將於今年第一季度率先發佈，帶顯示功能的版本預計在今年第四季度推出。

對此，《中國企業家》詢問字節跳動方面，豆包相關負責人表示，傳聞不實，目前沒有明確的銷售計畫。但據媒體從供應鏈處瞭解的資訊，眼鏡將由龍旗科技代工，研發落地龍旗惠州工廠，量產則由龍旗南昌工廠承接。雙方分工明確：龍旗負責底層UI開發，字節則主攻上層App研發，以更好地實現產品與手機的互聯。此前，龍旗科技也曾在2025年半年報中披露：公司新承接了國內頭部網際網路客戶AI眼鏡量產項目。

此前，魅族前高管李楠在一檔播客裡預言，下一代個人計算中心的產品形態暫時不明確，因為技術能力在快速變化，眼鏡、項鏈、耳機都是可選方案，大模型能力也會強化其競爭。

圍繞AI眼鏡生態，騰訊則尚無明確的硬體製造計畫。2024年，曾傳出騰訊代理Meta Quest VR頭顯，但合作始終沒有見諸天日。

騰訊更多延續的是“投資槓桿+生態協同”的硬體佈局邏輯。比如2025年10月，騰訊應用寶與中國頭部AI眼鏡廠商影目INMO達成合作，聯合打造AI眼鏡專屬App Store。2025年7月，INMO宣佈完成1.5億元B2輪融資。

03 降低合作夥伴使用門檻

巨頭之間的硬體卡位戰，本質上還是對AI時代核心話語權的爭奪。當大模型能力泛化至物理世界，誰能佔據更多場景，掌握更多資料和使用者，也將讓模型更快迭代和進化，並消耗更多Token，緩解商業化壓力。

目前，阿里和字節分別推出了針對AIot裝置的開髮套件。阿里推出了多模態互動開髮套件，整合了千問、萬相、百聆三款通義基礎大模型，並預置了十多款生活休閒、工作效率等領域的Agent和MCP工具，可應用於AI眼鏡、學習機、陪伴玩具、智慧型手機器人等硬體裝置。

相比於字節，阿里的策略是通過標準化技術輸出，降低硬體廠商接入門檻，同時借助海量硬體終端，拉高通義大模型的使用量。近期的阿里雲通義智能硬體展上，從具身智能、AI潮玩，乃至AI包掛，幾乎所有主流AI硬體都有品類搭載了通義大模型，這也為阿里雲的算力業務帶來持續增量。

字節則推出了玩具AI框架、音訊AI框架等開髮套件，該套件基於新推出的豆包大模型1.8系列，採取三個月、一年與終身使用不限量等針對性優惠。字節甚至還提出了vibe interaction（氛圍互動）的概念，讓軟體定義硬體。

徐棟表示：IoT廠商十多年前強調連接，但沒有達成更多增值服務。但現在，大模型讓單點的IoT廠商有可能誕生相互通訊、相互協作的任務方式。“首先要把（模型使用）成本降下去，增加出貨量，不同的裝置之間找到更好的協作方式，有可能長出一些新的業態和生態。”

據徐棟介紹，很多硬體裝置的TTS（從文字到語音）成本佔75%，但有些語音模型可以降低擬人化要求，成本會低很多，這是通義大模型正在做的事情。

字節與阿里的相關負責人也不約而同地提到了AIoT裝置的網路連線、訊號傳輸、語音延時以及續航等問題。一位硬體從業者甚至說，“識別精準性就意味著產品的退貨率，每一次誤差可能是退貨率的一個開端。”

而音視訊技術騰訊在B端、C端積累多年，這也成為騰訊開展與硬體公司合作的基礎。

騰訊雲副總裁商世東在談到與影石Insta360的合作時，對《中國企業家》表示：在大語言模型和深度學習時代，很多任務訓練要求模組之間共同定義一個訓練目標。比如裝置延遲、裝置功耗、晶片算力，怎麼找到更好的平衡點，需要演算法、軟體和裝置廠商，大家共創和緊密協作。

在AI時代的下半場，硬體公司正在學著將模型公司的能力內化、規模化；平台型公司則要學習將網際網路的規模效應轉化為對新互動的爭奪——不久的未來，競爭的焦點可能將從使用者數量，走向裝置的數量以及呼叫規模。 (中國企業家雜誌)

科技