iPhone時刻再臨?AI原生硬體的“突圍”與“幻滅”

回顧科技圈,會發現一個有趣的悖論:軟體越來越“重”,大模型參數爆炸,而硬體試圖越來越“輕”,AI Pin、智能眼鏡、智能戒指等。

這標誌著我們正處於一個“後智慧型手機時代”的前夜。以AI手機、AI眼鏡、AI吊墜為代表的泛在式AI小裝置,正在試圖重構人與數字世界的連接方式。

行業裡,一個更準確的詞正在流行:“AI 終端”。它本質上不是某一件硬體,而是:大模型 + 作業系統 + 軟硬一體裝置 + 新互動與服務閉環 的組合。

一、 現狀格局:改良派與革命派的博弈

目前的AI硬體賽道,清晰地分裂為兩個陣營:

1. 改良派(Evolutionary):AI Phone

代表: 三星Galaxy S24、Pixel 9、iPhone 17

邏輯: “舊瓶裝新酒”。利用現有的成熟互動,比如螢幕+觸控,將AI作為作業系統的一層嵌入。

現狀: 最穩健。端側模型(如Gemini Nano)開始接管圖像處理、即時翻譯和摘要生成。但這更多是功能的疊加,而非原生體驗的重構。

IDC 預測:2024 年 GenAI 手機出貨量同比增長 364%,達到約 2.34 億台,是智慧型手機中增速最快的細分市場。Gartner 預計:到 2025 年底,全球 GenAI 手機終端支出將達 2982 億美元,佔 AI 終端總支出的 20%,並預計 2029 年幾乎所有高端手機都會具備 GenAI 能力。

然而,GenAI 手機 ≠ 在手機裡塞個 ChatGPT 圖示。更加主流的定義是,GenAI 手機 = 內建 NPU / AI 引擎,能在本地運行尺寸最佳化後的生成式模型,提供創作、理解、翻譯等能力。

報導普遍認為,“生成式 AI 從雲側落地到端側,是 2024–2025 年手機行業變革關鍵”,中美大廠都把 AI 手機當成新一輪競爭焦點。

一條有意思的路線是,網際網路平台向下滲透到終端——

  • 2025 年底,字節跳動推出基於“豆包”大模型的語音助手,先在中興努比亞新品上首發,並計畫與多家手機廠商合作,而自己不做整機。

這說明,“AI 助手 + 生態 + 分發”這層價值足夠大,甚至可以與手機品牌分拆營運。

2. 革命派(Revolutionary):AI Native Hardware

代表: Ray-Ban Meta Glasses、Humane AI Pin、Rabbit R1、Limitless

邏輯: “去App化、去螢幕化”。主張AI Agent應當直接接管任務,通過語音和視覺與世界互動,試圖繞過蘋果和Google的生態圍牆。

現狀: 新物種爆發:AI 眼鏡、AI Pin、Rabbit R1…如果說 AI 手機是“升級剛需”,那 AI 眼鏡、AI Pin 等,是“押注未來”。

根據研究機構 Wellsenn XR 資料,2024 年全球 AI 眼鏡銷量約 234 萬副,同比 +588%;預計 2030 年達 9000 萬副,年復合增速約 83.7%。其中 Ray-Ban Meta 系列憑藉時尚設計 + AI 互動,在 2024 年 Q4 單季銷量約 140 萬副,佔全球九成以上份額,堪稱第一波現象級產品。36Kr 披露,2025 上半年全球智能眼鏡出貨量 406.5 萬台,同比增長 64.2%;中國市場增速位居全球首位,AI 眼鏡被寄望為下一代人機互動入口。

國內則迎來真正的“百鏡大戰”:2024–2025 年,小米、華為、VITURE、Rokid、雷鳥、百度、閃極、李未可等十余家廠商集中上新 AI 眼鏡。CBNData 指出:2024 年國內智能眼鏡中帶 AI 功能的銷量不足 20%,但預計 2025 年 AI 功能滲透率將超過 60%。

二、 核心維度:被忽視的“場景所有權”

除了常規的軟硬體分析,我們必須引入一個關鍵維度:場景所有權。這是AI硬體成敗的關鍵。

  • 手機的劣勢: 手機大部分時間是在口袋裡,它是“盲”的。要使用AI,你需要掏出手機、解鎖、打開App、拍照或者輸入。這個鏈路太長,打斷了使用者的“心流”。
  • 穿戴裝置的野心: AI眼鏡或吊墜的真正價值,在於“Always On, Always Seeing”。它們與你的視線同步,擁有第一人稱視角。
  • 洞察: 誰掌握了使用者即時的“看”和“聽”,誰就掌握了AI主動服務的觸發權。AI硬體的本質,是把“離散的搜尋”變成“連續的伴隨”。

三、 發展模式:從“賣裝置”到“賣入口 + 算力 + 服務”

如果只看外形,很容易把 AI 小硬體理解成“多一個新品類”;但從商業上看,它們代表的是三種不同的路徑。

模式一:裝置優先——“AI 只是賣點”的手機廠商

絕大多數手機廠商都是這類,包括國產頭部 Android 陣營和 Apple。他們具備以下特徵:

  • 核心收入仍來自 硬體毛利 + 配件 + 傳統網際網路服務
  • GenAI 功能更多扮演“刺激換機”的差異化賣點,相機、翻譯、文生圖、總結等,強調“離不開的新功能”
  • 技術上,往往是 “端側小模型 + 雲端大模型” 的融合,用來平衡體驗與算力成本

這種模式的優勢在於管道、供應鏈和使用者基數,但風險在於,AI 容易被“同質化”,很快淪為參數大戰。

模式二:服務優先——裝置只是“大模型的外掛”

  • Ray-Ban Meta 眼鏡
  • 未來可能出現的“某大模型官方硬體”
  • 以及一部分國內 AI 眼鏡玩家,可能定位“AI 助理入口”,硬體利潤不高

這裡的邏輯是,使用者真正付費的是,持續更新的大模型 + 帳號身份 + 雲端算力 + 生態服務。硬體更多扮演“隨身麥克風 + 攝影機 + 顯示器”的角色,以分期、補貼甚至“半福利”形式發放

Humane AI Pin 雖然失敗了,但它嘗試的其實就是這種模式:699 美元硬體 + 24 美元月費,硬體只是進入其 AI 服務的門票。它的結局提醒我們,當你想“賣服務”時,前提是服務本身必須足夠好用、穩定,而不是讓使用者替你 beta。

模式三:生態優先——AI 終端是“超級 App”的物理延伸

這是目前中國廠商最有中國特色的一條路。舉幾個典型的例子:

  • 夸克 AI 眼鏡: 眼鏡只是入口,本質是把“通義千問 + 支付寶 + 淘寶 + 高德”等服務從手機螢幕延展到現實空間。
  • 小米 AI 眼鏡: 對標 Ray-Ban Meta,通過“小愛同學 + 家電 + 汽車 + 手機”建構“人車家”三端協同,眼鏡被定義為“面向下一個時代的隨身 AI 入口”。
  • 字節與豆包助手: 先通過接入多家手機廠商做系統級 AI 語音助手,從軟體層深度佔領手機入口,而不是立刻推出自有手機。

這類模式的核心命題是:如何在“AI 終端 + 生態”組合下,建構一個真正高頻、閉環的日常系統,而不是多一個孤立裝置。

四、 關鍵驅動因素 vs. 致命制約因素

驅動力(The Tailwind)

  • 端側算力的躍升: 高通驍龍8 Gen 3、聯發科天璣9300以及蘋果A17 Pro,NPU性能的暴漲讓70億參數(7B)的模型可以在本地流暢運行。這是保護隱私和降低延遲的基礎。
  • 多模態大模型(LMM): GPT-4o和Gemini 1.5 Pro展示了驚人的視覺理解能力。能“看懂”世界的模型,是AI硬體的靈魂。

制約力(The Headwind)

  • 熱力學定律(Thermodynamics): 這是物理學的鐵律。高性能計算必然帶來熱量。AI Pin的發熱問題直接導致了體驗崩塌。在電池技術沒有質變前,“算力、續航、輕便”是不可能三角。
  • 隱私這一頭“灰犀牛”: 相比手機,一個掛在胸前或架在鼻樑上隨時可能錄影的裝置,會引發巨大的社會排斥。Google Glass當年的失敗可能會重演。
  • 延遲(Latency): 語音互動的容忍閾值是毫秒級的。如果雲端往返需要2秒,對話的自然感就蕩然無存。

結語

AI 小硬體也許最終會收斂成“三個主終端 + 一個雲大腦”的格局。三個主終端是手機、眼鏡、耳機,“一個雲大腦”指的是個人 AI 代理的統一中樞。真正的 AI 終端時代,不是“每個裝置一個助手”,而是“一個助手,分身在所有裝置上”。

AI硬體的崛起,不是為了讓我們每人多帶一塊電子磚頭,而是為了讓我們把頭抬起來。真正的AI原生硬體,不應該是一個需要你不斷去“對話”的Chatbot,而應該是一個沉默的、全知的、僅在關鍵時刻提供服務的數字管家

在這場硬體革命中,“懂”比“快”更重要,“主動”比“響應”更關鍵。 (AI Xploring)