蘋果被大模型打得措手不及


顯然,蘋果沒有料到大模型的出現!

2023來,輝達憑藉其AI硬體業務的強勁表現,實現市值6.3倍成長,達到2.36兆美元。 ChatGPT、Sora等生成式AI的發布,更讓科技業邁入全新的發展階段。

在可預見的未來,AI的重要性日益顯現。未能有效掌握AI發展機會的科技企業將面臨被市場淘汰風險。在美股「七巨頭」中,唯獨蘋果在AI佈局上表現極為謹慎,備受外界關注。

3月20日,庫克在微博稱自己到訪上海,此行的目的之一是參加Apple靜安店的揭幕儀式。據悉,這家直營店的規模全球第二。儘管庫克外灘散步,並品嚐了上海的早餐,但此刻他並不輕鬆,因為眼下的蘋果飽受爭議。


3月21日,美國司法部和十幾個州的總檢察長對蘋果公司提起了反壟斷訴訟。隨即,蘋果股價低開低走,收跌4.09%,收在171.37美元,創下自2023年8月4日以來的最大單日跌幅。其市值一夕之間蒸發超過1100億美元。

業務方面,根據市場研究機構Counterpoint Research最新數據顯示,今年前六週,iPhone在中國銷量較去年同期下降24%,整體排名第四。根據蘋果2024第一季度財報數據,大中華地區該季度營收為208 億美元,年減13%。

產品佈局方面,蘋果發售了XR穿戴裝置“Vision Pro”,雖然發售當日加價6萬,但如今已因體驗不成熟而跌破發行價,引發退貨潮。

籌備10年,投資超過100億美元的蘋果「泰坦」造車計畫也被取消,大部分汽車團隊成員將被轉至人工智慧部門,取消造車的原因我們在文章《蘋果這次遙遙落後》做了分析,這裡不多贅述。

外界普遍認為,蘋果若想繼續保持領先地位,關鍵在於其AI領域的佈局成果。天風國際分析師郭明錤曾評論指出:如果蘋果今年無法推出優於市場預期的生成式AI服務,那麼輝達的市值很可能將超越蘋果。

我們認為,蘋果在人工智慧技術並不是毫無準備,但以OpenAI為主的生成式AI發展如此迅速,讓蘋果始料未及。顯然,蘋果是落後於AI發展的時間線了,為了安撫投資者與用戶,庫克在上海期間也再次強調:「蘋果的生成式AI,在今年稍後會有新聞宣布」。


蘋果的AI路

1985年,賈伯斯在瑞典隆德大學演講:「我希望有一天,當下一個亞里斯多德出現時,我們可以用一台電腦捕捉亞里斯多德的基本智慧。這樣,後代的學生就可以向亞里斯多德提問,並且可以得到答案」。

賈伯斯幾乎預見了大模型技術的崛起,並堅信人工智慧將為蘋果公司帶來遠大前景。 Siri是由賈伯斯主導,蘋果公司對人工智慧最早的探索,但在庫克時代,蘋果在人工智慧領域的發展步伐卻有所減緩。

蘋果AI的發展可以分為三個階段:

Siri階段

2010年,蘋果以2億美金收購了「Siri」項目,並將其發展為串聯蘋果生態的智慧語音助理。 Siri發布的同時,正逢科幻電影《鋼鐵人》大熱,其中的人工智慧「賈維斯」彷彿就是Siri的完全體,讓用戶無限期待。

然而,儘管Siri已經歷了長達14年的迭代更新,但用戶對其的評價卻相當糟糕。 Siri幾乎未展現出明顯的進步或提升,其功能仍主要局限於查詢天氣、設定鬧鐘、講述笑話等簡單任務。在面對更複雜的對話場景時,Siri往往無法妥善處理,轉而直接跳轉至搜尋網頁。此外,Siri在語言的辨識以及句式的理解上也存在較大缺陷,因此常被戲稱為「人工智障」。

Siri表現不佳的原因其實並不難以理解,要實現Siri內容更豐富、功能更全面、個人化更出色,必須不斷深入收集與分析用戶的錄音與行為資料。對於蘋果而言,其一直將用戶隱私保護作為產品力的核心,因此,這樣的升級將與其產品概念產生較大的衝突。

2019年英國《衛報》報道稱,一名檢舉者向他們透露,蘋果用Siri記錄用戶說話,引起軒然大波。這是因為蘋果使用外包團隊收集相關數據以對Siri進行最佳化。蘋果最終用全職員工取代了外包商,並且修改了相關規定,普通員工很難聽到Siri的對話錄音。

所以,Siri回答用戶時只能在預設的資料庫中尋找答案,《紐約時報》曾報道稱,Siri簡單添加單字需要長達六週的時間,這讓Siri難以即時優化與迭代,逐漸遠離人工智慧概念。

「仿生」階段

蘋果仿生晶片自2017年起沿用至今,它最早誕生於iPhone X/8/8Plus的A11 Bionic處理器。它是手機處理晶片中增加了一個AI運算加速內核,又稱為NPU(嵌入式神經網路處理器)。

這塊獨立核心主要負責語音、影像、視訊的辨識工作,iPhone中的多項功能都依賴其運作。舉例來說,它能夠依據照片標籤自動生成回憶視頻;快速提取照片中的圖像與文字訊息;根據用戶的使用習慣優化任務處理速度;實現面部解鎖準確性提升等。這些功能的強大之處在於,它們均基於本地運算得以實現,無需依賴外部伺服器,從而確保了用戶資料的安全與隱私。

也因為名為仿生(bionic),彼時外界普遍認為這是一顆人工智慧晶片。

實際上,仿生晶片特殊之處在於運算時不會幹擾到CPU和GPU的正常運作,能在極低的功耗下瞬時為使用者完成運算。但從另一個角度來說,這只實現了“人工”,並沒有實現“智能”,真正的智能應該是具有自我學習能力,而不是預設的計算方式。值得一提的是,高通在2017年也推出了具有神經網路系統的SOC-驍龍845。

「空間計算」階段

庫克在2023 年的WWDC主題演講中表示:「空間運算將數位內容與實體世界無縫融合,同時允許使用者保持存在並與他人保持聯繫」。顯然,此時蘋果是相信未來是屬於MR設備所打造的元宇宙的。

蘋果在2017年的IOS 11上首次展示了AR概念,並發布了AR開發工具ARkit。配合首發於iPad Pro的LiDAR雷射雷達,用戶能將原本不切實際或天馬行空的想法呈現眼前。隨後,蘋果陸續推出空間音訊、擴增實境等功能,最終這些線索被今年發售的Vision Pro所串聯。


蘋果對感測器技術的運用頗為倚重。初代iPhone雖未配備鍵盤、3G功能以及自拍鏡頭,卻搭載了距離感應器、光線感應器甚至加速度感應器等先進組件。這些感測器的運用使得iPhone在智慧化層面上遠超過當時市場上的其他手機產品。

蘋果致力於透過感測器與演算法技術,淘汰傳統的互動邏輯。 iPhone的推出,成功讓手機擺脫了手寫筆和鍵盤;空間運算領域,蘋果期望能夠突破螢幕與手持裝置的限制。而在汽車領域,蘋果更是寄望大量感測器與先進運算技術的結合,使用戶在未來能夠擺脫方向盤的束縛,實現真正意義上的自動駕駛。

因此,蘋果汽車專案同樣是感測器與演算法技術應用的典型案例。儘管蘋果在造車項目上歷經波折並最終放棄,但在相當長的一段時間內,蘋果積極收集了大量相關專利。除了眾所周知的自動駕駛技術外,蘋果還探索了更前沿的技術領域,如擴增實境顯示導航;利用雷達產生周圍高解析度資訊;估算道路表面摩擦係數的方法;根據交警手勢判斷交通狀況以及車輛自主接入電源等。

讓設備透過感測器了解用戶,透過深度學習演算法為用戶提供所需的支持,這是蘋果對「人工智慧」的理解。 MR、空間運算是蘋果認為的科技發展大方向,也是蘋果對科技整合的最終階段,在「機器之心」對蘋果收購案的整理中,也能印證這點。



措手不及的蘋果

蘋果公司歷來高度重視自己的品牌形象。自從庫克執掌蘋果以來,始終堅持只將成熟的技術呈現給用戶,即便某項技術備受市場矚目,也不會輕易上馬。穩健的市場策略確保了蘋果在產品與生態建構上保持極高的專注。

蘋果是相信人工智慧的,只不過它是以收集數據和設備協同的方式來實現這一點。而生成式AI的出現似乎不在蘋果的理解範圍之內,目前來看,當AI能夠理解語言後,其學習能力已經不能以對待機器人的眼光去看了。

從蘋果近期的行動來看,似乎也沒有坐以待斃,根據市場調查機構Stocklytics最新報告披露,截止2023年,蘋果總共收購了32家AI公司,是科技公司中收購數量最多的。現在的蘋果似乎既怕趕不上AI大模型的熱潮,又怕在發展過程中壓錯注。

媒體報導下的蘋果AI同樣撲朔迷離,今年初,蘋果被曝光已經開始研發AI大模型,代號為Ajax,蘋果內部稱之為Apple GPT,擁有2000億參數的Apple GPT可能與OpenAI最新的大模型性能相當。

但近日,在網站arXiv中,蘋果上新了一篇名為《 MM1 : Methods , Analysis & Insights from Multimodal LLM Pre-training 》的論文,其中他們公佈了名為MM1 的基礎大模型,其中最大規模的只有300億參數。相較之下,GooglePaLM大模型擁有5,400億參數,OpenAI的GPT-4更是被猜測擁有1.7兆參數。

甚至據知名蘋果爆料人Mark Gurman稱,蘋果正在和谷歌洽談“將谷歌Gemini Nano植入iPhone事宜”,谷歌Gemini Nano也是三星手機使用的端側大模型。

目前外界對蘋果大模型的說法層出不窮,在官方沒有公佈之前,很難斷定蘋果最後會以什麼方式入局。我們認為,蘋果在大模型佈局上的進度相對緩慢主要是以下兩點原因:

1.大模型to C應用場景的空白。

包括Chat-GPT在內,大部分生成式AI大模型仍圍繞著網頁對話框,對於普通用戶來說,本質上還是一個更「智能」的私人助理或聊天機器人,如果大模型的作用只是給Siri升個級,蘋果無須大費周章。

與其他巨頭不同,蘋果是更面向用戶的科技公司。儲備相關技術,並尋找將其轉化為優質用戶體驗的切入點,這才是蘋果一貫的產品想法。

2. 難以權衡用戶隱私性。

Siri專案不只一次引發用戶對隱私問題的擔憂,而大模型的訓練更會如此,蘋果作為一家特別強調用戶隱私安全性的科技公司,自然要將生成式AI大模型的應用建立在保護用戶隱私的前提下。

蘋果與OpenAI等公司的差異在於,蘋果的AI大模型旨在服務全球22億台蘋果設備的用戶,自然要針對性地收集用戶資訊並進行個人化訓練。蘋果要考慮拿出什麼樣的隱私解決方案,目前最好的方法就是放入一個端側的本地大模型,但這是否能帶來突破性的體驗尚未可知。


大模型應用場景的一些預測

首先,我們認為生成式AI大模型的核心優勢在於打造各行業的“超級工具”, 類似於Sora在影視行業中所展現出的深遠影響力。經過對每個產業內容的深度訓練,大模型能夠顯著提供精準、高效的解決方案,從而成為推動產業發展的強大引擎。

其次,大模型對於To C場景而言,可想像的空間十分豐富,無論是提供使用者多元化的教育資源,或是進行精準的金融分析,或是實現個人情緒疏導,大模型都能依託其龐大的資料庫進行個人化訓練,但實現這些功能最大障礙依然是隱私安全問題。

蘋果並非完全不在用戶手機中收集數據,實際上,蘋果用戶可以透過存取「iPhone-隱私與安全性-分析數據」來查看被收集的大量數據。然而,蘋果採用了差分隱私演算法,確保即便在收集資料的過程中,蘋果也無法確定這些資料具體來自哪支手機。目前,該演算法主要收集硬體和效能統計等資訊。

因此,我們期待蘋果能夠妥善解決大模型訓練與隱私保護之間的矛盾,進而為用戶構建一個功能全面的AI助理,或AI分身,協助用戶高效處理工作、生活事務。同時,也存在蘋果憑藉其M系列處理器開創全新AI領域的可能性,因而成為融合用戶、軟體、硬體於一體的綜合AI公司。

目前市場中儘管已有眾多手機應用了AI大模型技術,但尚未有能夠撼動iPhone市場領導地位的產品出現。 iPhone在華銷售額的下跌,並非完全歸咎於AI技術的欠缺。因此,從蘋果積極收購大量AI公司,並將其巨額投入的造車團隊轉移至AI項目等措施來看,蘋果顯然已經明確了自己的AI發展策略與方向。

接下來,人工智慧領域能否迎來“iPhone時刻”,或者這僅僅是蘋果公司在面臨困境時的倉促之舉,預計在今年6月的WWDC中,我們就能夠窺見一二。(蔚然先聲)