蘋果豪賭!神秘AI項目曝光,寧死不用輝達?自研晶片全家桶都要AI了


蘋果打死不用輝達晶片,竟還是源於曾經的一段 “舊仇” 。

最近一輪AI之戰,OpenAI、Google、微軟都交捲了,現在,全世界的目光齊刷刷看向蘋果。

全球開發者大會,就在6月上旬。選擇這個時機發佈新產品,蘋果勇氣可嘉。

被一眾競品搶盡風頭後,蘋果得拿出什麼重大突破來,才能證明自己在AI領域還能讓人興奮?

看起來,蘋果可走的路數不多了,所以外媒記者才意味深長地暗示:這次WWDC的主題應該是「迎頭趕上」,而非「超越」。

畢竟,在LLM上,繼ChatGPT和Gemini之後,蘋果早已失去了先發優勢;微軟面向開發者的CoPilot生態,也是XCode短時間內無法企及的。

和輝達的舊仇,也讓蘋果孤注一擲發展自研晶片,然而比起輝達GPU,M2系列在成本和實際應用性能上都有些差強人意。

硬氣的蘋果,無疑在進行一場豪賭。


蘋果,拚命追趕彭博社記者Mark Gurman發出了一篇爆料文,預測了蘋果即將在開發者大會上祭出的殺手鐧。

Gurman分析道,比較引人矚目的消息,就是蘋果和OpenAI CEO Sam Altman的合作了。

在WWDC上,雙方的合作夥伴關係很可能會昭告天下。

這就有點微妙了。一方面,這一舉動,相當於讓蘋果向公眾承認了,自己無法在AI最熱門的領域競爭,通過「曲線救國」,它倒是可以擁有最先進的聊天機器人,從而硬剛一波使用Gemini的三星。

另一方面,最近Altman的名聲不大好,OpenAI的公司結構看起來也不太穩定。


因此,蘋果根本無法對OpenAI作為iOS新功能的單一供應商感到放心。(這就是為什麼它還在和Google達成協議,把Gemini也作為備選)

根據預測,蘋果很有可能著重發力軟體方面,比如推出iOS 18、iPadOS 18、macOS 15等作業系統的更新。

iPad已經用上了最新的M4晶片,也許它會繼續被整合到Mac Pro和MacBook Pro中?

對於外界最關注的AI功能,蘋果將「另闢蹊徑」,推出「Project Greymatter」,重點關注普通人在日常生活中可以使用的工具,滿足使用者對於「實用」的需求。


一系列新功能將分佈在手機、平板和PC端,包括——

- 更靈活的主螢幕佈局、自訂app圖示顏色

- 語音備忘錄轉文字

- AI照片編輯

- 隨簡訊內容變化的自訂表情符號

- Spotlight搜尋更快速、精準

- Safari搜尋改進

- 郵件和簡訊的自動回覆建議

如果僅是這些功能,那就不免令人有些失望,畢竟,這些功能並不是革命性的,也很難吸引眼球,絕大部分都已經在Google或Meta的相關應用中存在。

OpenAI的GPT-4o語音最近雖然飽受爭議,但讓我們看到了語音助手可以擬人化、智能化到什麼程度。

於是,全網期待的目光落在了被傳和OpenAI合作的蘋果上。作為最流行的語音助手之一,Siri有望在功能和聲音上升級嗎?


也有預測稱,ChatGPT可能被植入到iOS18中作為聊天機器人外掛;同時蘋果也在「兩手準備」,和Google洽談Gemini的交易。

蘋果的AI戰略:資料中心、裝置、雲端運算

與此同時,SemiAnalysis的著名爆料研究員Dylan Patel和Myron Xie一起,剛剛發了一篇文章,全面分析了蘋果的AI戰略。

在這篇文章中,兩位記者提出了一個困擾著許多人的問題:蘋果在AI領域到底在做什麼?


要知道,現在全球都在瘋狂搶購輝達的GPU,然而蘋果卻沒有參與這一「囤貨」大潮。調查顯示,蘋果對GPU的採購微乎其微,連輝達的十大客戶都不是。

在WWDC大會前夕,各種傳言滿天飛。

兩位記者對目前的各路消息來了個彙總。

加大M系列處理器產量,還要做自己的AI伺服器

首先,有多個消息來源稱,蘋果今年將加大M系列處理器的產量,甚至達到創紀錄的水平。

所謂M系列處理器,主要指的是M2 Ultra,它由2個片上M2 Max拼接而成,被蘋果稱之為「UltraFusion」。(有趣的是,據悉蘋果的M3 Ultra被取消了。)


Ultrafusion指的是使用本地硅互連技術將兩個M2 Max晶片連接在一起。在軟體層面上,這兩個晶片被看作一個單一的晶片。M2 Ultra利用了台積電的InFO-LSI封裝技術。這與台積電的CoWoS-L概念相似,輝達的Blackwell和未來的加速器也將採用這種技術。要說蘋果和輝達兩種方法之間的唯一區別,就是蘋果的InFO是晶片先行工藝流程, 而輝達的CoWoS-L是晶片後行工藝流程,另外它們使用的是不同類型的記憶體

但是稍微仔細一想,就會發現:M2 Ultra的增產實在是很奇怪。

在需求上就完全找不到理由。M2 Ultra僅用於高端Mac Studio和Mac Pro,這些產品一年了都沒什麼有意義的更新,也沒聽說有哪個新產品要用到M2 Ultra。

總之,高端的台式PC和MacBook的需求都相當低迷,沒有任何跡象表明,有什麼消費需求能消耗掉這些裝置。

所以,蘋果究竟在下一盤什麼棋?


跟M2 Ultra的增產消息呼應的,就是華爾街日報和彭博社最近的報導——蘋果正在自己的資料中心,使用自己的晶片,為蘋果使用者提供AI服務。

另外,蘋果在擴建資料中心基礎設施上,也有著野心勃勃的計畫。

兩位記者發現,蘋果目前至少有7個資料中心,涉及到30多座建築,這還不包括計畫中的項目。結果就是,這些資料中心的總容量在短時間內,就會翻一番。


上圖是蘋果公司即將建成的最巨量資料中心。目前只有一個資料中心,但明年將有許多資料中心陸續建成

挖來基礎設施大牛

另外,蘋果還在幾個月內進行了一系列重大招聘,招兵買馬擴張基礎設施團隊。

比如,他們挖來了雲基礎設施領域的大牛Sumit Gupta,來操刀蘋果的基礎設施。


Gupta在2007年到2015年效力於輝達,參與了輝達進軍加速計算的初級階段。隨後他又入職IBM,再於2021年加入Google的AI基礎設施團隊,成為Google基礎設施產品經理,包括TPU和基於Arm的資料中心CPU。

Google和輝達算是目前唯二大規模部署AI基礎設施的公司,能挖來這樣的大牛,蘋果要做的事恐怕不小。


蘋果自研AI晶片

然而尷尬的是,M2 Ultra對於AI伺服器來說,恐怕並不是個好主意。

雖然業界普遍認為,蘋果的M系列晶片在AI性能上表現出色,但這僅限於裝置端的AI應用,伺服器上就不一定了。

現實的情況是,蘋果的競爭對手們在筆記本和台式電腦上使用的記憶體架構要差得多:現有的英特爾、AMD和高通筆記本,都只有128位的記憶體匯流排,而蘋果的記憶體匯流排寬度要遠遠吊打他們的CPU。


這就會導致這樣一種後果:雖然其他筆記型電腦可以配備與蘋果記憶體頻寬相當的輝達GPU,但是輝達採用的是成本較低的GDDR6記憶體架構,而蘋果採用的是高成本的LPDDR架構,這就需要更寬的匯流排、更大的晶片邊緣面積。

這就讓輝達GPU受到了限制,它無法在記憶體中放下蘋果CPU能夠容納的高級模型,比如Llama 3-70B。雖然蘋果的每GB成本實際上更低,但LPDDR的記憶體容量太高。

這種優勢並不能延伸到雲端的AI性能。裝置端主要關注模型是否能夠運行,而云端則更關心經濟性。

在雲端,雖然原始頻寬和容量很重要,但FLOPS的數量更關鍵,因為許多使用者通過批處理同時服務。高批處理大小,可以將推理成本(tokenomics)降低到10倍以上。

這樣的結果就是,M2 Ultra就像是一個糟糕社區中最好的一棟房子,它無法與資料中心其他GPU很好地協同。

不僅記憶體頻寬方面落後於競爭對手,但更重要的差距,在於其FLOPS較少,導致並行使用者數也大大減少。


Apple GPU中擁有的FLOPS數雖然極少,但幸運的是,好在他們還有神經引擎。

在蘋果裝置上運行LLM的一種策略,是將多層感知器(multi-layer perceptron)運行在神經引擎上,同時將注意力機制(attention mechanism)運行在GPU上。

不過需要注意的是,這裡還是存在一個頻寬問題,所以在總FLOPS方面,結果並不理想。

而且,就算我們能神奇地將GPU和神經引擎的FLOPS相加,性能仍然比資料中心GPU差了35倍到85倍。這意味著實現高批處理大小的能力有限,每個晶片服務的使用者數量也會大幅減少。

對於Llama 3-70B,M2 Ultra的每個晶片能服務4-6個使用者就算走運了,然而GPU卻常能實現64或更多的批處理大小。

靠成本能彌補嗎?

而且,目前我們還沒有分析最重要的變數之一——成本。

採用自研M2 Ultra,蘋果就無需支付商用硅或者定製設計合作者的高額利潤了。


計算下來, 兩個M2 Max晶片、InFO-L封裝和192GB的LPDDR,成本大約在2000美元左右。相比之下,H100的成本達到了10倍之多。

但同時也要考慮到超過10倍的性能差異。即使對於Llama 3-70B這類模型,蘋果也很難讓M2 Ultra具備很高的成本效益。

此外,當模型規模超出單個晶片時,這種情況並不適用。

計算並不是簡單地線性擴展,尤其是M系列的SoC並不是為這種擴展設計的。

晶片間唯一的互連是UltraFusion橋,將兩個M2 Max結合成一個M2 Ultra。但這與輝達的NVLink的高速Serdes晶片間擴展完全不同。


雖然蘋果晶片在單位美元下能提供相當可觀的總計算量,但是和直接購買輝達GPU相比,也沒差太多。

因為所有的浮點計算無法被整合到單一叢集中,模型推理會被降級到以人類語速運行,規模上限是Llama 3同等大小,無法運行千億參數模型。

為什麼要自研晶片?

理性原因

如果蘋果只是為了提供更好的Siri,自研晶片有點誇張。但實際上,蘋果的目標遠不止於此。

他們的目標是將所有資料、服務與AI整合在一起,這意味著從裝置端到雲端,從底層計算、作業系統到應用程式和資料,使用者都會有無縫銜接的流暢操作。

這種願景符合蘋果一直以來對於使用者體驗的追求。但這不僅需要強大的AI計算性能,還需要從晶片到軟體的高度垂直的完整技術鏈。

比如Siri可能需要在雲中運行,在手機或者Apple Watch上應答,同時保證強大功能、高速通訊和流暢互動。

其中的另一個賣點在於,蘋果會在自己的資料中心處理使用者資料,而不是傳送到第三方雲服務,保護資料的隱私和安全。

非理性原因

但搭建自己的資料中心需要大量晶片和伺服器,輝達作為全球首屈一指的公司,完全可以提供所有高性能計算的基礎設施,自己從頭開始顯然不是最優解。

這看起來不太理性的商業決策,確實蘊含著一些情感因素,這裡就牽扯到蘋果和輝達的一樁舊怨了。

雖然如今輝達已憑「毫無瑕疵的工程執行力」封神,但過去的輝達,也曾犯下不少重大的工程錯誤。

最大的一個,就是2006至2009年間的「bumpgate」醜聞。


在那段時間裡,輝達的整個55nm和65nmGPU系列由於高熱量和糟糕的封裝設計,早期故障率極高,超過40%。晶片和封裝基板之間的凸點由於應力容易破裂,導致故障率完全不可接受。這是因為,輝達選擇了一種Tg過低的劣質填充物,因此在操作循環期間的高溫下無法正確支撐凸點,導致了它們的疲勞

這就影響了GeForce 6000、7000、8000和9000系列,以及各種移動晶片組。

蘋果、Dell和HP出售的含有輝達晶片組的筆記本,全部受到影響。而糟糕的,就是輝達的處理方式。起初,它拒絕承擔責任,蘋果、Dell和HP怒而對輝達提起集體訴訟,迫使輝達同意更換已售出的有缺陷GPU。

從此,蘋果和輝達的關係可以說是徹底破裂,輝達再也沒有被設計進任何一份蘋果產品中。

甚至,蘋果不惜選擇性能和功耗更差的AMD GPU,甚至和AMD合作開發了一款在筆記本中使用HBM的定製GPU。

所有這些歷史包袱,都會讓蘋果對再次依賴輝達,感到心裡打鼓。



蘋果「芯」的未來

M2 Ultra推出只是蘋果給出的一個臨時的解決方案,並在逐步開發更強大的晶片。

不過,目前M3 Ultra已在內部取消。

M4 Ultra還未投入生產階段,甚至可能會被擱置,成為下一個夭折的產品。

而目前,這些晶片還沒有針對大模型所需的計算完成最佳化,其神經引擎結構頻寬嚴重不足,需要加以改造,才能適配。


不過,蘋果並不會去依賴其他晶片供應商,去幫助自己開發AI晶片。

我們可能看到,蘋果授權使用高速序列通訊(SerDes)技術,去設計開發資料中心的專用晶片。

但,這一過程還需要數年的時間,目前還處於構想階段。

因此,在今年和明年,我們仍將看到蘋果Macbook和Mac mini上,使用增強版的蘋果晶片。

在AI PC時代「迎頭趕上」

在大模型方面,毋庸置疑,蘋果目前的成果無法和GPT、Gemini或者Claude等系列相提並論。

然而,繼微軟提出AI PC之後,可以預料到,AI與硬體和作業系統進行更深度的整合是大勢所趨。

蘋果想要繼續走在智能硬體的前沿,就必須拿出有競爭力的AI模型,提供符合「蘋果風格和價值觀」的AI服務。

然而,他們似乎並沒有儲備足夠的算力和AI人才來訓練自己的AI大模型。

雖然App Store已經提供了ChatGPT應用的下載,但作為一個傾向於高度垂直整合的公司,做到這一步遠遠不夠。

彭博社披露稱,蘋果已經與OpenAI達成協議,並正在和Google、Anthropic討論,也許這類成熟的模型會直接被整合、封裝在在蘋果裝置上,並使用與蘋果品牌形像一致的系統prompt。

另一個值得關注的方面是搜尋功能。

Google每年向蘋果支付200億美元,換取Chrome作為蘋果的默認搜尋引擎。但這其實是一個雙贏的交易,從龐大且有錢的蘋果使用者身上,Google用搜尋中的廣告收入賺回這筆錢綽綽有餘。


但隨著ChatGPT、Llama與Claude相繼發力向搜尋工具轉型,蠶食Google在搜尋引擎方面的巨大市場份額,這種穩定的商業模式或許會發生改變。

歸根結底,蘋果不能只滿足於硬體供應商的地位,無論其他公司的AI模型有怎樣的進展,它至少要保持「迎頭趕上」的節奏。

僅僅在App Store上線各種AI模型和應用會讓它失去控制權,失去在資料和隱私方面的品牌原則,也錯過生成式AI可能帶來的使用者增長和廣告收入。

此外,和微軟的AI PC全部在本地運行AI推理不同,蘋果的「Project Greymatter」採用混合的工作方式——

大部分計算強度較低的 AI 功能在裝置上完成,但如果需要更多算力,則將被推送到雲端。

這項服務一經推出,很有可能在短時間內迎來大規模流量湧入,這對蘋果的AI基礎設施會是一個考驗。

雖然在AI之戰中短暫落後,但蘋果有一個不能忽視的獨特優勢——龐大的忠實使用者群。

一旦發佈AI功能,全球的數億台蘋果裝置,都可以在短時間內更新,並提供給使用者試用。

在未來某個時間節點,蘋果可能一夜之間成為全球AI競技場上最大的玩家。 (半導體產業縱橫)