#GOOGLE
Google財報告訴你AI是不是真未來?
本文繼續聊AI類股美股的另一個大牛——Google。聊輝達的時候,微哥說過,這一輪AI大爆發,首先的爆點是大語言模型,而大語言模型的爆發靠的是三要素,一個是神經網路演算法,一個是巨量的網際網路資料,一個是算力爆發。這三要素中的算力爆發的最大貢獻者,是輝達。三要素中的神經網路演算法,我們知道是被譽為AI之父的辛頓提出來的,也拿了圖靈和諾貝爾獎,而大模型之所以成功,還有Google演算法團隊的重要貢獻。為什麼這麼說呢?這一點微哥還是有點發言權的。因為微哥在工作中會用到很多人工智慧演算法,所以也會瞭解學習這些演算法發展的歷程極其對應的文章。雖然辛頓最早提出了神經網路演算法,但是目前大模型用的模型演算法架構,相比較辛頓提出來的那個版本,那已經升級改造了不知道多少個版本了。在這一過程中,目前大語言模型用到的最核心的Transformer架構,就是Google的研發人員提出來的。第一個大語言模型Bert,也是Google做出來的。第一個把圖像用於Transformer架構,從而使得大語言模型變成現在的多模態大模型,也是Google提出來的。所以從這裡可以看出來,Google對於大模型的誕生和發展,起到了很重要的工程作用。雖然第一個大語言模型ChatGPT是Open AI做出來的,但是業內人士都知道,Open AI的很多AI人才,都是從Google挖過去的。而且Google在大模型上的能力,很快就通過Gemini 3追了上來。這還是源自於Google在AI領域長期的資源投入,特別是人才的投入,使得其在AI領域的積累,很快就得到了體現。這也叫厚積薄發。比如大家熟知的Google做的AlphaGo擊敗了世界圍棋冠軍李世石。精準預測蛋白質結構,解決生物學50年難題的AlphaFold,還讓Goolge Deepmind老大哈薩比斯拿到了諾貝爾。這些工作,都可以體現出Google的AI能力,是全球首屈一指的。所以這也是這一輪AI革命到來,包括巴菲特、段永平、李錄、但斌、邱國鷺等投資大佬們紛紛加倉Google的一個很重要的原因。Google確實是一家對利潤之上還有追求的高科技公司,我們都知道,他是一家做搜尋發家的公司,當然現在的業務基本盤也仍然是搜尋。但是他還做了很多其它的工作,除了前面說的AI,我們現在所有非蘋果手機用的作業系統Android,也是出自於Google的免費開源。之前輝達文章說了,輝達AI產業鏈中上游賣基礎設施的。中下游無論行不行,都要買輝達的基礎設施。而Google是既處於AI產業鏈的上游,也處於產業鏈的中游,當然也有產品涉及到下游的。上游是因為Google雲,因為Google雲是給所有AI應用提供算力服務的。當然Google也要買輝達的裝置,但是資料中心的建立,是由Google這類雲廠商去做的。未來使用者買的token(AI算力的最基本單位),都是雲廠商提供的。除了買輝達的晶片,Google也在自己做,比如TPU就是非常有名。當然TPU當下主要是自用。中游就不用說了,Gemini這個大模型也是讓Google能夠後來居上,甚至略超ChatGPT的產品。當然大模型的版本也在不斷迭代和競爭之中,鹿死誰手,還未可知。但是大機率是有Google的一席之地的。下游比如Google眼鏡之類的智能硬體,當然這一塊還不怎麼賺錢啊。但是未來可能會大爆發。輝達的業績已經充分體現了AI類股,至少上游基礎設施建設上是沒有泡沫的,是有業績支撐的。那麼本文我們看看Google,作為AI類股應用最最重要的領導者,AI在Google2025年財報中有那些體現?是不是真的有泡沫呢?整體業績出色2026年2月,Google母公司Alphabet發佈2025年第四季度及全年財報,這份年報是Google生成式AI全面商業化元年裡,科技巨頭交出的最具代表性的答卷之一。Google第四季度,營收1138.28億美元,同比增長18%;淨利潤(非GAAP和GAAP一致)344.55億美元,同比增長30%。全面超出華爾街預期。全年營收首次突破4000億美元大關,達到了4028.36億美元,同比增長15%;淨利潤(非GAAP)達1402.8億美元,同比增長35%。GAAP淨利潤為1321.70億美元,低於非GAAP淨利潤,核心差異來自:剔除了歐盟反壟斷35億美元一次性罰款、Waymo自動駕駛業務21億美元一次性員工股權激勵費用、併購相關無形資產攤銷等非經營性、非經常性支出。分季度來看,公司營收增速逐季加速,Q1-Q4營收分別為902億美元、964億美元、1023億美元、1138.28億美元,同比增漲14%、15%、16%和18%。這個資料增速雖不如輝達那般炸裂,但也是很漂亮的,特別是那麼大體量,還能有這麼快的增速,而且淨利潤增速遠超營收增長。盈利增速遠超營收增速,核心源於兩方面:一是AI技術落地帶來的廣告變現效率提升,二是規模化效應下成本控製成效顯著,公司全年營運利潤率穩定在32%的行業高位。回顧過去5年,Google的營收是一直增長的,淨利潤除了2022年下滑之外,其餘年份都是增長的,且增速還不低。5年時間,營收增長1.6倍,淨利潤增長1.8倍,這麼大的體量,這個增速,還是非常可觀的。大象仍然在飛舞。所以千萬不要覺得,一個公司體量太大,就沒有增長空間了,其實不然,一定要認真去研究。就像邱國鷺說的,價值投資,不要去追星星,而是找月亮。大公司,各方面都很強的時候,即護城河足夠深的時候,往往還會有一定的成長空間,在便宜的時候介入,是很不錯的投資機會。Google2025年這份財務資料證明,Google並未因AI的巨額投入陷入“增收不增利”的困境,反而實現了技術投入與商業回報的正向循環。此外,2025年公司全年經營活動現金流淨額達1640億美元,自由現金流725.5億美元,期末現金及短期投資規模超1800億美元,無短期有息債務壓力,為AI技術研發、基礎設施投入提供了充足的安全墊。尤為值得關注的是Google的資本開支,2025年Google全年資本開支達914.47億美元,同比增長77%;2026年資本開支預計將達到1750-1850億美元,同比接近翻倍,其中60%將投向伺服器(含TPU晶片),40%用於資料中心及網路裝置建設,重點支撐AI基礎設施擴張與雲業務全球佈局。這就是輝達業績巨好的原因之一,雲廠商在瘋狂的砸錢搞AI,建資料中心。這麼巨額的資本開支,是非常罕見的。相當於把一年的淨利潤全部砸向AI,還把去年的資本積累也砸進去,可見科技巨頭們是多麼看好AI啊。所以AI在Google身上目前看來除了砸的錢多之外,業績上還是有幫助的,所以所謂泡沫,沒什麼好擔心。畢竟AI革命才剛剛開始,未來的想像空間確實非常大。AI技術從概念落地為核心增長動力,Google雲完成規模化盈利的關鍵跨越,同時公司以翻倍的資本開支計畫,宣告了All in AI的長期戰略決心。分業務看Google的業務主要包括Google服務、Google雲和其它的前沿業務,絕對核心就是Google服務,包括Google搜尋及其他廣告業務、YouTube生態。(一)Google服務:絕對核心壓艙石,AI啟動傳統業務新活力Google服務類股2025年全年營收約3370億美元,佔公司總營收的83.6%,營業利潤約1280億美元,佔總營業利潤的99.2%,始終是公司的現金牛核心。該類股的增長核心源於AI對傳統業務的深度改造,打破了市場對 “搜尋廣告進入成熟期” 的悲觀預期。細分業務中,Google搜尋及其他廣告業務是核心中的核心,全年營收2245.3億美元,同比增長13.3%。第四季度營收630.73億美元,同比增長17%,增速較上年顯著加快。增長的核心驅動力是Gemini大模型對搜尋體驗的全面重構,AI概覽與AI 對話模式顯著拉長了使用者會話時長,AI模式下的使用者查詢時長達到傳統搜尋的3倍。美國市場日均AI模式人均查詢量自發佈以來實現翻倍,極大地拓展了廣告庫存的展示機會,同時AI驅動的推薦演算法顯著提升了廣告轉化率,吸引了零售、旅遊等垂類廣告主的強勁投放。YouTube生態實現里程碑式突破,2025年全年廣告+訂閱總收入突破600億美元,第四季度廣告營收113.83億美元,同比增長9%,付費訂閱使用者總量達3.25億。其中,YouTube Premium、NFL賽事版權訂閱帶動訂閱業務高速增長,Shorts短影片的流量規模與單小時變現效率持續提升,形成了“廣告+訂閱”的雙輪驅動模式,成為Google服務類股的第二增長極。此外,Google訂閱、平台及裝置業務全年同比增長17%,Google One雲端儲存、硬體生態的協同效應持續增強,使用者付費粘性穩步提升。(二)Google云:爆發式增長領跑,AI驅動規模化盈利拐點確立Google雲是2025年年報中最亮眼的類股,徹底完成了從“虧損燒錢”到“規模化盈利+高增速增長”的轉型,成為公司最核心的增長引擎。全年Google雲營收608億美元,同比增長36%,第四季度營收176.64億美元,同比激增48%,增速遠超公司整體業務水平。特別是盈利端,Google雲全年營業利潤139億美元,同比大幅增長128%,全年營業利潤率升至24%,第四季度單季營業利潤率突破30%,較上年同期提升超12個百分點,規模化盈利的拐點完全確立。增長的核心驅動力完全來自AI,第四季度基於Google雲生成式AI模型的產品收入同比增長近400%,Gemini企業版解決方案、AI基礎設施服務的企業需求爆發。全年超10億美元的大額交易數量超過此前三年的總和,截至年末未履行訂單規模達2400億美元。目前已有超12萬家企業使用Gemini模型,全球前20大SaaS公司中95%都在使用Google雲的AI服務,Google雲憑AI差異化優勢,正在持續縮小與AWS、微軟Azure的市場份額差距。全球雲市場市佔率如下表,Google雲雖然排名第三,與前兩名有差距,但是增速最快。這裡就可以真正看出來AI是在實實際際的在為公司雲業務創造價值。此外,插個題外話,阿里雲其實雖然是國內老大,但是相比較前面三位大咖,還是很小的。(三)其它的前沿業務:前沿探索持續投入,商業化處理程序緩慢以Waymo自動駕駛為核心的Other Bets類股(還有生命科學Verily、量子計算、智慧城市等前沿領域),2025年全年營收3.7億美元,同比下降8%,依然處於長期投入、商業化緩慢的階段。Waymo作為全球自動駕駛行業的領軍者,2025年實現了規模化擴張,已在美國6個城市落地自動駕駛出行服務,周均載客量超40萬人次,2026年計畫登陸倫敦、東京等海外市場,開啟全球化商業化處理程序。該類股是Google佈局未來的核心抓手,在量子計算、AI醫療、機器人等前沿領域的持續投入,為公司長期增長儲備了第二增長曲線,也延續了Google“登月文化”的創新基因。潛在風險這份年報既展現了Google在AI時代的強大競爭力,也暴露了其面臨的四大核心風險。其一,全球監管與反壟斷風險持續高企,作為全球搜尋、廣告與Android生態的絕對龍頭,Google在歐盟、美國、印度等市場持續面臨反壟斷調查,若未來出現巨額罰款、強制業務分拆等不利裁決,將直接衝擊其核心商業模式。其二,行業競爭持續加劇,在AI大模型領域仍面臨OpenAI、Meta的激烈競爭,搜尋業務面臨微軟Bing+ChatGPT的持續挑戰,雲業務市場份額仍顯著落後於AWS與Azure,巨頭間的AI軍備競賽將持續推高投入成本。其三,巨額資本開支的回報不確定性,2026年近1800億美元的資本支出已超過2025年全年經營性現金流,若AI商業化進度慢於預期,將顯著壓制公司利潤率與自由現金流水平。其四,業務結構單一風險仍未完全化解,2025年廣告收入佔公司總營收的比例仍超73%,宏觀經濟波動對廣告主預算的影響,也會給公司業績帶來不確定性。總結整體而言,2025年是Google從“全球搜尋巨頭”向“AI全端科技巨頭(“模型-基礎設施-產品-商業化”)”轉型的關鍵一年,這份年報證明了Google不僅擁有AI時代的核心技術能力,更具備將技術轉化為商業回報的成熟體系。同時以超預期的資本開支計畫,宣告了其在AI時代的長期競爭決心。儘管面臨監管、競爭與投入回報的多重挑戰,但憑藉深厚的技術積累、龐大的現金流儲備與全場景的產品生態,Google依然是AI時代最具競爭力的科技巨頭之一。後續業績核心,將取決於AI技術的迭代速度與商業化落地的最終效率。對於Google,微哥也會持續保持關注和分享。這些巨頭們財報後的資料,對於我們看AI發展會起到非常非常重要的作用,而不是盲從。 (微微價值投資)
Google扔出技術核彈,記憶體需求將崩塌?
全球AI算力競賽出現重大技術拐點!近日,Google公佈的全新AI內存壓縮技術“TurboQuant”,引發了業界的極大關注。該技術宣稱能在不犧牲模型精準度的前提下,將生成式AI推理階段最吃資源的“鍵值快取”(KV Cache)空間需求減少到原來的1/6,並讓計算速度暴增8倍。這一突破性的技術,也引發了整個市場對於記憶體需求將斷崖式下跌的擔憂,美光、Sandisk、西部資料等儲存相關美股紛紛大跌。TurboQuant究竟是什麼?在LLM(大語言模型)推理過程中,為了處理長文字,系統必須將過往對話資訊存放在KV Cache中,這如同AI的“隨身筆記本”。隨著對話長度增加,這本筆記本需要儲存的資訊會迅速擠爆AI GPU的高頻寬內存(HBM),成為AI運行的最大瓶頸。Google的TurboQuant技術的核心優勢在於解決了傳統記憶體壓縮技術產生的“內存噪聲”(Overhead)。該技術由兩大關鍵部分組成:PolarQuant(極坐標量化):傳統向量以XYZ坐標標註,運算繁瑣。Google改為採用“極坐標”邏輯,將複雜的方位簡化為“半徑”與“角度”。這好比將原本要標記“往東走3公里、再往北走4公里”的資訊,簡化為“以37度角走5公里”。這種幾何結構的轉換,大幅減少了資料處理的負荷。QJL(Quantized Johnson-Lindenstrauss):這是一套極其精簡的1bit數學校正機制。僅利用額外的1bit來精準修正壓縮過程中的殘餘誤差,讓模型即使被壓縮到僅剩3bit,在LongBench等多項基準測試中仍能達成“零精度損失”。△在Llama-3.1-8B-Instruct模型上,TurboQuant 在LongBench基準測試中展現出強大的 KV 快取壓縮性能,優於各種壓縮方法 (括號中標明了位寬)。Google選擇將這套足以成為核心競爭力的技術完全開源,不僅最佳化了Gemini等大型模型的檢索效率,更為其他大模型減少對於記憶體依賴,加速端側AI發展鋪平道路。根據實測,在輝達(NVIDIA)H100加速器上,TurboQuant相比未壓縮方案,性能最高提升了8倍,且無須重新訓練模型即可直接掛載,堪稱AI部署的降本增效的“神兵利器”。△在NVIDIA H100加速器上,TurboQuant 在計算鍵值快取中的注意力邏輯值方面表現出顯著的性能提升,在各種位寬等級上均優於高度最佳化的JAX基線。△TurboQuant 展現出強大的檢索性能,在GloVe資料集 (d=200)上實現了相對於各種最先進的量化基線的最佳1@k 召回率。Cloudflare首席執行長Matthew Prince等人將TurboQuant稱為Google的“DeepSeek時刻”,認為其有望像DeepSeek一樣,通過極高的效率收益大幅拉低AI的運行成本,同時在結果上保持競爭力。記憶體需求會降低,還是會帶來更大需求?針對TurboQuant技術會引發了整個市場對於記憶體需求斷崖式下跌的擔憂,產業專家與研究機構也給出了截然不同的看法:富國銀行(Wells Fargo)分析師Andrew Rocha指出:“當context window(上下文窗口)越來越大,KV Cache的爆炸性成長原本是推升內存需求的保證。但TurboQuant正在直接攻擊這條成本曲線,一旦被廣泛採用,資料中心對內存容量的規格要求將被打上大問號。”不過,知名投行摩根士丹利(Morgan Stanley)和研究機構Lynx Equity Strategies則給出了截然不同的觀點,摩根士丹利認為市場可能忽視了“效率提升帶動總量增長”的經濟規律。當AI計算所需的記憶體成本降低到原本的1/6,這將會使得原本因記憶體太貴而無法上線的AI應用(如長文字翻譯、複雜程式碼生成)需求大規模爆發,反而會填補、甚至超越被壓縮掉的記憶體缺口。這就是傑文斯悖論(Jevon's paradox),即當技術進步提高了使用資源的效率(減少任何一種使用所需的數量),但成本降低導致需求增加,令資源消耗的速度不減反增。摩根士丹利分析師約瑟夫·摩爾(Joseph Moore)及其團隊在周四發佈的投資者報告中指出: “有報導稱Google的TurboQuant會導致記憶體使用量減少了到原來的1/6,但這忽略了他們僅僅指的是KV Cache,而不是整體記憶體使用量。“值得注意的是,Google的 Gemini 3 和 2.5 Pro 模型都擁有 100 萬個Token的上下文窗口,但Google曾透露,他們使用 Gemini 1.5 Pro 測試過高達 1000 萬個Token的上下文窗口,並取得了非常好的結果,但由於推理成本較高,他們最終沒有發佈該模型,”摩爾說道。“因此,我們預計,隨著此類創新以及其他技術的出現,成本將會降低,這項技術將被用於服務於更智能、計算密集型的產品。”摩根士丹利進一步指出,TurboQuant主要最佳化的是“推理階段”的快取,並非“訓練階段”的模型權重。因此,對於支撐AI核心訓練的HBM(高頻寬內存)採購邏輯影響相對有限。相比之下,TurboQuant對手機、筆記型電腦等終端裝置的人工智慧部署更具意義。由於移動裝置的內存有限,這類高效壓縮技術能讓更強大的AI模型在手機端運行,這反而會刺激各類終端裝置進行內存規格的全面換代。Lynx Equity Strategies 的觀點認為,雖然人工智慧提供商需要創新來解決推理中隨著Token上下文長度增加而出現的瓶頸問題,但由於供應限制,這在未來三到五年內並不會減少對記憶體和快閃記憶體的需求。 (芯智訊)
南亞科、華邦電、旺宏…被錯殺?2表看懂降本核彈TurboQuant 記憶體慘淪「DeepSeek時刻」?大摩打臉是利多10:232026-03-27旺得富理財網李宗莉演算法「TurboQuant」標榜僅需6分之1存儲容量,引發美韓台記憶體股崩跌。(示意圖/達志影像/shutterstock)外界擔心,記憶體霸權恐被軟體顛覆,導致美台韓記憶體股全數團滅,南亞科(2408)、華邦電(2344)、旺宏(2337)、創見(2451)、力積電(6770)等多檔指標股,今(27)日開盤隨台股持續重挫,跌幅都逾半根停板。但大摩最新分析指出,Google最新AI演算法「TurboQuant」,透過壓縮技術將AI推論速度提升8倍,記憶體使用量減少6倍,對大型CSP(雲端服務供應商)、LLM(大型語言模型)是一項利多,且長期而言,該演算法不僅不會降低記憶體需求,反而會推升存儲晶片使用量,對運算和記憶體產業有正面助益。大摩指出,該演算法僅在推論階段影響KV快取(KV cache),讓每個GPU產出更多內容,主要用於隨上下文長度增加的暫時性記憶體,而GPU/TPU上的HBM記憶體佔用,以及訓練工作負載則不受影響。TurboQuant運作原理(翻攝法人報告)由於該技術允許在相同的硬體上,運行4~ 8倍長的上下文,或在不耗盡記憶體的情況下,大幅增加批次處理量(batch sizes),KV快取則是如同暫存的記憶小抄,讓系統不必每次都從頭讀取資料,大摩分析,並不代表整體硬體需求或記憶體減少了6倍,反而提高了每個GPU的吞吐效率。長期來看,由於「TurboQuant」旨在提升每個加速器的吞吐量,並降低單次查詢的成本,大摩認為,記憶體產業將出現經濟學中著名的傑文斯悖論(Jevon's Paradox)效應,即效率提升帶動總需求增加,最終該資源的總消耗量反而上升,並從2角度看好長期發展。1.擴展實質的GPU容量: 雖然壓縮技術降低了記憶體需求,但其近期的主要影響並非減少市場對GPU的絕對需求量,而是解放現有硬體的更高利用率,以及更長的上下文處理能力。雲端巨頭很可能將提升的效率重新投資於3領域,包括:1.更大的模型或更長的上下文;2. 更高的查詢處理量;3.更佳的延遲服務水準協議 (SLA),效率提升終會被擴張的需求所吸收,從而抵銷GPU需求量下滑的風險。2.對重度推論平台與邊緣部署是利多:無需重新訓練即可壓縮至3位元的能力,降低導入門檻,對於擴展推論工作負載的CSP、部署私有LLM的企業,以及記憶體受限的邊緣/設備端AI來說,具有極高價值。TurboQuant主要看點(翻攝法人報告)大摩指出,就像瓦特改良蒸汽機後,煤炭需求反而飆升一樣,「TurboQuant」讓AI推理變得便宜、快速且能處理更長的資訊,將激發出更多原本受限於成本,而無法實現的應用場景。如果模型能在不犧牲效能的前提下,以極低的記憶體需求運行,單次查詢的服務成本將大幅下降,從而讓AI部署變得更有利可圖。像是原本需要上雲端的大型模型,將能安裝在本地端硬體上,有效降低大規模部署AI的門檻,且更多的應用程式將變得可行,更多模型能維持活躍狀態,現有基礎設施的利用率也會隨之提高。正如去年的DeepSeek震撼,並未摧毀硬體需求,反而帶動了新一波效率競賽,大摩認為,Google的技術突破,最終可能演變成推動記憶體與算力需求攀升的助燃火箭,即便暫時引發記憶體股的恐慌,但長遠來看,更有可能扮演「開啟新應用大門」的角色。若「TurboQuant」確實改變AI布署的成本曲線,隨AI變得更輕盈、更聰明、成本更低,全球對於運算資源的渴望,或許才正要進入下一個高光階段。單一演算法難動搖超級周期官股金控旗下投顧則表示,市場直覺認為「軟體演算法解決了硬體短缺」,CSP巨頭未來對記憶體的採購量將下修,記憶體晶片廠近年好不容易建立的「強勢定價權」恐將鬆動。但該投顧認為,在供給依然吃緊、邊緣AI(Edge Al)落地、HBM規格升級不變的3前提下,預期未來3年內,記憶體與快閃記憶體的供給依然受限,單一演算法難以動搖硬體周期大勢。其次,記憶體需求壓縮,反而代表AI模型更容易被塞進手機、PC、車用等終端設備,進而擴大邊緣裝置對標準型DRAM的拉貨基數。最後則是模型架構的演進(如多模態),對參數量與傳輸頻寬的要求指數級增長,軟體壓縮只是稍稍緩解物理極限,無法逆轉硬體堆疊的長期趨勢。
南亞科、華邦電、旺宏…被錯殺?2表看懂降本核彈TurboQuant 記憶體慘淪「DeepSeek時刻」?大摩打臉是利多10:232026-03-27旺得富理財網李宗莉演算法「TurboQuant」標榜僅需6分之1存儲容量,引發美韓台記憶體股崩跌。(示意圖/達志影像/shutterstock)外界擔心,記憶體霸權恐被軟體顛覆,導致美台韓記憶體股全數團滅,南亞科(2408)、華邦電(2344)、旺宏(2337)、創見(2451)、力積電(6770)等多檔指標股,今(27)日開盤隨台股持續重挫,跌幅都逾半根停板。但大摩最新分析指出,Google最新AI演算法「TurboQuant」,透過壓縮技術將AI推論速度提升8倍,記憶體使用量減少6倍,對大型CSP(雲端服務供應商)、LLM(大型語言模型)是一項利多,且長期而言,該演算法不僅不會降低記憶體需求,反而會推升存儲晶片使用量,對運算和記憶體產業有正面助益。大摩指出,該演算法僅在推論階段影響KV快取(KV cache),讓每個GPU產出更多內容,主要用於隨上下文長度增加的暫時性記憶體,而GPU/TPU上的HBM記憶體佔用,以及訓練工作負載則不受影響。TurboQuant運作原理(翻攝法人報告)由於該技術允許在相同的硬體上,運行4~ 8倍長的上下文,或在不耗盡記憶體的情況下,大幅增加批次處理量(batch sizes),KV快取則是如同暫存的記憶小抄,讓系統不必每次都從頭讀取資料,大摩分析,並不代表整體硬體需求或記憶體減少了6倍,反而提高了每個GPU的吞吐效率。長期來看,由於「TurboQuant」旨在提升每個加速器的吞吐量,並降低單次查詢的成本,大摩認為,記憶體產業將出現經濟學中著名的傑文斯悖論(Jevon's Paradox)效應,即效率提升帶動總需求增加,最終該資源的總消耗量反而上升,並從2角度看好長期發展。1.擴展實質的GPU容量: 雖然壓縮技術降低了記憶體需求,但其近期的主要影響並非減少市場對GPU的絕對需求量,而是解放現有硬體的更高利用率,以及更長的上下文處理能力。雲端巨頭很可能將提升的效率重新投資於3領域,包括:1.更大的模型或更長的上下文;2. 更高的查詢處理量;3.更佳的延遲服務水準協議 (SLA),效率提升終會被擴張的需求所吸收,從而抵銷GPU需求量下滑的風險。2.對重度推論平台與邊緣部署是利多:無需重新訓練即可壓縮至3位元的能力,降低導入門檻,對於擴展推論工作負載的CSP、部署私有LLM的企業,以及記憶體受限的邊緣/設備端AI來說,具有極高價值。TurboQuant主要看點(翻攝法人報告)大摩指出,就像瓦特改良蒸汽機後,煤炭需求反而飆升一樣,「TurboQuant」讓AI推理變得便宜、快速且能處理更長的資訊,將激發出更多原本受限於成本,而無法實現的應用場景。如果模型能在不犧牲效能的前提下,以極低的記憶體需求運行,單次查詢的服務成本將大幅下降,從而讓AI部署變得更有利可圖。像是原本需要上雲端的大型模型,將能安裝在本地端硬體上,有效降低大規模部署AI的門檻,且更多的應用程式將變得可行,更多模型能維持活躍狀態,現有基礎設施的利用率也會隨之提高。正如去年的DeepSeek震撼,並未摧毀硬體需求,反而帶動了新一波效率競賽,大摩認為,Google的技術突破,最終可能演變成推動記憶體與算力需求攀升的助燃火箭,即便暫時引發記憶體股的恐慌,但長遠來看,更有可能扮演「開啟新應用大門」的角色。若「TurboQuant」確實改變AI布署的成本曲線,隨AI變得更輕盈、更聰明、成本更低,全球對於運算資源的渴望,或許才正要進入下一個高光階段。單一演算法難動搖超級周期官股金控旗下投顧則表示,市場直覺認為「軟體演算法解決了硬體短缺」,CSP巨頭未來對記憶體的採購量將下修,記憶體晶片廠近年好不容易建立的「強勢定價權」恐將鬆動。但該投顧認為,在供給依然吃緊、邊緣AI(Edge Al)落地、HBM規格升級不變的3前提下,預期未來3年內,記憶體與快閃記憶體的供給依然受限,單一演算法難以動搖硬體周期大勢。其次,記憶體需求壓縮,反而代表AI模型更容易被塞進手機、PC、車用等終端設備,進而擴大邊緣裝置對標準型DRAM的拉貨基數。最後則是模型架構的演進(如多模態),對參數量與傳輸頻寬的要求指數級增長,軟體壓縮只是稍稍緩解物理極限,無法逆轉硬體堆疊的長期趨勢。
3/27盤後:華通成交值超車台積電!SpaceX史上最大IPO利多,低軌衛星會是下一波AI嗎?📊盤勢分析週四美股面臨沉重的拋售賣壓,在地緣政治與科技股利空的雙重夾擊下,市場情緒轉趨悲觀,三大指數全面收黑。儘管美國總統川普宣布,將轟炸伊朗能源設施的期限延後10天至4月6日,短暫安撫了市場,但中東停火談判依然僵持,導致國際油價維持高檔震盪,布蘭特原油更一度站穩每桶102美元。高油價喚醒了市場對通膨反撲的擔憂,投資人預期高利率環境恐將維持更長時間,帶動美債殖利率急升,VIX恐慌指數也跟著狂飆至27左右。在這波猛烈的回調中,科技與半導體類股成為重災區,那斯達克指數自歷史高點回落逾10%,正式陷入修正區間。其中一大震撼彈來自Google最新發表的「TurboQuant」AI演算法,該技術號稱能將AI推論過程的記憶體需求大幅壓縮,同時讓速度顯著提升。這項技術突破引發市場對AI硬體需求結構的重新評估,導致記憶體族群慘遭血洗,美光(Micron)跳水崩跌近7%,SanDisk更是下殺超過10%。市場資金的恐慌效應也迅速蔓延至其他關鍵科技巨頭與AI概念股,輝達(Nvidia)大跌4.16%,超微(AMD)血崩7.49%,台積電ADR更是慘挫6.22%;此外,Meta也因社群媒體相關判決的疑慮重挫近8%。不過在科技股一片慘綠中,蘋果(Apple)因傳出計畫開放Siri給外部AI助理使用,持續深化AI生態系布局,股價逆勢微升0.11%。資金在避險情緒下迅速輪動,使得能源、公用事業與不動產等具防禦性質的板塊成為今日相對抗跌的避風港。道瓊工業指數下跌1.01%,收在45,960點;標普500下跌1.74%,收在6,477點;那斯達克指數下挫2.38%,收在21,408點;費城半導體指數重挫4.79%,收在7,586點。今日台股面臨嚴峻的國際逆風,大盤早盤受驚嚇一度急挫逾600點,不僅失守5日線,更向下回測33,000點大關與季線支撐。此波跌勢主要歸咎於美伊停火談判陷入僵局,地緣政治風險推升國際油價與通膨疑慮,導致美股科技股出現拋售潮,費半指數與台積電ADR雙雙重挫,沉重的賣壓也隨之蔓延至台股。在類股表現上,盤面呈現明顯的強弱分歧。記憶體族群成為今日的重災區,主因Google發表全新的「TurboQuant」壓縮演算法,標榜僅需六分之一的記憶體容量即可運作大型語言模型,引發市場對記憶體需求銳減的恐慌。此消息不僅導致美光股價大跌,台廠旺宏、威剛更直接被摜至跌停,南亞科與華邦電亦深陷跌勢與慘遭貼息的窘境。儘管電子權值股疲軟,部分族群卻逆勢突圍成為資金避風港。受惠SpaceX有望迎來史上最大IPO的利多激勵,低軌衛星概念股強勢升空,華通亮燈漲停,成交值更一度超車台積電,燿華、建漢也爆量大漲。此外,中東戰火帶動原物料報價走揚,造紙股華紙因紙漿連七個月喊漲而飆上漲停;二線塑化族群如台達化、台聚等,也受惠於乙烯成本大漲與塑膠袋缺貨題材,拉出強勁漲勢。同時,櫃買市場在投信等內資買盤力挺下,由聯亞、波若威等光通訊族群領軍,展現出強韌的抗跌力道。加權指數下跌0.68%,收在33,112點;櫃買指數上漲0.68%,收在325點。權值股方面,台積電下跌1.09%、鴻海小跌0.5%、聯發科微跌0.31%。🔮盤勢預估早盤反映美股利空後,守住本週低點32500區域,目前看來川普亟欲宣稱勝利後自戰場脫身,只要荷姆茲海峽可恢復正常行駛,即使中東地區仍有零星攻擊,則對股市影響不大,後續則注意美股信貸機構利空。今日記憶體再往下大跌很進入超跌區,短線將醞釀反彈,CPO則因為多檔納入處置,資金流入低軌衛星族群,投信賣壓到下週將告一段落,可注意月初開始起漲帶量個股。👨‍⚕️我是股科大夫 容逸燊每天三分鐘,幫你的持股把把脈!【YT直播】週二 20:00 盤中直播【訂閱股科大夫YT】https://bit.ly/dr_stockYT【官方LINE @】https://line.me/R/ti/p/@dr.stock【專人服務諮詢】0800-668-568IG: https://www.instagram.com/dr.stock0/Threads: https://www.threads.com/@dr.stock0每天不到一杯咖啡 訂閱專家的腦袋https://www.chifar.com.tw/subscription/drstock/
20歲女生引爆美股至暗時刻!小扎1200億美元一夜沒了,七巨頭迎史上最狠審判
周四,在1月底創出歷史新高之後,美股迎來了最黑暗的一天,科技股集體下跌。華爾街普遍認為,這與一起由20歲女性提起的里程碑式訴訟有關,或意味著科技巨頭們未來將面臨巨大的法律風險。美股“七巨頭”慘跌周四,華爾街的基準指數標普500收跌1.74%,納斯達克綜合指數更是大跌2.38%,雙雙創下1月20日以來最大跌幅和六個月以來的新低。值得注意的是,納斯達克綜合指數已較去年10月下旬的峰值下跌超過10%,跌破了所謂“技術性調整”的門檻。其中,科技股集體重挫。Meta Platforms(META)跌幅居前,暴跌7.96%創出11個月新低,單日跌幅僅次於去年10月30日的11.34%。一天之內,Meta總市值縮水1200億美元,至1.39兆美元。另外,輝達(NVDA)下跌4.16%;特斯拉(TSLA)下跌3.59%;Google(GOOG)下跌3.06%;亞馬遜(AMZN)下跌1.97%;微軟(MSFT)下跌1.37%創出11個月新低。“七巨頭”中僅有蘋果(AAPL)收紅,微漲0.11%。更慘的是,有資料顯示,截至周二收盤,“七巨頭”的股價都比過去52周高點下跌了兩位數百分比。其中,微軟慘上加慘,較高點下跌超過33%。對此,部分華爾街分析師表示悲觀。“我不太確定現在是不是買入‘七巨頭’的好時機——我認為它們還有更大的下行風險,”Slatestone Wealth首席市場策略師 Kenny Polcari表示。“就算以後它們大幅上漲,我現在也不會貿然入場。我覺得我的錢還有其他地方可以投資,”他補充道。20歲女性起訴Meta贏了對於“七巨頭”的拋售潮,華爾街有很多解釋,包括:美伊戰爭帶來的不確定性、油價上漲引發頑固通膨、聯準會維持高利率、巨額的AI基建支出承諾引發擔憂等等。但最新最危險的一根導火線,正是一位20歲女性針對Meta的里程碑式訴訟。加州陪審團周三裁定,Meta和Google應對一名自幼年時便沉迷於社交媒體的女性的抑鬱和焦慮負責,並賠償她600萬美元。這一罕見的判決讓矽谷為其在加劇青少年心理健康危機中所扮演的角色承擔了責任。陪審團裁定,Meta和Google應向該女子支付300萬美元的補償性賠償金和300萬美元的懲罰性賠償金,其中Meta應承擔70%的賠償金。本案原告是一名20歲的女性,姓名首字母為“KGM”。中為KGMKGM在二月份作證時表示,她早期使用社交媒體導致她對這項技術上癮,並加劇了她的抑鬱症和自殺念頭。她說,由於使用社交媒體,她患上了身體畸形恐懼症——一種經醫生診斷的臨床疾病。今年二月,KGM在庭審中表示,她從6歲開始使用YouTube,9歲開始使用Instagram。到小學畢業時,她已經在YouTube上發佈了284個視訊。KGM告訴法庭:“我不再與家人聯絡,因為我把所有時間都花在了社交媒體上。”她還補充說,她從10歲開始就患有焦慮症和抑鬱症,後來被確診患有這兩種疾病。KGM表示,一些功能,例如通知,會讓她感到“興奮”,而律師則認為這些功能是故意設計成讓人上癮的。KGM說,她有時會在上學期間去廁所,只是為了查看通知。KGM還表示,她幾乎在所有照片上都使用了Instagram濾鏡,這些濾鏡會改變照片的容貌。她說,在開始使用社交媒體和濾鏡之前,她從未體驗過與身體畸形恐懼症診斷相關的負面情緒。1月下旬,Snapchat的母公司Snap Inc.已就此案達成和解。和解的具體細節尚不清楚。對這一判決結果,Meta以及Google旗下的YouTube發表聲明表示異議。他們表示將考慮採取法律行動,包括提起上訴。社媒平台股價暴跌Meta近期的麻煩還不止這一起,周二,經過近七周的審判,新墨西哥州的一個陪審團裁定,Meta對兒童心理健康有害,並違反了該州的消費者保護法。陪審團支援州檢察官的論點,即擁有Instagram、Facebook和WhatsApp的Meta將利潤置於安全之上。陪審團認定,Meta違反了該州《不正當競爭法》的部分條款,指控該公司隱瞞了其平台上存在的兒童性剝削風險及其對兒童心理健康的影響,裁定Meta必須支付3.75億美元的賠償金。此外,超過40位州檢察長對Meta提起訴訟,聲稱Meta故意設計令人上癮的Instagram和Facebook功能,加劇了年輕人的心理健康危機。受此裁決影響,Reddit(RDDT)和Snap Inc.(SNAP)等其他社交媒體平台的股價周四也出現暴跌,分別下跌超過8.86%和10.69%,分別創出9個月新低和歷史新低。歷史性判決影響科技巨頭的走勢雖然對於Meta這樣一家市值1.5兆美元、年淨收入超過600億美元的公司來說,這些處罰微不足道。但從法律角度和對科技巨頭的影響來說,這是三起具有里程碑意義的訴訟案件。這也是陪審團首次認定社交媒體應用程式應被視為缺陷產品,因為它們被設計用來利用兒童和青少年正在發育的大腦,這一判決可能會為成千上萬起類似的訴訟定下基調。哈佛大學法學院講師蒂莫西·埃德加將這些結果描述為“一個重大的分水嶺事件”,它“代表著美國人看待大型科技公司方式的巨大轉變”。“這可以說是多年來日益增長的懷疑情緒的最終體現,”埃德加說。“這可能會導致公司改變應用程式和平台的運作方式,”Emarketer的高級社交媒體分析師Minda Smiley表示。任何對產品的重大改變“都可能——而且很可能會——改變廣告商希望在這些平台上展示廣告的方式,從而對公司的盈利產生重大影響。”這些裁決也預示著《通訊規範法》第230條(保障言論自由)可能面臨重新審視。新墨西哥州總檢察長勞爾·托雷斯表示:“這些案件很有可能促使國會重新審視第230條款,即使不廢除它,也會對其進行大幅修改。”托雷斯說:“我認為陪審團對公司處以罰款並追究其責任,向華盛頓特區的政策制定者發出了一個重要的訊號,表明社區中存在著亟待解決這些問題的緊迫性。”美國參議院司法委員會資深成員、伊利諾伊州民主黨參議員迪克·德賓支援改革第230條款,並表示最新的判決加強了他的立場。“新墨西哥州和加利福尼亞州接連做出的這些決定表明,大型科技公司已經變成了大型菸草公司,”德賓在一份聲明中說道。他指的是上世紀90年代,當時菸草公司因向公眾隱瞞其產品的危害而被勒令支付數十億美元的罰款。“現在,國會是時候徹底廢除第230條了。” (美股財經社)
Google TurboQuant是舊技術,效率提升帶動更多儲存需求記憶體崩 恐慌過頭了?需求反看俏 DeepSeek為鑑MoneyDJ新聞 2026-03-27 08:45:20 郭妍希 發佈記憶體大廠美光(Micron Technology, Inc.)、電腦儲存設備領導服務商Sandisk等如日中天的記憶體股本週受創,跟谷歌(Google)新發布的「TurboQuant」 演算法,有望將大型語言模型(LLM)的KV快取(KV cache)記憶體需求壓縮6倍有關。然而,分析人士認為市場恐慌過頭,除了因為這並非全新技術外,歷史經驗顯示,效率提升通常會降低成本、進而帶動更多硬體需求,也就是所謂的傑文斯悖論(Jevons’ Paradox)。Barron`s、MarketWatch等外電報導,TurboQuant是一種專門用來解決KV快取(key-value cache)瓶頸的演算法。Google將其描述為「數位備忘單」(digital cheat sheet),實際上是充當了AI模型的「短期記憶」。雖然目前已有壓縮資訊、以便在備忘單塞入更多訊息的方法,但快取空間仍會迅速填滿。此外,傳統壓縮技術可能會導致模型出現幻覺(hallucinate)或出錯。TurboQuant的目標是解決這些問題。Google研究人員表示,該技術能在不損害模型準確度的情況下,將AI模型的KV記憶體需求降低至少6倍、速度提升最多8倍。對過去因AI對記憶體與儲存容量需求不斷成長而獲利的投資人來說,聽到AI相關記憶體需求會「壓縮6倍」,無疑是敲響警鐘。然而,TurboQuant其實沒有聽起來那麼可怕。首先,這並非全新技術,這項演算法的技術草稿早在2025年4月就在網路出現。瑞穗(Mizuho)科技產業專家Jordan Klein指出,每個雲端巨頭與LLM開發商都在研發類似技術,「如果這項技術真的好到能在Google內部大量使用,相信我,他們絕對不會發表論文公開它。」第二,記憶體使用效率上升,很可能會導致需求進一步上揚。舉例來說,2025年1月中國的DeepSeek橫空出世,展現了降低AI模型訓練成本的能力,一度引發市場擔憂雲端商對AI晶片的投資過頭,導致美股市值一口氣蒸發1兆美元。然而,隨後發生的正是「傑文斯悖論」,更高效的模型大幅增加AI服務需求,反而證明擴大投資的合理性。Sandisk財務長Luis Visoso與美銀證券(BofA Securities)對談時也持相同觀點。美銀分析師Wamsi Mohan引述Visoso的說法指出,TurboQuant能提升超大規模資料中心資本支出的投報率(ROI),而效率的提升反將推高需求。Mohan將Sandisk的投資評等維持在「買進」,目標價為900美元。摩根士丹利(Morgan Stanley、通稱大摩)分析師Joseph Moore也指出,Google對KV快取效率的提升,對整體記憶體需求的直接影響有限。因為這些數據是儲存在高頻寬記憶體(HBM)中,而該組件的容量並不會因此改變。