過去兩年,AI行業最熱鬧的地方一直在雲端。
從大模型參數規模,到GPU算力叢集,再到模型訓練成本,幾乎每一次AI產業的重大革新,最終都會變成兩個討論:“誰擁有更多算力”和“誰能訓練出更強模型”。但是,隨著算力與參數規模逐漸達到瓶頸,大家也將視線轉嚮應用端,去找出AI的真正用法,也就是“智能體”。
在COMPUTEX 2026開幕演講上,高通公司總裁兼CEO安蒙給出了一個很明確的判斷:2026年,是“智能體之年”。
這不是一句簡單的口號。過去我們熟悉的AI,更多是一個“回答問題的工具”,使用者輸入提示詞,模型生成答案,互動的主動權仍然在人手裡。但智能體AI不一樣,它不只是理解問題,而是要理解使用者意圖,持續讀取上下文,拆解任務,呼叫工具,並在多個系統和裝置之間協調執行。
換句話說,AI正在從“幫你回答”,走向“幫你完成”。在過去幾個月裡,OpenClaw、Hermes等智能體可以說刷新了很多人對AI能力的認知,但同時也讓我們意識到,想讓智能體真正進入我們的生活,還有更多的問題要解決。
這也是為什麼高通會在COMPUTEX上反覆強調“計算連續體”。當AI進入智能體階段,問題已經不只是模型夠不夠強,而是這些智能體到底運行在哪裡、如何降低成本、如何保證時延、如何保護隱私,以及如何讓使用者隨時隨地都能用上。
如果所有智能體工作負載都堆到雲端,Token成本、網路延遲、能源消耗和隱私風險都會成為規模化落地的瓶頸。高通想講的故事,正是把智能體AI從資料中心帶到手機、PC、汽車、機器人、工業裝置乃至未來網路中,讓AI不再只是一朵“雲”,而是分佈在每一個計算節點上的新型基礎能力。
為什麼智能體時代需要“計算連續體”?
要回答這個問題,首先要理解智能體AI和傳統AI的差別。
在雷科技看來,傳統AI更像是一個能力很強的問答系統,它可以完成文案、總結和翻譯等基礎性的任務,但大多數時候,它需要你不停輸入指令,告訴它“下一步該做什麼”。
而智能體AI則完全不同,你只需要給它一個目標,它就會圍繞目標持續運轉,直到達成目的為止。在這個過程中,它會給自己下任務、執行、復盤,像“人類”一樣工作。
比如使用者說“幫我準備今天的工作簡報”,智能體並不會簡單生成一段文字,而是先拆解完成目標的前提,然後去讀取郵件、日曆、本地文件和會議記錄,再判斷今天最重要的事項,整理待辦清單,最後再呼叫Word等工具來輸出最終文件。
這個過程裡,有些工作確實需要雲端大模型參與,但並非所有環節都值得送到雲端。比如檔案索引、局部摘要、個人資料讀取和任務編排等環節,完全可以在本地或邊緣裝置完成。而且,把這些輕量任務全部塞進雲端,不僅性價比低,也會帶來不必要的延遲和隱私風險。
即使你不在乎隱私問題,將所有計算都交給雲端也會帶來額外的Token消耗,讓使用成本激增,錢總不能不在乎了吧?
在安蒙的演講中其實就提到,對話式AI、推理AI和智能體AI的Token需求並不是線性增長,而是隨著任務複雜度的提升呈指數級增長。
比如一個簡單問答可能只消耗有限Token,但一旦進入多輪推理、多工具呼叫、多智能體協作和持續上下文狀態,Token消耗就會快速放大。因為智能體不是以人類的思考鏈路去操作軟體,而是以機器的方式去呼叫服務、處理資料、生成中間結果。
這意味著,AI產業不能繼續把“堆更多雲端算力”當成唯一方向,因為隨著任務的複雜化以及智能體使用的常態化,算力消耗也會達到恐怖的數字,而不管是算力還是能源,都是不可能無限增長的。
所以,未來真正重要的,不只是擁有多少算力,而是如何更聰明地使用算力,而高通提出的“計算連續體”,就是為瞭解決這個問題。
按照高通的設想,智能體工作負載不應該固定在某一個位置,而應該根據成本、性能、時延、功耗和隱私需求,在終端裝置、邊緣側、本地伺服器和雲端之間動態分配。簡單的、本地化的、強隱私的任務可以放在裝置端;高上下文、高複雜度、需要大模型能力的任務則可以交給雲端;中間還有邊緣裝置和本地AI工作站承擔過渡角色。
這不是簡單的“端側AI取代雲端AI”或“雲端AI壓倒端側AI”之類的轉變,而是把整個計算架構進行重新分工。
當然,對於高通來說,這也是回到了他們的熟悉領域。因為在過去幾十年裡,高通一直在移動計算領域探索一個問題:如何在有限功耗和有限體積裡提供足夠強的計算能力。手機、耳機、可穿戴裝置、汽車、機器人和PC,雖然這些裝置的形態不同,但它們都有一個共同的需求:在能效、連接和性能之間取得平衡。
而到了智能體時代,高通在晶片能效上的優勢將不再止於手機,而是會擴展到整個AI計算體系。簡單來說,高通希望把從毫瓦級可穿戴裝置,到千瓦級資料中心推理系統的能力串聯起來,讓智能體在最合適的位置運行。
從手機到PC,個人裝置正在變成智能體入口
對普通使用者來說,智能體AI最先改變的,應該會是你每天都在使用的裝置——手機。
過去十多年裡,智慧型手機一直是數字生活的中心,我們通過手機使用App、上網、記錄生活,而智能手錶、無線耳機等可穿戴裝置則成為手機體驗的延伸。再算上智能家電等IoT裝置,你會發現大多數智能終端都是圍繞手機搭建的。
但在安蒙看來,智能體時代會讓這個中心發生變化:未來數字生態的中心不再只是手機,也不再只是作業系統和應用,而是智能體本身,裝置則會變成智能體的端點。
這句話看似抽象,其實很容易理解。今天我們在手機、PC、手錶和耳機之間切換,很多體驗仍然是割裂的。先不說手機和手錶的智能完全依賴於手機,PC和手機之間都依然無法做到自然的任務流轉。
但是,如果智能體AI真正成熟,它將具備跟隨使用者在不同裝置之間移動的能力。比如你在手機上提出需求,手機認為自己處理不了,那麼就可以交給PC繼續處理;當你戴上智能眼鏡時,智能體又能通過攝影機和麥克風獲得新的感知輸入,然後結合之前在手機、PC上的任務,進一步為你提供服務。
看到這裡,有人會覺得:這是要取代手機和PC的意思?然而並不是。這只是意味著,手機和PC不再只是運行應用的機器,而是使用者接入智能體的第一入口。
高通在演講中強調,今天的裝置大多是為“人類主動操作”設計的。使用者點開App,輸入內容,等待反饋,這也是過去移動網際網路的基礎互動邏輯。但智能體AI會帶來另一種運行模式:即使使用者沒有持續操作,智能體也會在後台理解上下文、規劃步驟、協調任務,並在合適時機給出結果。
當然,這也對硬體提出了更高的要求。
首先,我們需要更強的CPU。很多人談AI裝置時,第一反應是NPU算力,但智能體並不只是跑模型,它還需要任務編排、工具呼叫、系統協調和工作流規劃,而這些環節高度依賴CPU。高通也在演講中特別提到,規劃會成為智能體時代的核心工作,而規劃本身是分佈式的,這讓大多數裝置都很難離開高性能CPU。
當然,只有CPU是不夠的,高能效NPU和GPU也是必需的,它們將用來運行本地模型和平行推理任務。因為智能體想要做到即時響應,就不能每一個決定都等待雲端返回資料後再去執行,尤其是在語音識別、圖像理解、文件摘要等功能中,目前的端側AI模型已經足夠處理。
此外,智能體裝置也需要具備更豐富的感測器和連接能力,因為想讓智能體真正“懂你”,僅靠提示詞是不夠的,裝置需要主動理解使用者所處的環境,並結合過往歷史記錄和個人資料,判斷使用者的真實需求。
這也是為什麼高通會把手機、AI PC和個人AI裝置放在同一條主線上討論。
手機和PC各自掌握著使用者在不同場景下的個人資料,只有打通手機和PC之間的隔閡,智能體才能釋放出全部實力。同時,個人AI裝置也將為計算終端提供更多環境資訊,協助終端完成任務推理。
這個智能生態的未來,是讓你能夠在任意裝置上獲得完全相同的智能體驗。你的智能體不會因為你在手錶上發起提問就變成“傻子”,做到真正的“讓AI無處不在”。
所以,高通近幾年在汽車領域也是動作不斷。隨著汽車智能化程度加深,AI在汽車上也不只是車機助手而已。安蒙認為,未來汽車將同時擁有面向使用者的個性化智能,以及負責感知和駕駛的實體AI,前者理解使用者需求,後者理解道路環境,兩者共同構成AI定義汽車的新形態。
而機器人則進一步體現了實體AI裝置所需要面對的任務複雜性。它不僅需要推理和規劃能力,還需要具備即時控制、感測器融合和可靠執行能力,因此機器人實際上是移動計算、邊緣AI和智能連接能力的綜合體現。
高通近年來也在將自身優勢帶入機器人領域,通過低功耗計算、異構計算和系統級整合能力,讓部分感知、控制和邊緣推理任務能夠在更靠近資料來源的位置完成,從而降低時延和中心計算壓力,提升機器人的響應速度與續航表現。
與此同時,高通也在探索將6G納入這套體系的方法。雖然6G網路還在研發階段,但是其中的關鍵技術節點已經確定,那就是未來網路不僅負責連接,還會承擔部分計算和感知任務,讓裝置、邊緣和雲端形成更緊密的協同關係。
另外,高通也正式推出Qualcomm AI200、AI250等千瓦級的算力伺服器,已經在與超大規模雲服務商和全球合作夥伴推進真實部署,隨著資料中心產品組合拓展,其產品將覆蓋從最小型可穿戴裝置到高性能推理資料中心的每一個層級。
換言之,高通正在打造一個“從毫瓦級到千瓦級”的全鏈路算力生態,而這也是高通能夠提出“計算連續體”的關鍵。
高通想做的不是一顆AI晶片,而是一套智能體時代的底層平台
回頭看安蒙這場COMPUTEX主旨演講,高通真正想表達的,其實不是“我們有一顆更強的AI晶片”,而是希望成為智能體時代的底層平台提供者。
從手機、PC到汽車、機器人和資料中心,高通強調的是同一個邏輯:智能體不會只運行在雲端,而是會分佈在各種終端和邊緣節點之中。因此,未來競爭的重點不只是單點算力,而是如何建構覆蓋裝置、網路、邊緣和雲端的完整計算體系。
這也是“計算連續體”的核心意義。因為智能體既需要雲端大模型能力,也需要端側即時響應,它同時依賴高性能計算、低延遲連接和高感知能力。而高通則希望利用自身在移動計算和連接領域的積累,把這些能力整合到同一平台之中。
從安蒙提出“2026是智能體之年”其實可以看出,高通認為AI行業的競爭,正在從模型競爭走向智能體競爭。隨著智能體逐步成為新的計算入口,終端裝置、邊緣計算和連接技術的重要性將持續提升。
過去的十幾年裡,移動網際網路讓手機成為數字生活中心,而在AI時代,智能體AI正在讓計算重新回到每一台裝置上,而高通就是希望成為連接這些裝置、支撐智能體運行的關鍵平台。 (雷科技)
