近日,我看到輝達(NVIDIA)首席執行長黃仁勳在2026年CES大會上的一段演講,其中聊到了當下大火的AI智能代理(AI Agent)。
黃仁勳在演講中描述了人工智慧正在發生的範式轉變:AI不再只是根據訓練資料回答問題的工具,而是開始具備自主思考和行動的能力。他提到,ChatGPT等大型語言模型雖然很強大,但也會出現讓人哭笑不得的“幻覺”現象。這是因為這些模型無法即時獲取新知識,需要靠一定的“推理”和“工具”才能正確回答超出訓練範圍的問題。
黃仁勳的這番演講告訴我們:人工智慧的發展正從“會生成”邁向“會思考”,AI智能代理時代似乎真的要來了,而且可能比我們想像的更快到來。
在ChatGPT橫空出世初期,很多人驚嘆於它流利的回答,卻也發現它有時候會一本正經地瞎編亂造答案,出現所謂的“幻覺”。黃仁勳在演講中就提到這一點:早期的ChatGPT“產生了很有趣的結果,但也經常胡言亂語(hallucinate)”。
為什麼會這樣呢?簡單說,這是因為傳統的大型語言模型是基於訓練時看到的知識來回答問題的,對訓練後出現的新知識一無所知。如果你問它一個關於最新發生的事件或專業領域的新問題,它很可能張冠李戴。模型並非真的在“思考”,而更像是在模式匹配,甚至編造資訊。
為瞭解決這一問題,AI研究者們發現,讓模型學會“思考”至關重要。所謂“思考”,其實就是讓AI具備一定的推理能力。黃仁勳解釋說,一個真正智能的AI在回答問題前,需要懂得先去查資料、分步驟分析問題、呼叫必要的工具或外部資訊源,然後再給出基於事實的答案。換句話說,AI需要學會像人一樣:遇到新問題時,會想一想:“我需要先做些什麼準備?這題該如何分解?” 然後逐步解決子問題。
這種多步推理和規劃的過程被稱為“思維鏈”(Chain-of-Thought),它讓AI不再侷限於死記硬背訓練集裡的知識,而是能夠靈活應對新情況。
簡單來說,AI智能代理就是一種能夠自主決定採取那些步驟來完成任務的智能程序。
它背後的理念是:當我們給AI一個複雜的任務時,我們不需要也無法提前把每一步都程式設計寫死;相反,我們希望AI自己決定如何呼叫自身的技能和外部工具去完成任務。
黃仁勳指出,大型語言模型的出現讓這一切成為可能。他說,大型語言模型讓AI取得了一次基本的飛躍。通過訓練和強化學習等技術,現代的AI模型已經具備了一定的推理和規劃能力,能夠把一個從未見過的問題分解成一系列自己知道如何處理的小步驟。這就好比我們人類遇到沒見過的新情況時,會本能地拆分問題、類比過去的經驗來想辦法解決一樣。
更令人興奮的是,AI代理不僅能自行思考,還可以像團隊合作一樣呼叫多個不同的AI模型一起來解決問題。
黃仁勳提到了一個令他印象深刻的突破:一家名為Perplexity的AI搜尋公司率先讓一個AI同時使用多個模型處理不同子任務。他感嘆道,這簡直太聰明了!AI當然可以隨時呼叫世界上最好的AI來幫它解決問題。
換句話說,如果一個AI代理在推理過程中需要識別一張圖片,它就可以呼叫專門的圖像識別模型;需要聽懂語音時,它又可以呼叫語音識別模型;需要獲取最新資訊時,它甚至可以呼叫聯網的搜尋引擎或資料庫。正因為能自由呼叫各種不同模態、不同專長的模型,一個AI代理就像一個全能管家,能在需要的時候切換角色,當一次翻譯家、畫家、資料分析師,甚至私人助理。
AI智能代理的強大還在於它可以將通用智能和專屬技能相結合。
一方面,我們有那些無所不知的前沿大模型(Frontier Model),比如最新版本的ChatGPT,它掌握了海量的通用知識和語言能力,相當於站在知識的“最前沿”。
另一方面,不同行業、不同個人可能又有各自特殊的需求和秘密“配方”——這就需要定製的專屬小模型。
黃仁勳提出,我們完全可以訓練屬於自己或自己公司的小模型,教給它別人沒有教過的獨門本領,然後把它納入AI代理的架構中。這樣一來,我們的AI代理就既有大模型的見多識廣,又有小模型的獨門絕技。
在技術實現上,這背後需要一個聰明的“調度員”。在演講中,黃仁勳將其形象地稱為“智能路由器”或“模型路由器”。這個路由器負責根據使用者指令的意圖,自動判斷該呼叫那個模型最適合當前任務。例如,當你讓AI代理整理內部機密檔案時,路由器會挑選在本地運行、確保隱私安全的定製模型來執行;而當你詢問一個通用常識問題時,它又會把任務交給知識面更廣的前沿模型。通過這樣的架構,你的AI代理始終擁有“雙重魔法”:一隻手擁有全球最新最強的知識,另一隻手又握著你自己領域的專業技能。而對終端使用者來說,這一切切換和配合都是無感的——你只管提出問題和任務,AI代理自會在幕後安排妥當。
黃仁勳在演講現場還展示了一個令我印象深刻的例子。他當場建構了一個個性化的AI“私人助理”,幫他處理日常事務,還能與現實世界互動。
這個助手由多部分組合而成:首先,他用一台輝達的DGX Spark小型超級電腦作為個人云伺服器,確保所有AI模型都能本地高速運行;其次,他準備了一個開放原始碼的迷你機器人,名叫Richie(來源於Hugging Face的開放項目),作為AI助理與物理世界互動的“化身”;再次,他呼叫了業界領先的語音合成服務,讓Richie這個機器人能夠用自然的聲音與他對話。
這位AI私人助理都做了些什麼呢?演示中,黃仁勳對著Richie說:“嗨,Richie,我今天的待辦清單上有什麼?”Richie立刻回答,告訴他今天需要採購的物品清單和要傳送給同事的郵件任務。黃仁勳接著口頭吩咐:“那就給他發郵件說我們會在當天結束前提供更新。” 助理便自動幫他起草並行送了郵件。
隨後,黃仁勳拿出一張手繪草圖,讓AI助手將其“變成建築效果圖”,Richie照辦,呼叫圖像模型將草圖轉化為精美的建築渲染圖。更令人稱奇的是,當黃仁勳詢問“家裡的狗現在在幹嘛”時,Richie竟然調動自己的攝影機環顧了房間一圈,然後回答說:“它正在沙發上偷懶呢!”原來,這個AI助理還連接了家中的攝影機,可以隨時監控寵物的動態。黃仁勳讓Richie通過語音驅動揚聲器喊了一聲“Potato,下沙發!”(Potato是他寵物狗的名字),彷彿一個真正的管家在遠端呵護家庭。
現場觀眾無不為之驚嘆。這一連串操作聽起來近乎魔法,但黃仁勳強調,如今這樣的AI代理系統已經相當簡單就能實現。他感嘆:
“這一切如今變得微不足道,而在幾年前是完全無法想像的。”
開源社區的繁榮和AI工具的發展,讓個人和中小團隊也能打造出屬於自己的AI助手。只要有合適的硬體,加上現成的模型和藍圖範本,每個人都可能訓練一個專屬的AI來幫自己處理繁瑣事務。這種科技進步的速度,連行業專家都感到驚嘆。
AI智能代理不僅是炫酷的演示,更被視為未來應用的新範式。
黃仁勳指出,這樣的代理式AI架構將成為未來軟體應用的基本框架和使用者介面。過去,我們使用軟體往往需要學習特定的操作流程,比如在電子表格裡一格一格輸入資料,或者在命令列裡敲指令。而有了智能代理之後,我們和應用程式打交道的方式會變得更自然,就像和一個懂行的助手對話——你提出目標,AI幫你執行。
在企業領域,這種變化將帶來巨大效率提升。難怪許多行業領先的平台公司,如Palantir(資料分析)、ServiceNow(企業服務)、Snowflake(雲資料)等,都在和輝達合作,把智能代理融入它們的系統,作為新一代的人機互動入口。
想像一下未來的場景:財務分析師不需要在繁瑣的軟體介面上點選半天,只要向AI助理描述想要的報表,它就能自動調取資料庫並生成結果;工程師可以直接對AI助手提出設計需求,AI便整合各類專業工具給出方案;甚至我們普通人在日常生活中,也許只需要對著手機說出想要完成的事項,就會有智能代理為我們統籌安排好一切。
從PC時代的圖形介面(GUI),到移動網際網路時代的觸屏互動,再到如今的對話式AI時代,人機互動正在變得越來越自然、越來越以人為中心。AI智能代理正是推動這一轉變的關鍵力量,它讓人工智慧從幕後的演算法模型走到台前,成為直接為人服務的數字勞動力。
黃仁勳在演講中傳遞的資訊很明確:我們正站在一個AI變革的門檻上,迎接從“生成式AI”向“代理式AI”的飛躍。
AI智能代理將賦予機器前所未有的自主性和協作能力,讓AI真正成為人類的強大助手。從讓聊天機器人不再胡言亂語,到擁有隨叫隨到的數字助理,這場AI革命終將走進你我的生活。
如果說過去幾年是AI學習表達和創作的階段,那麼接下來,AI將學會思考和行動。從某種角度看,具備自主推理和行動能力的AI代理,也許正是人類邁向通用人工智慧(AGI)的關鍵一步。 (前沿黑板報)