麥肯錫:《超級智能體:賦能人們釋放人工智慧的全部潛力》


麥肯錫的《超級智能體:賦能人們釋放人工智慧的全部潛力》報告是一份深入剖析企業在人工智慧時代轉型路徑的研究成果。該報告基於對3,613名員工和238名C級高管的全面調查,探討了企業在AI採用過程中的技術準備度和業務準備度,旨在幫助企業領導者理解如何釋放AI的全部潛力,同時平衡速度與安全的關係。


報告前言

幾乎所有公司都在投資人工智慧,但只有 1% 的公司認為自己在人工智慧應用方面已經成熟。我們的研究發現,推廣人工智慧的最大障礙並非員工 —— 他們已經做好了準備 —— 而是領導者,他們的引領速度不夠快。

人工智慧已進入職場,其變革潛力堪比 19 世紀工業革命時期的蒸汽機。隨著 Anthropic、Cohere、Google、Meta、Mistral、OpenAI 等公司開發出強大且功能多樣的大語言模型(LLMs),我們進入了一個新的資訊技術時代。麥肯錫的研究表明,從企業應用案例來看,人工智慧在長期內有望帶來 4.4 兆美元的額外生產力增長。

但挑戰也隨之而來:人工智慧的長期潛力巨大,但短期回報尚不明確。在未來三年,92% 的公司計畫增加人工智慧投資。然而,儘管幾乎所有公司都在投資人工智慧,但只有 1% 的領導者認為他們公司在部署方面 “成熟”,這意味著人工智慧已完全融入工作流程並帶來顯著的業務成果。關鍵問題在於企業領導者如何組態資金,引導他們的組織更接近人工智慧成熟階段。

本研究報告受裡德・霍夫曼(Reid Hoffman)所著的《超級智能體:我們的人工智慧未來可能會怎樣》一書啟發,提出了一個類似的問題:公司如何利用人工智慧來增強人類能動性,釋放職場新的創造力和生產力水平?人工智慧能夠推動巨大的積極變革,也可能帶來顛覆性變化。這種轉變需要一些時間,但領導者不能因此而退縮。相反,他們現在必須大膽推進,以免在未來失去競爭力。重大經濟和技術變革的歷史表明,這樣的時刻往往能決定公司的興衰。40 多年前,網際網路誕生。從那時起,包括 Alphabet、亞馬遜、蘋果、Meta 和微軟在內的公司市值達到了兆美元。更深遠的是,網際網路改變了工作模式和資訊獲取方式。如今的人工智慧就像多年前的網際網路:對企業領導者來說,風險不在於目標定得太大,而在於定得太小。


報告簡介

報告開篇即指出一個核心觀點:人工智慧已經進入工作場所,其潛在變革力量堪比19世紀工業革命中的蒸汽機。麥肯錫的研究估計,企業應用AI的長期生產力增長潛力高達4.4兆美元。然而,儘管長期潛力巨大,短期回報卻不明確。調查顯示,92%的企業計畫在未來三年增加AI投資,但僅有1%的領導者認為他們的公司在AI部署方面已達到"成熟"階段——即AI完全整合到工作流程中並產生實質性業務成果。

報告的核心發現之一是:員工比領導者想像的更加準備好擁抱AI。實際上,C級領導者對員工使用生成式AI的程度估計遠低於實際情況。領導者估計只有4%的員工在日常工作中將生成式AI用於至少30%的任務,而事實上這一比例是三倍多,達到13%。更令人驚訝的是,有47%的員工相信他們會在一年內使用生成式AI完成超過30%的日常任務,而只有20%的領導者持同樣觀點。

員工們不僅已經開始使用AI,而且渴望獲得更多培訓和支援。近一半的員工表示正式培訓是提升AI採用率的最佳方式,他們也希望能夠參與AI工具的試點項目,並認為激勵機制如財務獎勵和認可能提高使用率。然而,超過五分之一的員工報告他們獲得的支援微乎其微或根本沒有。這表明企業領導者需要增加對員工AI能力培養的投入。

報告特別指出了千禧一代在AI變革中的關鍵角色。研究發現,千禧一代比其他年齡組更熟悉生成式AI工具,並且更有可能預期工作流程在一年內發生變化。由於許多千禧一代已經擔任管理職位,他們可以支援團隊成員更熟練地使用AI。資料顯示,三分之二的管理者每周至少接收一次團隊關於如何使用AI工具的問題,類似比例的管理者會向團隊推薦AI工具來解決問題。

在速度與安全的平衡方面,報告揭示了一個有趣的悖論:雖然47%的C級高管認為他們的公司開發生成式AI工具的速度太慢,但員工和領導者都高度關注AI的安全性和可信度。約一半的員工擔心AI的不精準性和網路安全風險。值得注意的是,員工對自己公司正確部署AI的信任度比對其他機構高出1.3倍。71%的員工信任僱主以負責任、安全和符合道德的方式部署AI工具,這一比例高於他們對大型科技公司(61%)、初創公司(51%)甚至大學(67%)的信任度。

麥肯錫的報告強調,企業要想在AI競賽中脫穎而出,領導者必須設定大膽的目標。隨著AI熱潮逐漸消退,企業應該更加關注能夠賦能員工日常工作的實用應用,這些應用可以創造競爭壁壘並產生可衡量的投資回報。報告分析了超過250個AI應用案例,發現大多數公司仍處於AI之旅的早期階段,大多數AI應用仍是局部性的試點項目。然而,創造變革性價值的AI應用需要更大的勇氣和遠見,如製造業中的機器人技術、可再生能源中的預測AI、生命科學中的藥物開發以及教育領域的個性化AI輔導。

對於企業領導者,報告特別強調幾個關鍵方面需要關注。首先是適應性——AI技術進步如此迅速,組織必須快速採用新的最佳實踐才能保持競爭力;其次是聯邦治理模型——在賦予團隊開發新AI工具自主權的同時,集中控制風險;第三是預算靈活性——鑑於技術的快速發展,企業應保持靈活的預算以最佳化AI部署的成本和性能;第四是AI基準——這些工具可作為定量評估不同AI模型、演算法和系統的強大手段;第五是彌補AI特定技能差距——46%的領導者認為工作隊伍中的技能差距是AI採用的重大障礙;最後是以人為本——為確保公平和公正,企業領導者應在AI開發過程中儘早並經常納入多元化視角,並與團隊保持透明溝通。

報告還探討了AI在個人生活中的潛力。研究分析了77項個人活動中AI的潛在影響,發現雖然人們對自動化某些個人活動如休閒、睡眠和健身的慾望有限,但資料顯示AI與其他技術結合可以在家務或勞動密集型任務方面提供顯著幫助。到2024年,研究已確定每天約有一小時的此類活動具有技術自動化潛力。到2030年,隨著用例的擴展和AI安全性的持續改進,自動化潛力可能增加到每天三小時。

麥肯錫的報告最終得出結論:員工已經準備好迎接AI。成功的最大障礙是領導力。隨著AI熱潮消退,領導者需要關注實際應用,這些應用不僅能增強現有工作流程,還可以成為解決更大業務和人類挑戰的催化劑。早期的AI實驗主要關注通過狹窄用例證明技術可行性,比如自動化常規任務。現在視野已經轉變:AI有望釋放前所未有的創新並推動產生真正價值的系統性變革。

報告以一個提問結束:領導者如何在顛覆性變革中定義戰略優先事項並有效引導公司?員工如何確保他們為即將到來的AI轉型做好準備?這些問題將塑造公司的AI未來。報告建議企業採用自下而上和自上而下相結合的方法來推動AI採用:自下而上的行動幫助員工通過駭客馬拉松和學習會議等舉措試驗AI工具;自上而下的技術則將高管聚集在一起,徹底重新思考AI如何改善欺詐管理、客戶體驗和產品測試等主要流程。

總的來說,麥肯錫的這份報告展現了一個清晰的資訊:AI不僅僅是一種提高生產力的工具,而是有潛力成為變革性超能力的合作夥伴,增強人類的能動性。那些能夠用可能性的想像替代對不確定性的恐懼的領導者,將發現AI的新應用不僅能最佳化現有工作流程,還能成為解決更大業務和人類挑戰的催化劑。這份報告為企業領導者提供了一個全面的框架,幫助他們理解如何在AI時代引領企業變革,並最終釋放AI的全部潛力。


21世紀AI如同蒸汽機般強大的創新

提示:這部分內容是報告的第一章,主要綜述了21世紀以來AI的快速發展,為企業未來可能的變革奠定基礎

“科學發現和技術創新是人類進步大教堂的基石。”—— 裡德・霍夫曼(Reid Hoffman),領英(LinkedIn)和 Inflection AI 聯合創始人、格雷洛克合夥公司(Greylock Partners)合夥人、《超級智能體:我們的人工智慧未來可能會怎樣》作者

想像一個世界,機器不僅能從事體力勞動,還能思考、學習並自主決策。在這個世界裡,人類也參與其中,人與機器共同協作,形成一種 “超級智能體” 狀態,提升個人生產力和創造力(見 “人工智慧超級智能體” 側邊欄)。這就是人工智慧的變革潛力,這項技術的潛在影響甚至可能超過過去從印刷機到汽車等最重大的創新。人工智慧不僅能實現任務自動化,還能進一步實現認知功能自動化。與以往任何發明不同,人工智慧驅動的軟體能夠適應、規劃、引導甚至做出決策。這就是為什麼人工智慧可以成為推動經濟實現前所未有的增長,以及幾乎在生活各個方面引發社會變革的催化劑。它將重塑我們與技術以及彼此之間的互動方式。

許多突破性技術,包括網際網路、智慧型手機和雲端運算,已經改變了我們的生活和工作方式。人工智慧從這些發明中脫穎而出,因為它不僅提供資訊獲取途徑,還能進行總結、編碼、推理、對話和做出選擇。人工智慧可以降低技能門檻,幫助更多人在任何語言環境下、任何時間,更熟練地掌握更多領域的知識。人工智慧有潛力改變人們獲取和使用知識的方式,從而更高效地解決問題,推動惠及每個人的創新。

在過去兩年裡,人工智慧取得了飛速發展,由於成本降低和功能獲取更加便捷,企業層面的應用也在加速。許多引人注目的人工智慧創新不斷湧現。例如,我們見證了上下文窗口(即大語言模型的短期記憶)的迅速擴展。上下文窗口越大,大語言模型一次能夠處理的資訊就越多。舉例來說,Google的 Gemini 1.5 在 2024 年 2 月能夠處理 100 萬個標記,而同年 6 月推出的 Gemini 1.5 Pro 則可以處理 200 萬個標記。總體而言,我們看到有五項重大創新正在推動人工智慧的下一波影響:增強的智能和推理能力、智能體人工智慧、多模態、改進的硬體創新和計算能力,以及更高的透明度。

人工智慧超級智能體
人工智慧將對人類產生何種影響?裡德・霍夫曼和格雷格・比托所著的《超級智能體:我們的人工智慧未來可能會怎樣》(Authors Equity,2025 年 1 月)一書探討了這個問題。該書強調了人工智慧如何能夠增強人類能動性,提升我們的潛力。它設想了一種以人類為主導、面向未來的人工智慧發展方式。

“超級智能體” 這一術語由霍夫曼提出,描述了一種狀態:個人在人工智慧的賦能下,極大地激發創造力、提高生產力,並產生積極影響。即使那些沒有直接接觸人工智慧的人,也能從人工智慧對知識、效率和創新的廣泛影響中受益。

人工智慧是一系列變革性超級工具中的最新成員,包括蒸汽機、網際網路和智慧型手機,這些工具通過增強人類能力重塑了我們的世界。與之前的工具一樣,人工智慧可以實現知識普及並實現任務自動化,前提是人類能夠安全、公平地開發和部署它。

智能和推理能力正在提升

人工智慧正變得越來越智能。一個指標是大語言模型在標準化測試中的表現。OpenAI 在 2022 年推出的 Chat GPT - 3.5 在高中水平考試中表現出色(例如,在 SAT 數學考試中得分處於第 70 百分位,在 SAT 語言考試中得分處於第 87 百分位)。然而,它在更廣泛的推理方面常常遇到困難。如今的模型智能水平已接近擁有高等學位的人。GPT - 4 能夠輕鬆通過美國律師資格統一考試,成績排名在前 10%,並且在美國醫學執照考試中,它能正確回答 90% 的問題。

推理能力的出現代表著人工智慧的又一次重大飛躍。推理增強了人工智慧進行複雜決策的能力,使模型能夠超越基本理解,實現更細緻的理解,並具備制定逐步計畫以實現目標的能力。對於企業來說,這意味著他們可以微調推理模型,並將其與特定領域的知識相結合,從而更準確地提供可操作的見解。像 OpenAI 的 o1 或Google的 Gemini 2.0 Flash 思維模式等模型,能夠在回應中進行推理,這為使用者提供了一個類似人類思維的夥伴,而不僅僅是一個資訊檢索和合成引擎。

智能體人工智慧正在自主行動
推理能力的不斷提升,使模型能夠自主採取行動,並在工作流程中完成複雜任務。這是一個意義深遠的進步。例如,在 2023 年,一個人工智慧機器人可以通過合成和總結大量資料(包括語音消息、文字和技術規範)來支援呼叫中心代表,為客戶查詢提供建議回覆。到 2025 年,一個人工智慧智能體可以與客戶進行對話,並在之後規劃其行動,比如處理支付、檢查欺詐行為和完成發貨操作。

“我一直認為人工智慧是人類正在研究的最具深遠意義的技術…… 比火、電或我們過去所做的任何事情都更具深遠意義。”—— 桑達爾・皮查伊(Sundar Pichai),Alphabet 首席執行官

“人工智慧,就像大多數變革性技術一樣,是逐漸發展的,然後突然到來。”—— 裡德・霍夫曼(Reid Hoffman),領英(LinkedIn)和 Inflection AI 聯合創始人、格雷洛克合夥公司(Greylock Partners)合夥人、《超級智慧型手機構:我們的人工智慧未來可能會怎樣》作者

軟體公司正在將智能體人工智慧能力嵌入其核心產品中。例如,Salesforce 的 Agentforce 是其現有平台上的一個新層級,使使用者能夠輕鬆建構和部署自主人工智慧智能體,以處理跨工作流程的複雜任務,如模擬產品發佈和協調行銷活動。Salesforce 聯合創始人、董事長兼首席執行官馬克・貝尼奧夫(Marc Benioff)將其描述為提供了一支 “數字勞動力”,人類和自動化智能體共同協作以實現客戶目標。

多模態、AI硬體與AI透明性
如今的人工智慧模型正朝著能夠更先進、更多樣化地處理文字、音訊和視訊資料的方向發展。在過去兩年裡,我們看到了每種模態質量的提升。例如,Google的 Gemini Live 提高了音訊質量並降低了延遲,現在能夠進行帶有情感細微差別和表現力的類人對話。此外,OpenAI 的 Sora 展示了將文字轉換為視訊的能力。

硬體創新以及由此帶來的計算能力提升,不斷增強人工智慧的性能。專用晶片使模型能夠更快、更大規模地運行,並且功能更加多樣化。企業現在可以採用需要高處理能力的人工智慧解決方案,實現即時應用和可擴展性。例如,一家電子商務公司可以通過部署由人工智慧驅動的聊天機器人顯著改善客戶服務,這些聊天機器人利用先進的圖形處理單元(GPU)和張量處理單元(TPU)。通過使用分佈式雲端運算,該公司可以在流量高峰期確保最佳性能。通過整合邊緣硬體,公司可以部署能夠分析受損產品照片的模型,從而更準確地處理保險理賠。

人工智慧的風險正在逐漸降低,但它仍然缺乏更高的透明度和可解釋性。這兩者對於提高人工智慧安全性、減少潛在偏差至關重要,而這對於企業大規模部署人工智慧來說是必不可少的。雖然還有很長的路要走,但新的模型和迭代正在迅速改進。斯坦福大學基礎模型研究中心(CRFM)報告稱,模型性能有了顯著提升。其透明度指數(採用 1 - 100 的評分標準)顯示,在 2023 年 10 月至 2024 年 5 月期間,Anthropic 的透明度得分提高了 15 分,達到 51 分,亞馬遜的得分增長了兩倍多,達到 41 分。

除了大語言模型,其他形式的人工智慧和機器學習(ML)也在提高可解釋性,使得支援重大決策(例如信用風險評估)的模型輸出能夠追溯到提供資訊的資料。通過這種方式,關鍵系統可以幾乎持續地進行測試和監測,以發現偏差,以及因模型漂移和資料輸入變化(即使是在部署前校準良好的系統中也會發生)而產生的其他常見危害。

所有這些對於檢測錯誤、確保符合法規和公司政策至關重要。公司已經改進瞭解釋性實踐,並建立了必要的制衡機制,但它們必須不斷髮展,以跟上不斷提升的模型能力。 (歐米伽未來研究所)