AI狂熱不敵冷峻現實:企業下調AI代理預期,實現全自動化仍需數年時間

媒體報導,企業正從AI代理的狂熱預期中回落:儘管AI聊天與編碼工具已提升效率,但能“接管整份工作”的AI代理在落地中頻頻受挫,不僅部署難、成本高,還常出現自信卻錯誤的輸出,難以用於客服和網路安全等關鍵環節。多家企業放緩全自動化計畫,轉向“人機協作”模式,並將AI代理視為需長期投入、短期難見成效的研發項目。一些科技高管預計,AI代理距離真正成熟落地仍需數年時間。

媒體報導,AI通過通用型聊天機器人和AI程式設計工具正在改變人們的工作方式,為OpenAI和微軟等公司的收入帶來增長,各家公司一直在嘗試把員工的工作內容交給人工智慧代理(AI agents)。

然而,許多企業在使用更複雜的AI代理時卻遇到了困難,這些代理往往“勝任不了工作”,因此AI提供商不得不親自介入、與客戶一起排查問題,避免AI“搞砸事情”。

例如,歐洲零售商Fnac在使用AI客服代理時遇到困難。Fnac曾測試過OpenAI、Google和其他實驗室的模型,但效果不佳。該公司首席數字與電商負責人Olivier Theulle對媒體表示,可靠性是個問題:當顧客反饋產品有缺陷時,AI要求顧客提供產品序列號,但卻把這些序列號與其他產品的序列號混淆了,而這些序列號僅有一位數字不同。

Fnac每年營收達100億美元。Theulle說,直到與以色列公司AI21 Labs達成合作,並獲得其工程師的協助後,這個AI代理的表現才開始變得穩定。AI21聯合CEO Ori Goshen說,

“問題在於,模型開箱即用時在各類基準測試上表現很好,但在真實企業環境中表現並不好。”

“需要進行相當程度的定製化。”

一些公司對媒體表示,只有在自家軟體工程師花上數月時間部署AI代理,並從AI公司那裡獲得直接技術支援後,他們才能真正從中受益。如今,科技公司領導者也表示,企業不能指望在沒有AI廠商“手把手扶持”的情況下,讓複雜AI項目順利運行。

風投Vinod Khosla在10月接受媒體採訪時表示,

“這就像說‘我們有輛賽車,任何人都能開’,但普通人根本無法發揮賽車的最大性能。”

Khosla是OpenAI的早期投資者,最近又投資了一家AI諮詢初創公司,該公司向T-Mobile等企業派駐工程師,幫助他們在大型組織內落地AI。這家初創公司Distyl只是眾多在該領域崛起的公司之一,它們為需要支援的企業提供高科技諮詢服務。OpenAI、Anthropic、Salesforce和Snowflake等AI開發商和AI代理提供商也開始招聘前線部署工程師(FDEs)或推出類似諮詢服務,但這往往會提高他們的成本。

另一個例子則是專為汽車經銷商提供軟體、年銷售額90億美元的Cox Automotive。此前該公司開發一個AI代理,用於為經銷商製作行銷網頁。由於該公司是亞馬遜雲服務AWS在汽車領域的最大客戶之一,所以得到了“白手套式的服務”。

Cox首席產品官Marianne Johnson對媒體表示,AWS工程師和為該代理提供AI技術的Anthropic工程師飛到Cox位於亞特蘭大的總部,與Cox的軟體開發人員並肩工作了數天共同建構這個工具。她拒絕透露Cox為此向AWS和Anthropic支付了多少費用,但估計未來數年可節省數百萬美元的人力成本,因為公司無需再人工為客戶製作網站。

“它很自信地胡說八道”

AI代理的目標是處理客戶服務問題、管理IT系統等各種任務。AI和雲服務提供商正在押注企業使用AI代理帶來的收入,將其作為未來一兩年投入數千億美元建設AI資料中心的理由。

但這些供應商以及部分客戶高管表示,AI代理太難配置,而且行為常常不可預測。這使得它們無法用於那些一旦出錯就會造成嚴重後果的任務。因此客戶降低了預期,不再奢望AI代理能自動化太多工作,並暫緩在客戶支援和網路安全等關鍵崗位部署AI代理。

例如,IT服務巨頭Kyndryl今年開始測試微軟的Security Copilot,這是一款聊天機器人,旨在對接企業IT系統,用簡單英語解釋潛在安全漏洞,相當於自動化網路安全分析師的工作。但負責公司內部網路安全的Scott Owenby對媒體表示,當Kyndryl員工嘗試詢問一些基礎問題,比如“那些公司裝置運行的是過期軟體”時,Security Copilot給出的答案明顯是錯誤的。Owenby說,

“它信心滿滿地胡說八道,而我佩服這種自信,但我無法相信它的資料。”

Kyndryl花了約5萬美元測試了Security Copilot六個月,之後決定停止使用這款軟體。Owenby說,

“我基本上是把5萬美元燒了。這不算多,如果那怕有一點用我們都會繼續用,但我們沒想到它居然完全沒法用。”

Owenby還說,其他AI工具效果更好,例如Palo Alto Networks的軟體可以自動處理網路安全中重複繁瑣的工作,例如調查員工從新地點登錄或擷取敏感資料截圖的情況。這使得他過去一年減少了部分安全團隊的人手,但他表示仍然需要工作人員監控這些AI工具,而不能完全讓AI全權執行。

“有些炒作成分”

博世電動工具(Bosch Power Tools)年營收超57億美元。該公司數字客戶體驗負責人Florian Haustein對媒體表示,公司一年多以來一直在測試一款聊天機器人,用於回答客戶關於工具使用方式和故障排查的問題。

但Haustein表示,這款聊天機器人仍然經常給出錯誤答案,一些錯誤答案甚至可能導致使用者受傷。因此,該項目仍停留在試點階段。他還表示,博世正在測試Google、OpenAI等多家實驗室的模型。

Haustein對媒體說,博世在另一個不那麼激進的客服聊天機器人上收效更好,該機器人只回答更基礎的問題,例如在那可以買到某款產品;還有一款由SAP提供的AI工具能讀取客戶諮詢內容,並自動分配給合適的人類員工。Haustein說,

“我認為‘完全用AI做客服’有些炒作。”

“你必須確保答案接近100%精準……但我們仍然看到幻覺和錯誤答案。我認為我們還沒有達到能夠完全自動化所需要的信心水平。”

一些技術供應商也承認AI代理還未成熟。亞馬遜CEO Andy Jassy在上周四的財報電話會上說:

“現階段,建構AI代理仍比想像中困難。”

“但隨著時間推移,企業從AI中實現的很多價值將來自AI代理。”

AI代理產品收入難計算

目前,通用聊天機器人、程式設計助手、AI搜尋和AI視訊生成工具的採用,已經幫助工程、市場和產品管理團隊提升了效率,企業高管們對媒體表示。

這推動了AI供應商的新收入增長:根據媒體的生成式AI資料庫,由OpenAI和Anthropic引領的20家AI原生初創公司,每年因AI辦公用途獲得的年化收入已達230億美元,而三年前幾乎為零。

但要單獨計算“AI代理”帶來的收入卻很困難。在Google、微軟和亞馬遜等雲公司,大部分收入增長來自OpenAI、Anthropic和Meta等大型AI開發商租用伺服器,而非企業類AI應用。

在出售AI代理的企業軟體公司中,結果不一。Salesforce今年早些時候表示,其Agentforce產品(用於自動化銷售郵件、跟蹤發票等任務)年收入超過1億美元。ServiceNow則稱,其用於自動處理IT服務工單的AI軟體,有望在2026年底前實現10億美元收入。但這兩家公司的收入增長最近幾個季度都比2023年大多數時間慢。

SAP尚未單獨公佈AI產品收入,但CEO Christian Klein在本月的財報電話中表示,AI將在未來兩年帶來“雙位數收入增長”。

許多提供AI代理的軟體公司,包括Salesforce、Snowflake和Xero,目前甚至沒有對這類產品收費,他們希望等客戶真正認可價值之後再收費。

ServiceNow全球客戶營運總裁Paul Fipps對媒體表示,近期客戶在試點AI功能方面不再那麼興奮,因為他們變得更加現實,開始考慮AI代理究竟能合理自動化那些任務。Fipps說,

“在過去12到18個月裡,由於生成式AI的發展速度太快,很多客戶積極試點這些AI能力,鐘擺被推到了極端的一側。”

“現在你看到鐘擺開始回擺。”

他仍然樂觀,認為隨著AI代理不斷進步,未來幾年企業會繼續大力投入。

目前,AI代理在軟體開發領域最成功。AI程式設計代理正成為許多公司工程團隊的標配。但軟體工程師仍需檢查AI的程式碼,因為AI會犯錯,意味著任務還不能完全自動化。

“保持現實”

Palo Alto Networks首席執行官Nikesh Arora表示,銷售AI工具的公司必須謹慎,不要過度承諾AI能自動化多少工作。他認為,網路安全崗位要實現完全自動化仍需數年。

“我們保持現實的態度,(完全自動化)需要更多努力,我們必須非常確定,當把操作交給AI時,它採取的行動是正確的,因為網路安全是有後果的。”

儘管如此,公司仍然認可AI代理帶來的收益,即使需要“有人看著”。例如,加拿大太陽馬戲團Cirque du Soleil正在使用SAP提供的一款AI代理,追蹤其服裝和舞檯布景供應商的發票。

當供應商發郵件詢問發票狀態時,AI代理會檢查SAP系統中發票是否處理完畢,並草擬回覆郵件。過去,該公司有兩名全職員工做這件事;現在,這兩人已被安排到其他部門,只需一人稽核AI草稿再發出即可。

該工具的營運成本低於一名全職員工的薪資,副總裁Philippe Lalumière對媒體說:

“有時候AI寫的郵件不太禮貌,但供應商得到回覆更快、更清楚,所以整體滿意度更高。我們沒有因為它裁員,但生產力提升很明顯。”

與此同時,其他AI代理供應商也提醒客戶,要把這些工具視為實驗性項目,而不是能立即帶來回報的投資。

微軟核心AI產品開發總裁Asha Sharma上周在The Information的WTF峰會上表示:

“把AI代理視為研發預算……一種將在未來5到10年見效的投資。”

“我認為我們還處在非常早期階段……我們現在有數百萬個AI代理投入生產使用,但大家仍然在摸索如何讓AI代理真正有用。” (invest wallstreet)