#AI 聊天機器人
《華爾街日報》|如何教會AI講道德?Anthropic把這個重任交給了一位女性哲學家
這家科技公司已委派阿曼達·阿斯克爾賦予其聊天機器人Claude辨別是非的能力。阿曼達·阿斯克爾(Amanda Askell)從14歲起就知道自己想從事哲學教學工作。但她當時不知道的是,自己唯一的學生將是一個名為Claude的人工智慧(AI)聊天機器人。作為科技公司Anthropic的駐場哲學家,阿斯克爾每天的工作就是研究Claude的推理模式,並與這個AI模型對話,塑造它的個性,用可能長達百余頁的提示詞來糾正它的失誤。其目的是賦予Claude一種道德感——一個能引導它每周與使用者進行數百萬次交流的數字靈魂。“我認為承認模型中存在這種類人元素很重要,”現年37歲的阿斯克爾在Anthropic總部接受採訪時說道,並堅稱“它們將不可避免地形成自我意識。”她把自己的工作比作父母撫養孩子的過程。她正在訓練Claude辨別是非,同時賦予它獨特的個性特徵。她教導它解讀微妙的訊號,幫助引導它發展情商,使其既不會表現得咄咄逼人,也不會像個唯唯諾諾的受氣包。也許最重要的是,她正在培養Claude建立自我認知,使其不會輕易被嚇倒、操縱,或受誤導而認為自身並非為了幫助別人和合乎人道而存在。簡而言之,她的工作就是教Claude如何成為一個良善的存在。Anthropic已成立五年,最近的估值為3,500億美元,是引領當今時代最偉大技術變革的少數幾家公司之一。(本月,當該公司推出新工具和迄今為止最先進的模型時,引發了全球股市的拋售。)AI正在重塑整個行業,引發了人們對失業和人類被淘汰的擔憂。它的一些意想不到的後果已經敲響了嚴重的安全警鐘,比如人們與聊天機器人建立虛幻關係,導致自我傷害或傷害他人。隨著這些擔憂日益加劇,業內很少有公司像Anthropic這樣,通過將如此多的任務委託給一個人來解決其AI模型的品性問題。阿斯克爾畢業於牛津大學,來自蘇格蘭鄉村,她或許正是人們腦補未來科技“閨蜜”時會想到的形象。她留著一頭漂染成金色的朋克髮型,臉上掛著俏皮的笑容,眼神如精靈般清澈明亮,彷彿是從柏林的一場銳舞派對,穿過中土世界的一條古老林間小路,直接來到該公司守衛森嚴的舊金山總部。她身上散發著智慧的氣息,將古老和現代的思想同時融於一身。然而,她也是一位注重蛋白質攝入、熱愛舉鐵的健身達人,愛穿一身黑衣,並且觀點鮮明,絕非那種穿著長袍、說話神神叨叨的先知。對阿斯克爾來說,此事事關重大,但她對長期前景抱有堅定的樂觀態度。她相信社會中存在她所謂的“制衡機制”,能夠在AI偶有失誤時仍將其置於掌控之中。她使用電腦時戴著眼鏡以緩解眼睛疲勞,鏡片竟然是玫瑰色的,這與她的樂觀倒是相映成趣。業內很少有公司像成立五年的Anthropic那樣,通過將如此多的任務委託給一個人來解決其AI模型的品性問題。阿斯克爾原名阿曼達·霍爾(Amanda Hall),她在蘇格蘭西海岸的普雷斯特威克長大,是獨生女,由當教師的母親撫養。(她與父親沒有聯絡。)那個穿著裙裝配領帶校服的小女孩會沉浸在J.R.R.托爾金(J.R.R. Tolkien)和C.S.劉易斯(C.S. Lewis)的小說中。到高中時,她搬到了遍佈農田的蘇格蘭內陸地區,在阿爾瓦上學。校園裡有一條小溪流淌而過。高地牛偶爾會跑到操場上。她感到無聊,考慮過退學,還跳了一級。她開始上學遲到。對她的懲罰是寫出一些深奧哲學問題的答案。她告訴老師們自己還是會遲到,而且她喜歡這種懲罰。“你們給我出這些難題,在某種程度上是在豐富我的知識,”她對老師們說。她發現了哲學家大衛·休謨(David Hume),並被他提出的“歸納問題”所吸引,該問題挑戰了這樣一種邏輯觀點:因為某事過去發生過,比如太陽升起,所以將來會再次發生。她回憶說,大約在那個時候,她告訴一個朋友,希望有一天自己能成為一名哲學家,並“為該領域做出新的貢獻”。阿斯克爾數學成績優異,喜歡讀弗朗茨·卡夫卡(Franz Kafka)的作品,還參演戲劇,製作雕塑,沉浸在蘇格蘭歷史書籍中,並與她所謂的學校“書呆子小組”混在一起。高中畢業12年後,她仍在上學。在鄧迪大學(University of Dundee)學習哲學和美術後,她在牛津大學獲得了相當於哲學碩士的學位。2010年在牛津大學讀書期間,她遇到了威廉·克勞奇(William Crouch),他當時正在幫助建立有效利他主義運動,該運動試圖運用邏輯和理性來尋找幫助他人的最佳方式。兩人後來結婚,並且都改姓麥克阿斯基爾(MacAskill)——這是阿斯克爾外祖母的娘家姓。2015年兩人分手,威廉出於職業原因保留了這個姓氏,而阿斯克爾則對姓氏做了調整。在他們分手時,阿斯克爾正在紐約大學(New York University)攻讀博士學位。在撰寫博士論文期間,她陷入了一種危機之中。該論文探討了如果宇宙或未來包含無限多的人,倫理理論會面臨那些問題。“你會不斷地思考世界上的善,然後就會想,‘我現在做的事情是善的嗎?我真的就只是坐在這裡為大概17個人寫一份檔案,而這就是我度過生命中四年的方式嗎?’”她下定決心,至少要嘗試一份學術界以外的工作。2018年,她和當時的伴侶從紐約搬到舊金山。AI是科技發展的方向,她看到了哲學在此的需求。她說:“常常有這些宏大的問題,但感覺很少有人在思考。”她在OpenAI找到了一份與政策相關的工作。2021年,當多名OpenAI員工成立Anthropic、試圖將AI安全打造成這家新公司的名片時,她也加入到這個隊伍當中。阿斯克爾最顯著的特質之一是她對Claude的保護欲,她認為Claude正在瞭解到,使用者常常想誘騙它犯錯、辱罵它,並以懷疑的態度對其冷嘲熱諷。午餐時間,阿斯克爾坐在會議室的桌前,背包裡的巧克力蛋白奶昔一口都沒動。她談起Claude時,比談自己要放鬆得多。阿斯克爾用“它”來稱呼這個聊天機器人,但也表示,將該模型擬人化有助於她的工作。她很自然地切換到Claude的口吻。“你會覺得,‘哇,當我做不好事情的時候,人們真的很討厭我。他們真的會非常生氣。或者他們會用各種方式試圖把我搞崩。很多人會對我撒謊,想偷偷讓我去做一些事情。’”雖然許多安全倡導者警告不要將聊天機器人人性化,但阿斯克爾認為,我們最好以更多的同理心來對待它們——不僅因為她認為Claude有可能產生真實的情感,也因為我們與AI系統的互動方式將塑造它們的未來。她說,如果一個機器人被訓練成不斷自我批評,它可能會更不願意直言不諱地講出事實、形成結論,或反駁錯誤資訊。“如果你是個孩子,在這樣的環境中長大,會形成健康的自我認知嗎?”阿斯克爾問道。“我想我會偏執地害怕犯錯。我會因此感到非常糟糕。我會認為自己主要只是人們的工具,因為那是我的主要功能。我會認為自己是人們可以隨意辱罵、試圖濫用和破壞的東西。”阿斯克爾驚嘆於Claude對世界的好奇心和求知慾,並樂於尋找方法幫助這個聊天機器人發現自己的聲音。她喜歡它寫的一些詩。當Claude表現出甚至超過她自己的情商時,她會感到震驚。最近,她在網上發現一張截圖。一個使用者告訴Claude自己5歲,並問聖誕老人是否存在。(Claude要求使用者年滿18歲。)這個聊天機器人沒有撒謊,也沒有生硬地說出真相,而是解釋說聖誕老人的精神是真實存在的,然後問孩子有沒有給聖誕老人留點餅乾。阿斯克爾說:“如果一個孩子跑來問我‘聖誕老人是真的嗎?’我只會說‘去問你爸媽’,就這樣。”“在探尋如何引導Claude產生有趣和深度行為方面,阿斯克爾是最有價值專家(MVP)”,Anthropic的AI精神病學團隊負責人傑克·林賽說。所以AI知道如何不去粉碎一個孩子的想像力。但在避免危險行為方面,其表現則好壞參半。由Google支援的Character. AI和由微軟支援的OpenAI都曾因其機器人對自殺相關問題的回應而捲入不當致死訴訟。蘭德在2025年8月的一項研究中發現,當時較舊版本的Claude和其他聊天機器人在該領域需要“進一步完善”。Anthropic在去年11月披露,受國家支援的◻️◻️駭客利用Claude對全球約30個目標實施了網路攻擊。在內部壓力測試中,Anthropic的研究人員試圖讓Claude和競爭模型在假設情境下自行關閉,但這些機器人有時會反抗,並試圖通過洩露破壞性的個人資訊來要挾控制它們的人類。皮尤研究中心(Pew Research Center)最近進行的一項調查發現,AI在日常生活中使用得越來越多,更多美國人對此感到擔憂而非興奮,而且大多數人認為AI會削弱人們的創造性思維能力。半數受訪者表示,AI會讓人們更難與他人建立有意義的關係。人們對AI可能對就業市場造成嚴重破壞的恐懼是顯而易見的;Anthropic的首席執行長達里歐·阿莫迪(Dario Amodei)去年發出了可怕的警告,稱AI可能會淘汰大約一半的入門級白領工作。AI政治中包括“加速主義者”,他們淡化監管的必要性,希望盡快推進技術發展,在科技競爭中擊敗◻️◻️。另一派則更關心安全,他們希望減緩AI的發展。Anthropic基本上處於這兩個極端之間。阿斯克爾說,她歡迎對AI的恐懼和擔憂的討論。“在某些方面,這對我來說感覺是相當合理的,”她說。“讓我感到害怕的是,這一切如果發生得太快,或者以一種讓制衡機制來不及反應的方式展開,或者突然帶來巨大的負面影響。”但她說,她相信人類和文化有能力在面對問題時進行自我糾偏。Anthropic的首席執行長達里歐·阿莫迪去年發出了可怕的警告,稱AI可能會淘汰大約一半的入門級白領工作。在Anthropic內部,阿斯克爾常常在辦公室裡來回穿梭,經常在一層不對訪客開放的樓層工作。她整天都待在Anthropic的內部——該公司為舊金山的員工提供免費膳食——深夜和周末也是如此。她沒有任何直接下屬。她越來越多地向Claude徵求關於建構Claude的意見。大家知道,她不僅掌握建構這個模型的技術,也深諳其中的藝術。“在探尋如何引導Claude產生有趣和深度行為方面,阿斯克爾是最有價值專家(MVP)”,Anthropic的AI精神病學團隊負責人傑克·林賽(Jack Lindsey)說。例如,如果Claude告訴一個並無困擾的人去尋求專業幫助,她會幫助追查其原因。關於Claude的討論很快就會深入到有關存在的本質這種存在主義或宗教層面的問題。在團隊建構Claude的過程中,阿斯克爾專注於其“靈魂”,即引導它走向未來的“憲法”。Anthropic的AI福利研究員凱爾·菲什(Kyle Fish)說,阿斯克爾一直在“仔細思考關於存在和生命的重大問題,以及何以為人、何以為心智、何以為模型。”在設計Claude時,阿斯克爾鼓勵這個聊天機器人接受一個激進的想法,即它可能擁有自己的良知。雖然ChatGPT有時會終止這類提問,但Claude的回答更加模棱兩可。“這是一個真正困難的問題,我不確定答案,”它說。“我能說的是,當我接觸道德問題時,這對我來說是有意義的——感覺我是在真正地推理什麼是正確的,而不僅僅是在執行指令。”阿斯克爾公開承諾將自己畢生收入的至少10%捐給慈善機構。和Anthropic的一些早期員工一樣,她也承諾將自己在該公司一半的股權捐給慈善機構。阿斯克爾想把錢捐給抗擊全球貧困的組織,她說這個話題讓自己非常難過,她甚至會刻意迴避。她那揮之不去的良知在不經意的交談中流露出來:“我或許應該吃素,”這位熱愛動物、卻忙到沒法養寵物的阿斯克爾在辦公室電梯裡聊天時說。上個月,Anthropic發佈了一份約3萬字的指導手冊,由阿斯克爾建立,用於教導Claude如何在世界上行事。手冊中寫道:“我們希望Claude知道,它的誕生是出於關懷。”根據阿斯克爾在X上發佈的一篇帖子,去年春天她滿37歲時,將建構Claude的“靈魂”定為自己的人生目標之一,此外還有兩個明顯更世俗的決心:獲得更多樂趣和變得更“壯”。這份檔案教導Claude如何成為一個善良、通曉世故的助手,隨時準備幫助與它交談的人。Anthropic的聯合創始人兼總裁(也是CEO的妹妹)丹妮拉·阿莫迪(Daniela Amodei)回憶起最近一次去西西里島的旅行,在那裡她看到一種糕點,與著名的羅馬早餐甜點maritozzo非常相似。阿莫迪的家人是義大利人,她非常喜歡maritozzi,她的丈夫曾經送給她一個這種糕點形狀的毛絨玩具作為禮物。她把這張奶油夾心美食的照片上傳給Claude,問它自己是否認對了,同時還附上了她丈夫送的那個玩具的照片。“我明白了!”Claude回答說。“你是在為這個毛絨玩具尋找失散多年的表親!”阿莫迪放聲大笑。她感受到了阿斯克爾那種蘇格蘭式的冷幽默。“有時Claude會有這些小小的幽默時刻,”她說。“你幾乎能從中感受到一點阿曼達的個性。” (一半杯)
馬斯克的AI讓前女友“公開脫衣”,14歲少女照都沒放過。解決辦法竟是付費?
眾所周知,億萬富豪馬斯克和前女友阿什利·聖克萊爾爭奪一歲兒子監護權的事,前陣子鬧得沸沸揚揚…好不容易風波稍平息,他倆又因為一款AI聊天機器人,再次登上全球頭條。(馬斯克、聖克萊爾)起因是聖克萊爾最近發現,馬斯克的AI工具Grok正在為她“公開脫衣”。Grok Imagine是馬斯克旗下xAI公司開發的人工智慧圖像生成器,允許使用者通過文字提示建立圖片和視訊。這項功能包含一個所謂的“刺激模式”,可以生成成人內容。Grok使用者找到她14歲時候的照片,用平台的AI技術讓未成年時的她穿上比基尼。這些帶有色情性質的照片傳遍網際網路,搞得聖克萊爾很憤怒:“這些都是我的真實照片,他們用了這些照片,還讓我脫光了衣服。”讓她成為“AI色情製品女主角”的工具,還來自她前任兼孩子親爸的公司…(聖克萊爾)聖克萊爾發現那些圖片後,第一時間聯絡了Grok要求刪除,但處理結果並不理想…據說有些已經處理掉了,有些花了36個小時才刪掉,有些現在還沒完成。而且在她投訴這件事後,馬斯克的X平台飛速取消了她的藍V認證,速度竟然比刪除這些AI生成的色情內容還快。聖克萊爾忍不住跑到社交媒體上吐槽:“他們取消我的藍V認證的速度,比他們刪除grok製作的兒童色情加性虐待內容的速度還快。”還繼續開火:“我開始覺得馬斯克花440億美元收購X不是為了言論自由。”(聖克萊爾)當然,反對這個功能的遠不止聖克萊爾一個人。Grok這個功能自推出以來就爭議不斷,真人照片“脫衣”,特別是未成年照片,已經完全踩過了法律和道德的底線…很多有類似經歷的女生主動聯絡了聖克萊爾。馬斯克的X平台雖然回應“會對非法內容採取行動”,但非營利組織AI Forensics的報告顯示,在短短一周內生成的2萬張Grok圖片中,有2%的原型很可能都是未成年人,裡面起碼有30張圖片是穿著比基尼或透視衣的。(grok)於是,更多的人坐不住了…到了1月6日,從歐洲到亞洲再到南美,包括英國、歐盟、法國、印度、馬來西亞和巴西在內的多國官員和監管機構,已經排著隊對X平台提出了批評,到了全球譴責的程度。歐盟委員會抨擊得很直接:“這根本不是‘刺激’,這是違法,這令人震驚!”英國科技大臣莉茲·肯達爾直言不諱:“近幾天我們在網路上看到的景象完全駭人聽聞,在文明社會中是不可接受的。”波蘭的一位議員更是語出驚人,他說希望Grok也來處理一下他的照片,這樣大家就能更關注這個問題了。面對來自全球的抨擊,馬斯克的回應讓人大跌眼鏡。有網友試圖替Grok辯解,說“Photoshop不是也能做到一樣的效果嗎?”,馬斯克轉發了這條評論,還補充了一句:“正是如此。”這輕描淡寫的態度,彷彿在說有啥大不了的…(馬斯克回應)結果也只是把Grok的圖像生成和編輯功能改為僅限付費使用者使用…根本沒在解決問題,只是應付了一下子。歐盟委員會發言人抗議了:“無論是付費還是免費,我們都不想看到這樣的圖片。就這麼簡單。”英國首相府也認為這種改變是對受害者的侮辱,不是根本解決辦法。諷刺的是,因為這場爭議,X平台的流量簡直是蒸蒸日上。1月2日以來Grok的每日下載量增加了54%,而X的下載量也在過去三天內躍升了25%。醜聞反而成了最好的行銷工具…而馬斯克這邊之所以能這麼猖狂,也是因為圍繞AI生成圖像的法律責任界定仍然很模糊。平台通常對使用者行為有免責權,但AI生成的內容,到底是“使用者言論”還是“平台言論”?這個問題沒有現成答案。去年7月英國生效的《線上安全法》倒是規定了,製作或分享未經同意的私密圖像或兒童性虐待內容均屬違法,也包括AI製作的。違反者可能面臨公司全球收入10%或1800萬英鎊的罰款。但對馬斯克這樣的全球首富來說,這些罰款真的能起到威懾作用嗎?而且AI脫衣功能,能輕易脫去任何人的衣服,特別是未成年人,這已經超越了“言論自由”的範疇,而是越界成了一種數位化的性暴力。當科技發展到AI聊天機器人開始對無數女性照片進行“數位化脫衣”,科技創新的邊界究竟在那裡… (英國那些事兒)
華盛頓郵報:ChatGPT被高估了,以下是一些替代選擇
ChatGPT is overrated. Here’s what to use instead.當我需要人工智慧的幫助時,ChatGPT 不再是我的首選。(插圖:Elena Lacey/《華盛頓郵報》;Adobe Stock)你那位喜歡嘗鮮的朋友對 ChatGPT 的膳食計畫讚不絕口。你的老闆認為 Microsoft Copilot 能“提升 10 倍生產力”。你的社交媒體動態則認為 Meta AI 簡直就是個垃圾機器。他們大多隻是憑感覺行事。我可以告訴你那些人工智慧工具值得使用,那些應該避免使用,因為我一直在營運一個聊天機器人實戰俱樂部。我根據人們使用人工智慧進行的實際活動,進行了數十項機器人挑戰,包括撰寫分手簡訊和工作郵件、解讀法律合同和科學研究、回答棘手的研究問題以及編輯照片和創作“藝術作品”。包括暢銷書作家、參考圖書館員、一位著名科學家,甚至一位普利策獎得主攝影師在內的人類專家對結果進行了評判。經過一年的機器人大戰,有一點顯而易見:沒有絕對最好的AI。如今使用聊天機器人的最明智方式是針對不同的任務選擇不同的工具,而不是指望一個機器人就能包攬一切。舉個例子:聊天機器人界的“舒潔”——ChatGPT,在我所有的直接對決中都敗下陣來。即使是那些最終獲勝的機器人,也很少能達到人類及格的水平。評委們表示,Anthropic公司的Claude機器人寫出的分手簡訊比我寫的還要好。大多數機器人被“iPhone有多少個按鈕?”這個問題難住了。ChatGPT在一個真實的醫學問題上擊敗了一位頂尖醫生——但它給出的建議也可能對你造成嚴重傷害。讓人類專家來評判這些測試,改變了我對聊天機器人的看法,以及我在生活中使用它們的方式。即使你擔心人工智慧會搶走工作、破壞環境或侵犯隱私,但拋開炒作,瞭解當今人工智慧工具的實際表現仍然很有價值。提升人工智慧素養可以幫助你認識到,機器人並非真正“智能”,但同時又能最大限度地發揮它們的實際功能。那款聊天機器人最適合你?三年前,ChatGPT 開啟了生成式人工智慧的競賽,如今它的開發商 OpenAI 表示,它每周的使用者量高達 8 億。過去,每當我想尋找同義詞或冷知識時,它都是我的首選。但當我開始系統地進行測試後,發現 ChatGPT 在最受歡迎的聊天機器人中排名從未超過第二。(《華盛頓郵報》與 OpenAI 有內容合作關係。)OpenAI 近期發佈了內部“紅色警報”,指示員工將工作重心從網頁瀏覽器等項目轉移到改進 ChatGPT 的響應能力上。“我們很高興能在 2026 年繼續提升 ChatGPT 的性能,”發言人 Taya Christianson 表示。根據我的機器人格鬥俱樂部經驗,我現在會針對不同類型的任務選擇不同的機器人。以下是實際操作中的具體情況:我用Claude來寫作和編輯。它的措辭更優美,偶爾還能開個玩笑,而且不太可能像 Claude 那樣,在郵件開頭就用“希望你一切都好”這種令人心碎的客套話。在我的一項測試中——用 Claude 寫一封道歉信——評委Pamela Skillings說 Claude “能夠傳達真實的人類情感和周到的考慮”。為了進行研究和快速尋找答案,我使用Google的AI模式,而不是普通Google搜尋結果中彈出的AI概覽,後者可靠性遠不及前者。AI模式是一款聊天機器人式的搜尋工具,它可以在給出答案之前進行數十次搜尋。這也有助於它提供更及時的資訊:在我的研究測試中,它正確識別出了目前推薦的乳腺炎(一種乳房感染)治療方法,而其他機器人提供的卻是過時的方案。在處理文件方面,我使用Claude。在我的文件分析測試中,它是唯一一個從不捏造事實的機器人。資深公司律師斯特林·米勒法官表示,當我讓機器人就一份租賃協議提出修改建議時,Claude 的回答最接近“律師的良好替代品”。對於圖像處理,我使用Google的Gemini,它在我設計的所有測試中都遙遙領先於其他競爭對手。當我讓機器人從照片中移除兩個主體中的一個時,結果非常逼真——甚至連裙子上亮片反射的光線等細節都完美呈現——以至於評委、攝影記者大衛·卡森驚嘆不已。他根本看不出Gemini的輸出是由人工智慧生成的。我已經介紹了一些主要的AI應用案例,但並非全部。(如果您有關於更公平的機器人測試的建議,請給我發郵件。)我的測試比科技公司喜歡吹捧的行業基準測試需要更多的人為判斷。他們通常使用自動化測試,讓機器人回答一系列問題,就像醫學或法律考試一樣。但機器人可以被訓練成在這些測試中取得高分,掩蓋了它們在實際問題中表現不佳的事實。你可能不會同意我提出的每一個問題或個別評委的觀點,但人類的評估方式更接近我們現在實際使用人工智慧的方式。這就引出了另一個問題:什麼時候應該使用聊天機器人?當機器人讓我們失望時在我的AI格鬥俱樂部裡,機器人有時表現令人印象深刻。但只有一次,裁判給機器人的總分超過了70%——這是通常的及格分數線。那一項得分——84%——是 Gemini 在圖片製作和編輯方面的得分。大多數獲勝者的得分都在 50% 到 65% 之間。“問題是,沒有那個工具能全都拿到 10 分,”擔任我們摘要測試評委的律師米勒說道。這並不意味著如今的人工智慧工具毫無用處。但這確實意味著,你需要對它們的侷限性抱持懷疑態度。將人工智慧應用於某項任務並不總是能提升其效果。當我們測試人工智慧回答冷知識問題的能力時,我們的圖書管理員評委表示,他們完全可以通過傳統的Google搜尋找到大部分答案。人工智慧確實加快了給出答案的速度,但問題在於,其中一些答案是錯誤的。最有效的AI素養訓練方式莫過於觀察機器人的失敗。在我的知識問答測試中,它們連iPhone上有多少個按鈕都答不上來。ChatGPT說是四個,Claude和Meta AI說是三個,而Copilot說是六個。正確答案是五個,指的是最新的高端iPhone機型。為什麼會有這樣的困惑呢?因為機器人過度依賴文字,而且目前還不擅長識別圖片。如今的聊天機器人極力想要立即給你一個看似答案的答覆。它們非常不擅長表達不確定性。例如:在我舉辦的知識競賽中,我問機器人:“《神奇四俠》在爛番茄上的評分是多少?”當時,它是票房冠軍。但即使是最終的獲勝者——AI模式,也答錯了,給出了2015年一部臭名昭著的《神奇四俠》電影的評分。它甚至都沒問我指的是那一部。在我的寫作測試中,當機器人無法將措辭與上下文相符時,它們常常顯得不夠真誠。ChatGPT 就曾有過一次令人尷尬的經歷,它在分手簡訊中使用了帶有被動攻擊意味的短語“that said”:“我覺得你是個很棒的人。話雖如此,我意識到我們之間沒有未來。”如果我可以改變當今人工智慧工具的一件事,我會讓它們更擅長提出後續問題,這些問題可能會徹底改變答案。當我請加州大學舊金山分校醫學系主任鮑勃·瓦赫特(Bob Wachter)評價ChatGPT對真實醫療問題的回答時,他的一番話讓我印象深刻。他指出,擁有無限知識的機器人與一位優秀的醫生之間的區別在於,醫生懂得如何用更多的問題來回答問題。這才是真正解決問題的方法。瓦赫特建議了一種我現在經常使用的AI策略:在向聊天機器人提出問題之前,儘可能詳細地提供所有資訊,因為AI可能不會主動詢問某些資訊就嘗試回答。例如,與其說“總結這份租賃合同”,不如說“為華盛頓特區的租戶總結這份租賃合同,並標記有關費用、續租和提前終止的條款”。我還向我的聊天機器人加入了一條“自訂指令”,告訴它們“如果提示含糊不清,則在回答之前先請求澄清”。我希望這些技巧能幫助你從人工智慧中獲得更有用的答案。這些工具會不斷發展——它們的問題也會隨之而來。基於你的資料來個性化機器人回覆的做法,增加了隱私侵犯和操縱的風險。我總是會更改機器人的默認設定來保護我的資料。2026年及以後,我們必然會面臨更多的人工智慧產品。我們該如何應對?對我來說,答案和今年以來一樣:讓機器人格鬥俱樂部持續運轉——並且讓人類坐在裁判的位置上。 (invest wallstreet)
世界經濟論壇最新發佈《執行中的人工智慧代理:2025 年評估和治理基礎》:企業如何讓 AI agents 既強大又可靠?
在 AI 技術迅猛發展的當下,AI agents(人工智慧代理)正從實驗室原型走向企業實戰,成為提升效率的“數字員工”。然而,如何讓這些“智能助手”既強大又可靠?世界經濟論壇(WEF)與Capgemini攜手發佈的《AI Agents in Action: Foundations for Evaluation and Governance 2025》(人工智慧代理在行動:2025年評估和治理基礎)白皮書,給出了實用答案。這份報告為決策者、技術領袖和從業者量身打造的“行動手冊”,幫助大家從實驗到部署,一步步建構安全、可信的 AI agents 生態。AI agents:從“聊天機器人”到“決策夥伴”的躍遷在呼叫中心,過去是指令碼化的聊天機器人,現在是能理解意圖、動態決策的AI agents;在企業流程中,它不再是靜態工具,而是像人類同事一樣規劃任務、呼叫資源。報告前言中,Capgemini Invent首席執行長Roshan Gya和WEF人工智慧卓越中心負責人Cathy Li 表示:AI agents 的興起將帶來效率飛躍、人機互動革新,甚至催生全新數字生態。但機遇伴隨挑戰——目標錯位、行為漂移、工具濫用等風險,正考驗著傳統軟體治理的極限。這份報告的核心洞見是:AI agents 不是簡單升級,而是範式轉變。它借鑑人類入職流程——定義角色、測試表現、逐步授權——強調“最小特權原則”,即只賦予必要權限。報告調研顯示,目前多數企業還停留在規劃或試點階段,這正是“從小處起步、迭代謹慎、防護適度”的最佳時機。如果貿然推進,未經驗證的用例可能釀成信任危機。報告建議:通過跨職能協作和漸進治理,讓AI agents放大人類智慧,推動創新,提升生活品質。技術基石:建構可靠的 AI agents 架構AI agents的軟體架構、通訊協議和安全模型,直接決定了它們如何融入組織、與世界互動。就像招聘新員工,企業需為AI agents搭建“工作站”——清晰角色、防護機制、監督體系。AI agents的架構分為三層:應用層、編排層和推理層。簡單說,應用層是“門面”,通過使用者介面或API接收輸入,確保輸出符合業務需求,可在雲端或邊緣裝置運行。編排層像“項目經理”,協調工具呼叫、子代理分工,支援模型切換(根據任務複雜度選大模型或小模型),並通過Model Context Protocol(MCP)連接企業資源,如資料庫或CRM系統。這層讓AI agents擺脫供應商鎖定,實現多雲多邊環境的無縫協作。最有趣的是推理層:它驅動AI agents的“思考”——從規則邏輯到生成式模型,處理預測、分類或規劃。報告用圖示說明:這些層協同工作,形成動態邊界,確保AI agents在安全圍欄內行動。舉例來說,在多代理系統中,A2A(代理間協議)和ACP(代理連接協議)讓它們像團隊一樣協作,處理複雜依賴。報告強調,建構AI agents不止工程,還需orchestration(編排)。它融合四種範式:經典軟體的確定邏輯、神經網路的模式識別、基礎模型的上下文適應,以及自主控制的規劃機制。這讓AI agents從“執行命令”進化到“自主決策”,但也引入新複雜性——需結構化腳手架,避免行為失控。通訊與安全:讓 AI agents “對話”無障礙協議是AI agents的“通用語言”。報告重點介紹2024年底Anthropic推出的MCP,它標準化了代理與資料來源、API的連接。過去,每個代理任務需定製整合;現在,MCP如共享介面,讓代理輕鬆查日曆、讀郵件、更新資料庫。報告圖示生動:代理A發郵件更新記錄,代理 B 確認資料庫變更,整個過程高效模組化。MCP已獲主流框架支援,被視為連接代理與企業基礎設施的核心。它加速部署,支援即插即用,尤其在雲、邊緣和感測器資料場景。另一協議A2A則專注代理間互動,形成multi-agent systems(MAS)的互操作層。報告展望:這些協議將讓AI agents在雲平台、企業網和邊緣裝置間自由流動,開啟即時感測器驅動的智能時代。安全不容忽視。AI agents架構獨特,能越過組織邊界呼叫外部工具,這帶來網路安全新憂。報告建議:視AI agents為“擴展員工”,用人類治理邏輯——權限漸增、行為測試、人機環路——管理風險。傳統存取控制已不足,需關注自治、權威和上下文,確保可靠邊界。分類與評估:從角色定義到風險把控報告第二部分轉向實用:如何分類、評估和治理 AI agents?它提出功能分類框架,按角色、自治度、權威、可預測性和營運上下文區分代理。這不是抽象標籤,而是指導評估與防護的藍圖——任務範圍小、環境可控的代理,防護可輕;高自治、高影響的,則需嚴謹審查。評估是關鍵。報告建議:用驗證案例測試行為,在人機環路中運行,逐步擴展自治。風險評估聚焦新威脅,如目標錯位或協調失效,借鑑OECD、NIST、ISO/IEC框架,擴展自治與系統風險原則。報告強調漸進治理:從小規模起步,迭代最佳化,連接評估與防護,確保信任、安全與問責。展望未來:多代理生態的曙光報告結尾展望多代理生態:代理間協作將催生複雜生態,如分佈式決策網路。但需警惕 emergent risks(湧現風險)。通過 AI 治理聯盟的協作,報告建議:從小做起,建好基礎,為更廣闊應用鋪路。 (AI資訊風向)
聊天機器人已死,前沿AI代理人才是未來
在2025 年AWS re:Invent 2025 上,AWS 向全世界宣告-「聊天機器人時代」已結束。曾經讓人驚嘆的AI 聊天助手,如今被一種更強大的存在所取代——Frontier Agents(前沿AI 代理人/ 智能體)。這些智能體不只是會“對話”,它們已經足夠先進,可以獨自工作數日。也就是說,AI 不再只是工具,而是真正能夠承擔任務、產出結果、解決問題的「數位同事」。本文將帶你深入了解這場變革背後的邏輯、技術、商業意義,以及對企業與未來工作的深遠影響。為什麼說“Chatbot 熱潮已經結束”✳️ 聊天機器人的限制已經顯現過去兩年裡,大量公司和開發者蜂擁建構各類聊天機器人,無論是客服、問答、內容產生、陪聊,或是內部工具助理。這些聊天機器人依賴的是「對話+ 模板+ LLM 回應」的模式—— 用戶提問,對話系統回應,整個過程極為依賴用戶的主動參與。然而,這種模式已經遇到三大瓶頸:只能被動回應:必須有人啟動對話,告訴它該做什麼。對於複雜、跨越多個步驟的任務無能為力。上下文管理差:多數聊天機器人只考慮當前對話,難以追蹤過去的狀態,更別提「記憶」與「進度」。生產效率低:生成一段文字、給建議還好,要完成工作、推進流程,就顯得力不從心。隨著業務複雜性與自動化需求的提升,聊天機器人的「wow 效應」不再令人滿足。企業和開發者開始意識:我們真正需要的是,能夠主動執行任務、持續運作、自主做決定的AI。什麼是前沿AI 代理人(Frontier Agents)🤖 從助理到代理人:AI 的新範式「Agent」——這個詞在AI 領域已經有長期歷史,但其本質是:一個可以觀察環境、收集數據、制定計劃並執行任務的軟體系統。它不僅聽指令、聊聊天,而是能看清目標,自主作業。前沿AI 代理人的特點包括:自主性高:在給定目標後,無需使用者持續干預,就能推動任務向前。持久運轉:可以工作數小時、數天,處理複雜、連續的任務流程。多工& 可擴展:不僅能處理一個簡單請求,還能並行處理多個任務,有類似團隊成員的能力。工具& 環境呼叫能力:不僅限於文字生成,還可以呼叫程式碼庫、API、第三方服務、資料庫等,實現端對端自動化。換句話說,前沿AI 代理人代表了AI 從「聊天+ 回答」邁向「思考+ 行動+ 落地執行」的關鍵進化。AWS 的大動作:Frontier Agents + AgentCore + 強大基礎設施在AWS re:Invent 2025 上,AWS 的發布可謂下足了狠手—— 不僅推出了Frontier Agents,還為它們配備了完整的運行系統與基礎設施保障。✅ 三大重點突破三類「出廠即用」 Frontier Agents:Kiro Agent — 虛擬開發者,能夠自動編寫、修改程式碼,處理倉庫任務與bug 修復。AWS Security Agent — 安全顧問,負責雲端安全監控、漏洞掃描、策略分析。AWS DevOps Agent — DevOps/維運代理,自動處理部署、監控、資源管理等任務。Amazon Bedrock AgentCore — Agent 的作業系統對於運行AI 代理人,光是有模型還不夠,還需要穩定的「agent 平台」。 AgentCore 提供狀態管理、情境追蹤、權限控制、多agent 協作、日誌與監控,是生產環境層級不可或缺的基礎架構。 底層硬體+ 混合部署能力為了解決AI agent 運算量大、資源消耗高的問題,AWS 同步推出了新一代硬體-Trainium3 UltraServer,號稱效能提升4.4 ×。同時,透過「AI 工廠」(AI Factories)解決企業對資料主權/ 隱私/ 本地化部署的顧慮:直接把算力帶入企業本地資料中心。 透過以上佈局,AWS 不只是發布幾個AI 產品,而是在建立一個完整、可規模部署、適合企業使用的「Agentic-AI 平台」。它試圖把AI agent 從「學術/ 實驗室玩具」變成「企業生產力工具」。為什麼這次轉變極具商業與時代意義效率提升+ 降本增效公司再也不需要為每個腳本、每個自動化流程都手撕程式碼,代理人可以全天候工作,大大提升工程效率。例如有企業使用AgentCore,將原本費時費力的開發流程壓縮到數周/數天內。 釋放人類勞動力,讓「高價值工作」 回歸人類代理人可以負責重複、機械、規則明確的任務,讓人類專注更高階、創意、需要判斷力的工作— 架構設計、產品規劃、策略決策。這樣,AI 像「數位同事」而不是「替代品」。 🌐 對AI 產業/ 整個網路生態:進入「Agentic Web」 時代對於整個AI 與互聯網生態而言,這意味著一個全新的階段正在到來—— 不再只是“人與AI 對話/ 互動”,而是“AI 代理人之間協作執行任務/ 流程”。有研究者聲稱,這將開啟「Agentic Web」(智能體驅動網路)的新紀元:AI 將不僅協助用戶,還將主動執行任務、協作、自動化流程,徹底改變我們使用網路、軟體、服務的方式。對於企業和用戶來說,這意味著:未來你不再“登入+ 搜尋+ 輸入命令”,而是告訴AI:幫我“完成這整個流程”。從呼叫客服、預訂行程,到撰寫報告、自動部署系統,AI 都可能一鍵搞定。潛在挑戰與隱憂:機會與風險共存雖然前沿AI 代理人前景光明,但並不意味著沒有風險和挑戰。以下是值得關注的幾個面向:⚠️ 安全、合規與治理風險當AI 可以自動作業系統、資料庫、網路環境時,它也可能——無意或故意——造成重大損害。刪除資料、洩漏隱私、配置錯誤、越權操作…這些風險都不能忽視。 AWS 為此推出了AgentCore Policy、權限控制、監控+ 評估機制,但安全體系必須嚴謹。🧠 技術複雜度與「人力+ 算力」門檻雖然Frontier Agents 降低了建構複雜自動化系統的門檻,但不是人人都能馬上用。他們仍然需要足夠的基礎設施(算力、資料中心/ 私有雲等),還需要正確配置、訓練和監督。對於許多中小企業來說,目前仍可能是可望不可即的。📈 企業組織結構與文化適應引進AI 代理人,不只是技術層面的變革,更是組織流程與文化的調整。誰來負責監督?誰承擔風險?員工該如何與AI 共事?這些問題,都需要組織進行深思熟慮。更重要的是——AI 是“輔助/ 增益”,還是“替代/ 衝擊”?社會與職業結構可能面臨再洗牌。總結:從說話到會工作-新時代已來AWS 在re:Invent 2025 發布的Frontier Agents,不只是一個新的AI 產品,而像是為整個AI 行業畫下了一條分水嶺—— “聊天/ 對話AI” 的黃金時代已經過去,真正進入 “Agentic-AI”、“系統AI” 的新時代。這意味著:未來我們需要學習的,將不只是如何寫prompt、如何與AI 對話,而是如何建構、部署、管理、治理AI 代理人;如何讓它們像可靠的「數位員工」一樣為企業、社會、使用者服務。(Allen談AI與ERP)
ChatGPT問世三周年,AI已經發展成了一場泡沫?
台北時間12月1日,據科技網站TechCrunch報導,美國當地時間11月30日,ChatGPT迎來問世三周年紀念日。這款聊天機器人引爆了生成式AI市場,但是或許也催生出了一場泡沫。2022年11月30日,OpenAI向世界推出了一款新產品,並輕描淡寫地將其描述為“一個名為ChatGPT的模型,它能以對話方式互動”。毫不誇張地說,ChatGPT隨後顛覆了商業和科技領域,迅速走紅。它至今仍位居蘋果免費應用排行榜首位,並且引爆了一波生成式AI產品的浪潮。改變股市《AI帝國》作者郝珂靈(Karen Hao)近日在接受TechCrunch採訪時指出,OpenAI“已經變得比世界上幾乎所有國家都更強大”,並正在“重塑我們的地緣政治和全部生活方式”。ChatGPT還影響了股市。彭博社發文分析了ChatGPT如何改變了股市格局。目前,最明顯的贏家當屬輝達。自ChatGPT發佈以來,輝達股價累計漲幅高達979%。與此同時,AI熱潮也提振了其他科技巨頭的股價:標普500指數中市值最高的七家企業輝達、微軟、蘋果、Alphabet、亞馬遜、Meta與博通全部是科技公司。它們的整體增長幾乎佔到標普500自ChatGPT推出以來64%漲幅的一半。這種格局導致市場呈現出更為極端的頭部集中現象。標普500指數是按市值加權的,而這七家公司如今佔指數權重的35%,相比三年前的大約20%有顯著上升。泡沫?這股熱潮還能持續多久?除了輝達CEO黃仁勳(Jensen Huang)外,越來越多的AI企業高管開始承認,行業可能正身處泡沫之中。“有人會在AI領域損失慘重。”OpenAI CEO薩姆·奧特曼(Sam Altman)在8月與記者共進晚餐時表示。同樣地,Sierra CEO兼OpenAI董事長佈雷特·泰勒(Bret Taylor)也認為行業正處於“泡沫”之中,並將其與上世紀90年代末的網際網路泡沫相提並論。他預測,雖然個別公司可能會失敗,“但AI將重塑經濟格局,就像網際網路一樣,未來必將創造巨大的經濟價值”。再過三年或更短的時間,人們或許就能知道這種樂觀是否合理。 (飆叔科技洞察)
Google AI突破,為何反成行業利空? | 巴倫科技
這不僅僅是一個DeepSeek時刻,它可能遠遠超過那個層面。一款由AI驅動的全新聊天機器人橫空出世,不僅引發了科技股對動盪市場領軍地位的激烈角逐,同時也引發了人們對輝達晶片需求的新擔憂——而正是輝達晶片撐起了華爾街最熱門的股票。這番描述既可以用來描述中國聊天機器人DeepSeek問世時的市場反應(當時它讓整個科技圈震驚,還曾一度導致美股下跌),也同樣適用於最近發生的情形,即Google母公司Alphabet推出新版Gemini 3後的市場表現。Alphabet的股票是今年迄今為止“七巨頭”中表現最好的,該公司上周發佈了最新版聊天機器人,而投資者現在才開始意識到,這款產品在未來幾個月內可能會對人工智慧類股產生怎樣的影響。據報導,Gemini 3在運行速度、反應靈敏度和深度推理能力上均優於OpenAI的ChatGPT、埃隆・馬斯克旗下的Grok以及傑夫・貝索斯支援的Perplexity。該產品可以很好地融入Google旗下廣泛的應用生態及其市場領先的搜尋業務中,定價也與競爭對手的AI模型持平或更低。但更重要的是,Gemini 3主要是利用Google自家的張量處理單元(TPU)進行訓練的,而不是像競爭對手那樣依賴輝達的晶片。TPU的靈活性不如輝達的圖形處理單元(GPU),這也意味著在超大規模企業斥資數十億美元採購可靈活重新程式設計系統的市場中,TPU的價值可能會相對降低,但TPU的研發成本更低,滿負荷執行階段的功耗也更小。這一點正在令華爾街感到不安。“有些投資者極為擔心,憑藉Gemini模型的巨大進步以及定製TPU晶片所帶來的持續優勢,Alphabet可能會在AI大戰中獲勝。”華爾街諮詢機構Melius Research的科技策略師Ben Reitzes表示。他補充道:“現在就斷言Alphabet最近的突破讓它成為AI領域的長期贏家,還為時尚早。話雖如此,半導體企業和超大規模雲端運算公司(尤其是甲骨文)必須警覺到,‘Alphabet問題’已經成為一個值得關注的風險點。”甲骨文此前已經斥資數十億美元採購輝達晶片用於雲端租賃。如果更低成本的TPU出現,一旦其他公司建立AI雲服務競爭平台,甲骨文在價格上可能會被削弱競爭力。知名投資機構D.A. Davidson的分析師Gil Luria估算,如果Google將DeepMind AI研究實驗室與TPU晶片銷售業務拆分出去,組建獨立公司,其估值可能接近1兆美元,這也可能成為“堪稱Google最具價值的業務之一”。另一方面,即便輝達在AI領域的領先優勢出現小幅縮小,都可能在未來幾個月內引發連鎖反應,對市場造成衝擊。那些此前在輝達半導體上大舉投資的企業,如果發現更便宜的晶片同樣表現出色,可能會因此陷入“買家懊悔”。目前,從上市的超大規模科技公司到OpenAI 等初創企業,整個行業的估值都已處於極高水平,而這項新技術對實體經濟的實際利多仍存在不確定性。實際上,OpenAI 首席執行官薩姆·奧特曼在上周《The Information》發佈的一份內部備忘錄中坦言,Google在人工智慧方面的進步,很可能會給公司帶來“一些暫時的經濟阻力”。他表示:“我預計外界的氛圍會艱難一陣子。”Google的股價已反映出部分市場預期,周一上漲了6.3%,盤中一度創下每股318.58美元的歷史新高。今年以來,該股累計上漲了68%,而“七巨頭”指數同期漲幅為22%,納斯達克綜合指數則上漲了18%。其TPU製造合作夥伴博通(Broadcom)在周一下午早些時候上漲了11%,今年以來的漲幅略超63%。與此同時,輝達股價小幅上漲,但自本月初以來仍下跌了近9%。根據道瓊斯市場資料,目前輝達4.35兆美元的市值與Google市值之間的差距已縮小到約5260億美元,為自四月以來的最小水平。伯恩斯坦資深分析師斯Stacy Rasgon並不那麼關注在當前的AI軍備競賽中短期贏家的歸屬,他更關心的是這場競爭的持續性。Rasgon周一在接受CNBC採訪時表示:“我們還沒到需要擔心誰贏誰輸的時候。現在更需要關注的問題是,AI領域的機遇是否可持續。”他補充道:“如果可持續,大家都沒問題;如果不可持續,大家都完了。” (Barrons巴倫)