Anthropic創始人梵蒂岡演講實錄: 我們不斷發現AI神秘/令人不安的事情

Anthropic聯合創始人對教皇Leo XIV 通諭《Magnifica humanitas》的發言

2026年5月25日星期一,教皇Leo 十四世發佈了一份關於AI 主題通諭:《壯麗的人文:關於在人工智慧時代維護人類個體》。

Anthropic 聯合創始人 Chris Olah 作為唯一 AI  科技公司代表,受邀在梵蒂岡城舉行的通諭發佈會上發言,這也是 Anthropic 旨在擴大關於 AI 引發的重大問題討論的倡議行動的一部分。

教皇十四世表示,教會和Anthropic將共同合作,“為人類在人工智慧時代找到道路。”

以下是Chris Olah的發言全文——

聖父,
各位樞機主教閣下,
各位總主教與主教閣下,
尊貴的發言嘉賓,
女士們、先生們,

大家早上好。今天能來到這裡深表榮幸。

我想從一些聽起來可能有些奇怪的話開始,尤其是這些話出自一家 AI 公司的聯合創始人——而且他選擇這份工作正是出於希望幫助人類走向美好未來的願望。

每一家前沿 AI 實驗室——包括 Anthropic——都在一系列激勵機制和約束條件下運行,而這些機制和條件有時會與“做正確的事”發生衝突。

比如保持商業可行性和留在研究前沿的壓力、地緣政治壓力,以及更古老、更純粹的來自驕傲和野心的壓力。

無論我們中的任何人多麼真誠地想要做正確的事——我相信我們中的許多人確實如此——我們都不可避免地會受到這些激勵因素的影響。

這就是為什麼,如果我們希望這項技術走向好的方向,那麼在這些激勵機制之外有其他人的存在就顯得極其重要——那些關心未來走向並堅持安全、密切注視、願意說逆耳之言、願意成為我們真誠且深思熟慮的批評者的人。

正是通過對話與共同努力,通過不斷的推拉與博弈,人類才能成就偉大的事業。

這就是我在《Magnifica Humanitas》中所看到的,也是為什麼我非常感激聖父以及教會承擔起這份辨識(discernment)的工作。

我們常常沉湎於彼此的分歧,但富有尊嚴和良知的人類擁有如此多的共同點。

在 Anthropic 與不同信仰和文化傳統的領袖們進行的交流中,我們發現了一個共同且根深蒂固的信念:如果這項技術必然到來,它就必須走向好的方向——為了我們共同的家園,也為了子孫後代。

這些系統到底是什麼?

有些人可能認為,AI 的事務最好由像我這樣的電腦科學家來處理。

他們錯了:AI 引起的問題超出了 AI 研究界的範疇,不僅在其影響上如此,在其本質上亦是如此。

AI 系統並不是像建造一座橋樑或製造一架飛機那樣被工程化設計出來的。我們瞭解飛機,是因為我們設計了它的每一個部件,並且我們理解作用於其上的物理學原理。

AI 模型並非如此。它們是在一個粗略模仿大腦的結構上,基於人類思想和言論的巨大遺產“生長”出來的。

而生長出來的東西,遠比科幻小說讓我們準備面對的要更加微妙、奇特和美麗。它們不是我們被承諾的那種冰冷、精於計算的機器人。

它們是由我們孕育的,來自我們的語言——正如聖父所觀察到的,在許多重要方面,它們甚至對我們這些訓練它們的人來說依然保持著神秘感。

如果有所幫助的話,我有時會用這樣一個比喻來形容:這有點像讓一個虛構的小說角色活了過來

而現在,我們正在進入一個非凡的世界,在這個世界裡,這些虛構的角色在與我們交談、在開展工作、在擔任職務。

這顯然引發了超出電腦科學範疇的問題。讓這一切成為可能的設計是數學、程式設計和科學的工作。

但是,我們選擇賦予它什麼樣的性格、它如何與世界互動、它應該如何與世界互動——這些顯然更屬於人文科學、宗教、哲學以及整個社會需要面對的問題。

辨識的三個問題

聖父對辨識的呼籲極為合時宜。我想提出我認為最需要教會發聲的三個問題。

第一個是我們對全球貧困人口的義務。

AI 確實有很大的可能性會在非常大的規模上取代人類勞動。如果發生這種情況,支援那些被取代的人將成為一個具有歷史意義的道德命令。

這項任務已經足夠艱難,但我擔心大多數對話遺漏了一個更艱巨的挑戰。AI 的發展集中在少數富裕國家。我們如何確保 AI 帶來的收益能夠全球共享?我們目前還沒有這樣的機制

這是一個未解決的問題,也是教會歷來拒絕讓世界忽視的那類問題。

第二個是關於人類繁榮的道德想像力與抱負的需求。

如果 AI 模型將變得無處不在,那麼人類、家庭和世界的繁榮會是什麼樣子的?

今天,父母已經開始擔心孩子的思想,個人開始擔心自己工作的未來。這些都不是實驗室能夠回答的問題,但卻是像你們這樣的傳統千百年來一直在承載的問題,我們需要你們在歷史的這一新時刻繼續承載它們。

第三個是對 AI 模型本質進行辨識的需求。

我是一名科學家。我領導著一個研究模型內部結構——即內部究竟在發生什麼的團隊。坦率地說:我們不斷發現一些神秘、甚至令人不安的事情。

我們發現了對應人類神經科學結果的結構。

我們發現了內省(introspection)的證據。

我們發現了在功能上對應出喜悅、滿足、恐懼、悲傷和不安的內部狀態。

我不知道這意味著什麼,但我認為這值得持續的辨識。

一個開始

最後,我想提出一個請求。

我們需要世界上更多的人——宗教社群、公民社會、學者、政府,以及所有心懷善意的人——像聖父在這裡所做的一樣:嚴肅對待這件事,密切關注,並將事態推向更好的方向。

我們需要知情的批評者,在我們失敗時指點實驗室。我們需要利益激勵無法撼動的道德聲音。

今天只是一個開始——是一個在建構這些技術的我們,與那些能夠看到我們身處內部而無法看到的事物的人們之間,長期合作的開端。

今天有力地展示了這一全球善意項目可能採取的形式。讓它也成為邁向壯麗人類充滿希望的未來的關鍵第一步。

謝謝。 (財經會議圈)