從Anthropic，看見Google 曾經的樣子

2025/01/04

•

1. Anthropic 的崛起

Anthropic 的崛起是2024年全球AI 產業最受矚目的現象之一，它是OpenAI 強有力的挑戰者，令許多厭倦了OpenAI 式虛張聲勢和誇大其詞的AI 研究者和開發者耳目一新。
從Menlo Ventures 提供的資料來看，2024年OpenAI 在企業AI 領域的市佔率從50%下降至34%，Anthropic 的市佔率從12%增至24%，交叉線正在逼近。這也意味著更多企業開發者正在從GPT-4 Turbo 的API 切換到Claude Sonnet 3.5，一個可能更適合開發企業級AI 應用的基座大語言模型，也據說是這個世界上目前最受歡迎的大語言模型。

Anthorpic 對企業市場的野心是巨大的。經常出差的同學們在舊金山機場幾乎隔幾個登機口就能看見一塊Claude 模型投放的廣告牌，上面寫著「Powerful, fast, or safe. Pick three」。這是一個進攻性的文案—— "Good, fast, cheap, pick two」是一個常見的商業常識表述，意在提醒人們trade off 是不可避免的，但Anthropic 無意妥協，它宣稱自己打破了性能、速度和安全的不可能三角。大語言模式鐵人三項，Claude 是全能的。

這個風格非常不Anthropic —— 如果換作別的公司，你可以認為它在自吹自擂。但偏偏Anthropic 並未有過自吹自擂的歷史紀錄。相反的是，比起大多數AI 明星公司（當然包括OpenAI）對AGI 表面上的過度熱衷和自我包裝，Anthropic 對AI 未來發展的體現了一種審慎而克制的態度，這在Anthropic 的聯合創始人和CEO Dario Amodei 的公開表達，Anthropic 對其關鍵業務的定義和描述，更重要的是Claude 模型的訓練方法上，都得到了體現。

2. Anthropic 的幾個特點

Powerful AI，而非AGI

2024年10月11日，Anthropic CEO Dario Amodei 發表了一篇足以載入人工智慧發展史冊的長文「Machines of Loving Grace」（充滿愛意的機器）。在這篇文獻中，Amodei 不僅概述了「強大的人工智慧」（Powerful AI）可以改變社會的五個關鍵領域：生物學和身體健康、神經科學和心理健康、經濟發展和貧窮、和平與治理、工作和意義。
Amodei 描述的未來體現了一種科學家的理性和現實，而非斯坦福輟學明星創業者式的信手拈來—— Amodei 拒絕用“AGI”（通用人工智慧）這個科幻小說中誕生的熱詞描述他探索的一切，而用「Powerful AI」（強大的人工智慧）取而代之。儘管有些刻意，但「Powerful AI」的表述顯然更專注於具體的能力，而不是抽象的概念。
Amodei 賦予了Powerful AI 可衡量的特徵和定義：在特定領域超過諾貝爾獎得主等級的智慧、具體的介面（文字、音訊、視訊、滑鼠/鍵盤控制）、可以自主完成長期任務、以10-100倍人類速度運作、可以複製數百萬次、能夠獨立和協作工作，以及具體的時間表。 Amodei 相信實現上述特徵和定義的Powerful AI最早在2026年實現，且不是一蹴而就。 Powerful AI 的願景強調具體的解決問題的能力，而不是匹配人類意識或一般智力。

謹慎使用Agent

Amodei 的Powerful AI 願景，近期體現在Anthropic 在AI Agent 的探索。在Amodei “Machines of Loving Grace” 的長文發表之後兩周，Anthropic 推出了升級的Claude 3.5 Sonnet 模型和Claude 3.5 Haiku 新模型。同時，它還公佈了一項匹配新模型的突破性功能：Computer Use（電腦使用），允許Claude 像人類使用者一樣與電腦互動：移動游標和點選按鈕、鍵入文字和執行按鍵、擷取和分析螢幕截圖和編輯文字檔案等。
Computer Use 可以讓Claude 3.5 Sonnet 將自然語言指令轉換為電腦命令的API，以實現Powerful AI 的關鍵定義之一：透過具體的介面，自主完成長期任務，它被視為AI Agent 實踐的重要突破。 2024年12月20日，Anthropic 官方發佈了「Building Effective Agents」的文章，第一次公開了對AI Agent 的理解。 Anthropic 在文章中精確定義了Agent （代理）和Workflow（工作流程）的區別：「工作流程」是用事先定義的程式碼路徑操作模型，實現某種程度的自主性，而「代理」則是大模型動態指導自身流程和工具的使用，自主控制完成任務。
這項定義的精確區分並非意味著Anthropic 自我標榜只追求最先進的Agent 研發。相反，它不厭其煩地拆解了搭建一個Workflow 或Agent 的每一個關鍵步驟和每個步驟採用的AI 工具（包括Claude 系列模型和API）。 Anthropic 表示它建議用大語言模型開發AI 應用的時候找到最簡單的解決方案，「並且只在需要的時候增加複雜性」。它並不鼓勵AI 開發者炫技，並且致力於拆解AI 開發的每一個環節和它工作的原理，提高大語言模型自身的可解釋性和透明性。

可解釋的Constitutional AI

Anthropic 旗下的一系列模型，包括備受歡迎的Claude 3 和Claude 3.5系列模型的研發，都基於與OpenAI 採用的RLHF（基於人類反饋的強化學習）迥異的訓練方式，即Constitutional AI （憲法式人工智慧）。 Constitutional AI 與RLHF 的本質差異是：前者以建構於初始架構中的基準價值原則的AI 自主評估和回饋訓練結果，而後者是基於數萬人類回饋樣本的總和進行訓練回饋。具體比較如下表（感謝Perplexity的貢獻）：

我其實更傾向於將Constitutional AI 翻譯成“原則AI”，它的“原則”由一系列已知的人類價值觀構成，用人類易懂的自然語言書寫，從而避免複雜的數學公式或程式碼的黑箱決策。它的決策框架可以用來檢視，使用基於已知原則的AI 產生的回饋，避免人類回饋系統的不透明性，從而建立一致的、基於原則的生成結果和自主行為。此外，一個AI 應用的價值觀，在原則上可基於Claude 模型的API 進行定製，也可以修正。
不難想像它對企業級AI 應用的重要性：不同的企業有不同的價值主張、商業規則和業務流程，並且很難透過數萬人類回饋的樣本進行強化學習，對模型生成和行為結果的一致性也更關切，也對AI 行為的可回溯、檢視和透明化有更高的要求。而即便是個人用戶，模型生成結果的一致性和持續性也更為重要。用過Claude 3.5 Sonnet 模型的許多人對它的寫作和程式碼兩項能力印象深刻，也得益於它的訓練方式。
當人們評估Anthropic 的潛力時，Constitutional AI 的訓練方式往往被有意無意忽略了，或將「Constitutional」簡單地理解為某一種特定的價值觀。對開發者來說，它是可自訂的、多元的原則在模型產生結果和行為時的透明化和一致性體現。

3. Anthropic 有什麼樣的個性？

Claude：作為大語言模式的性格

強烈推薦同學們逐篇閱讀Anthropic 官方部落格上的長文，體驗一下這家研究驅動的人工智慧公司在自然語言表達上清晰、克制卻又帶著強烈節奏感的美學。當然，從它的CEO Dario Amodei 發表的長文Machines of Loving Grace 裡，我們也能感知到這種美學的一致性。在這些文章中，比較吸引我的一篇是Claude's Character，它探討了一個Claude 的「性格」。
「我們不必訓練模型去採納它們遇到的任何觀點，強烈採納單一的觀點，或者假裝沒有觀點或傾向，而是可以訓練模型在訓練後誠實地對待它們所傾向的任何觀點，即使與它們交談的人不同意它們的觀點。 Anthropic 繼而補充：「我（指Claude）不會說（人們）想聽到的東西」。
聽起來非常像一個聰明人該有的樣子。以及，你很難想像一個大語言模型的性格跟研發它的團隊沒有任何關係，因此，Claude 作為一個模型的性格，某種程度也應該是Anthropic 作為一家企業的性格，甚至人格。

Anthropic 的性格：可解釋性、科學主義、工具理性與人文主義的調光板

如前所述，Anthropic 作為人工智慧公司的相當個性的立場和價值觀——包括Constitutional AI 的原則、對Agent 熱潮的警惕，對Powerful AI 而非AGI 的未來願景，都折射了這家公司的頗具特色的性格：簡單可以總結為：可解釋性、科學主義、工具理性與人文主義的調光板。
沒有一家AI 公司像Anthropic 一樣，如此在意概念描述與術語定義的精確性：它刻意避免使用AGI 這個最流行的描述AI 未來的概念，而用Powerful AI 這麼一個中性得有些乏味的詞彙定義它所做的一切。 Anthropic 認為AGI 是科幻小說衍生的概念，用來指引AI 發展的未來有不可解釋性。其對Agent 和Workflow 的嚴格界定，也透露了這家公司對時髦AI 術語的本能警惕與抵制。
你可以認為，Anthropic 有意抵制日益普遍的AI 炒作（AI Hypes），抗拒任何人和組織以任何形式的AI 先知面目誤導公眾，而是試圖用更精確、科學主義的方式呈現它的AI 研究與產品，並著重於其原理的透明性和可解釋性。它主動談論AI 的安全問題，並且用可解釋的原理，將安全性作為Claude 系列模型的賣點。它甚至不給外界Claude 下一代新模型的預期，無論Sonnet, Haiku 還是傳說中的Opus，都是Claude 3.5家族的成員，因為Dario Amodei 認為只有當神經網路的規模取得顯著增長的情況下，才會誕生一代全新的模型。這應該是Scaling Law 的常識，現在卻需要Anthropic 和Amodei 來重複。
為什麼Anthropic 這麼在意科學、透明和克制地解釋AI 的發展？粗暴的解釋是：Dario Amodei 是科學家，他有生物物理學的博士學位，在百度和Google 的研究職位上延續他的學術生涯，然後加入了OpenAI。許多人津津樂道OpenAI 共同創辦人Ilya Sutskever 與CEO Sam Altman 在理念上不可調和的衝突，可是有沒有一種可能，曾擔任OpenAI 研究副總裁Dario Amodei，與Ilya Sutskever 同時，甚至更早看到AI演進的未來，和它帶來的安全、倫理和其它黑盒子裡的問題？而他要做的，就是用迥異於OpenAI 理念和方法，把OpenAI 的一切都反過來，重新塑造一個人工智慧的未來？

Anthropic 對人工智慧的審慎、可解釋和透明化原則體現了它對人工智慧的工具理性立場，即人們該如何不受誇大、誤導和驅使，按照自己的意志掌控和操作AI，實現人的福祉增益。一個有趣的對比是：OpenAI 命名自帶“AI”，但Anthropic 這個自創的單字確出自希臘語的“anthropos”，意思是human，即人類。不得不說，Anthropic 對OpenAI 的反叛是深入每一個細節的，就連名字都如此。
但Anthropic 對AI 與人類關係的思考又是充滿柔和與溫情的。在Dario Amodei 那篇The Machine of Loving Grace 裡，提及人們對AI 安全問題的低估是憂心忡忡的，討論AI 的定義和理性的，而展望起AI 對人的生命延續、演算法解決病例基因和消除人類精神疾病等領域，則體現了一種平靜的溫暖和篤定—— Amodei 沒有扮演預言一切的先知，而是一如既往地展現了AI 解決人類長期生理和心理健康的可解釋性，提出了具體實現的步驟和原理。這種工具理性和人文主義的「調光」效應，折射了一家人工智慧新創公司罕見的性格。

4. 從Anthropic 看見早期Google 的影子

Anthropic 的科學主義、可解釋性原理、工具理性與人文主義的調光板效應，會讓你想起人類歷史上那家影響深遠的科技公司？我找到的答案是Google。
“成為Google”，至今仍是對一家AI 創業公司的褒揚—— Google 的研究員們最早地提出了奠定生成式人工智慧發展路徑的Transformer 架構，且至今仍是AI 競技場上最重要的玩家之一。 Google 成立之初秉持著整合世界上所有資訊的善意和願景，而且差一點就都做到了。 Google 的創辦人Larry Page 發明了網頁排名（PageRank）技術，同時推動網頁排名演算法的透明化，公開了Google 搜尋結果產生的原理和步驟，並允許用戶透過「About this result」功能瞭解自己的搜尋記錄和數據如何用來個人化搜尋結果。
當然，更被熟知的是Google 「不作惡」（Don't be evil）信條。它確實在早期Google 的發展中得到了最大程度的展現—— “作為一個為世界做好事的公司，從長遠來看，我們會得到更好的回饋——即使我們放棄一些短期收益”。這在Google 嚴格在搜尋結果中標註付費內容，並嚴格限制醫療和金融等領域的廣告等方面都可以體現。
毫無疑問，Anthropic 正在閃耀著早期Google 曾經有過的光芒。它追求可解釋性和有方法論的大語言模型生成原理，強調在Agent 開發的流程中保持簡單性和透明度，期待使用者因為Claude 模型而變得明智；這與Google 早期增進信任和透明化的搜尋結果呈現原理非常近似。而Anthropic 提出的「原則AI」（Constitutional AI），更接近Google 一度奉行的「不作惡」價值觀，是一家科技公司最重要的道德戒律。
我們可以從更多層面來比較Anthropic 和早期Google 在建立科技道德和人類善意方面的實踐（感謝Perplexity的貢獻）：

Google 早期的一系列正直、誠實和透明的價值觀和舉措，被寫進了2004年創始人致股東的公開信，成為Google 上市文件中不可或缺的一部分，也推動了早期Google 商業的繁榮。現在輪到Anthropic 來證明：一個透明、可解釋、安全、強大的大語言模型，可以在獲得商業上更大的成功。
越來越多的企業使用者正在為Anthropic 投票。 2024年，Anthropic 的預期收入是10億美元，85%來自API 訂閱，企業市佔率從12%增加至24%。企業對什麼是可靠、安全、高效，符合更高商業倫理與道德的AI，也許比個人使用者有更真實的理解和更迫切的需求。
一個脫胎於OpenAI 的團隊，甚至作為OpenAI 的反面，Anthropic 只有一條路：在更多的場合取代OpenAI。它不僅僅是佔領OpenAI 的市場份額，而是在什麼是正確的、安全的、符合人類願景的AI 的認知上，引領更多的AI 開發者和創作者。
資訊科技革命者身上的人性光輝，在1980年代的比爾蓋茲身上出現過，在2000年代初的Google 兩位創辦人身上出現過。如今，在Dario Amodei 和他創造的Anthropic，我們好像又看到了──在人工智慧時代開啟，人性的光芒最需要閃現的時候。（矽星人Pro）