【Claude 3大模型】超越GPT-4，一口氣讀15萬單字

2024/03/05

•

OpenAI創辦人奧特曼都還來不及和馬斯克掰扯完新仇舊恨，沒關係，還有其他人會悄悄出手——

北京時間3月4日晚間，Anthropic，毫無預警地發布了最新一代大模型Claude 3，距離上一代的Claude 2發布，僅相隔8個月。

Anthropic是OpenAI的勁敵，核心團隊同樣是OpenAI的創業原班人馬。團隊因為與OpenAI理念不合而分家，於2021年成立了新公司Anthropic。

光是2023年，Anthropic就連續獲得五輪，共73億美元的融資。在大模型訓練上，Anthropic可以說是業界第一梯隊，同樣備受矽谷關注。

這次，毫無疑問，Claude 3直接對標OpenAI當前最強大的模型GPT-4，多模態能力配齊，並且直接甩出超過46頁的技術報告，自豪表示：

全面超越GPT-4！

新一代的Claude 3分為三個版本，分別為Haiku、Sonnet、Opus三款模型。從模型尺寸來看，可以理解為模型的中盃、大杯、超大杯。

雖然Anthropic並沒有給出模型的具體參數，不過給了三個模型所適用的場景：

Haiku：是相應速度最快的模型，也是成本最低的選項，在大多數純文字任務上的表現仍然相當出色，也同時包含多模態能力（例如視覺）

Sonnet：適用於需要平衡效能和成本的場景，它在純文字任務上的表現與後面的Opus相當，但在成本上更為經濟，適合於那些需要效能稍微好點，但預算有限的企業和個人使用者

Opus：具有強大的推理、數學和編碼能力，接近人類的理解能力，適用於需要高度智慧和複雜任務處理的場景，如企業自動化、複雜金融預測、研究和開發等。

從本週開始，Claude會向159個國家開放。其中，Opus和Sonnet模型的API都已上線，開發者已經可以直接使用。經濟性能兼顧的Sonnet，就在官網上提供免費體驗，Opus則可供Claude Pro訂閱者使用。

儘管OpenAI憑藉Sora在文生視訊領域打了一場漂亮的翻身仗，但視訊賽道所在的發展階段更早。如今的主戰場仍在大語言模式（LLM）上，離產品化也更近。

圈內人也看熱鬧不嫌事大。近期不少報道顯示，馬斯克將OpenAI告上法庭，讓OpenAI不得不內部延後有關GPT-5的發布－GPT-5被認為能夠實現AGI（通用人工智慧）。著名AI圈網紅、英偉達的首席AI科學家Jim Fan就表示：

Claude 3剛剛發布了，坐等幾個小時後OpenAI精心安排的GPT-5發布。

2024年才剛過兩個月，我們就已經見證GoogleGemini Pro、OpenAI的Sora，再到如今的Claude發布……巨頭混戰再度拉開序幕，大有愈演愈烈之勢。

一口氣讀15萬單詞，還能拆解複雜問題

如果是OpenAI是大模型領域的“六邊形戰士”，無論是模型視頻、商業化綜合水平一騎絕塵，那麼Anthropic從風格上看更為低調，也更強調專才，但這次的能力提升確實巨大。

有看客甚至表示：

Claude 3終結了GPT-4時代。

這次Claude 3的兩大更新亮點，一個是長文本，二是多模態能力。

長文本就是Anthropic的一個顯著優勢，體現為在閱讀論文、小說等字數較多的文本時，Anthropic更擅長理解並回答使用者的相關問題。

這次，Claude 3大大提升了上下文對話窗口，達到200k——可以理解為單次和模型對話能夠輸入的文本。

具體而言，Claude 3 200k的對話長度，相當於能夠單次處理超過15萬英文單詞，而GPT-4 Turbo的上下文視窗為128k，大約是9.6萬個英文單詞。

並且，Claude 3也第一次允許圖像和文件上傳。和ChatGPT一樣，Claude 3能夠「認」出來圖裡的是什麼東西，直接描述，回答使用者的問題。

而更令人印象深刻的還是，Claude 3在分析一些複雜問題時，已經能夠和人一樣，先拆解問題，並且交由子模型來進行調度。

在Anthropic的示範影片裡，就舉了一個需要用python模擬經濟情勢走向的例子。當把「分析美國十年GDP未來趨勢」的任務交給Claude 3之後，Claude就默默地做了這些事：

最有趣的就是，網頁中如果看到一個資料圖表，沒有明確資料的，Claude 3甚至可以透過辨識影像，來估算每個階段大概資料是多少，進行還原。

AI安全也是Anthropic有別於OpenAI的一點。在OpenAI和Anthropic團隊分家的時候，其最重要分歧正是包含對AI安全的考慮，Anthropic希望建立一個「更可信」的模型，而OpenAI顯然希望用商業化驅動模型更快地前進，路線上更為激進。

對此，Anthropic採取的措施包括但不限於：制定了一套框架，用於評估和減輕AI模型可能帶來的潛在災難性風險，例如繼續擰自動化評估和紅隊測試，以確保AI不會發展出可能造成傷害的能力。

2023年4月，Anthropic甚至開源憲法人工智慧（Constitutional AI）引起了圈內轟動，這是一個限制模型行為遵守特定憲法原則的AI。

以及2024年也是美國大選年，Anthropic也在準備開發和執行關於在政治和選舉背景下使用工具的政策，評估模型對選舉錯誤訊息、偏見和其他濫用的反應，確保用戶能夠在選定國家獲得準確和最新的投票資訊。

不過，Anthropic也因為太過重視AI安全，很多問題的評估上很謹慎，甚至直接不回答，惹來一片用戶吐槽。這次，Anthropic表示，Claude 3在這個問題上大有改進。

例如，Claude 3的對無害訊息的拒絕回覆率，普遍來到了10%附近，比Claude2.1和2.0都有進步。

根據CNBC，Anthropic拒絕透露訓練Claude 3到底花了多少時間和多少錢，但表示Airtable和Asana等知名SaaS公司有幫忙對模型進行了A/B測試，讓模型的可控性也有所改善。

儘管Anthropic技術上又一次拿出了看家實力，但大模型領域如今已經走過了一年多時間的技術競爭。如何從模型走向實際的產品落地，創造更大的商業價值，是懸在所有廠商頭上的劍。

如今Anthropic背後站著Google雲端、亞馬遜，已經和OpenAI（背靠微軟）形成鮮明的陣營對比。但從商業化角度，目前Anthropic遠趕不上OpenAI，這意味著Anthropic在2024年會面臨更大壓力。

和ChatGPT一樣，Anthropic也是To B和To C兩條腿走路。在企業側，Anthropic已經服務了包含Slack、Notion和Quora等用戶。

而根據The Information2023年12月報道，Anthropic預計到2024年底將產生超過8.5億美元的年化收入。相較起來，同樣截至2023年底，OpenAI由於ChatGPT的強勁成長，年化收入從10月中旬的13億美元就增加至16億美元。

往後，隨著OpenAI商業化加速，差距還可能越來越大。The Information引用一些OpenAI領導者的觀點，到2024年底，他們預計OpenAI年化收入可以達到50億美元，而其他人則認為可以達到更高的數字。

技術上的軍備競賽遠未結束。在2023年12月，Anthropic也正在進行新一輪高達7.5億美元的融資，估值為184億美元，比起2023年初41億美元的估值，漲了4.5倍。(36氪Pro)