當地時間2025年6月23日,美國地區法官威廉•阿爾蘇普( William Alsup )裁定,人工智慧新創公司Anthropic對其人工智慧進行版權書籍訓練的行為合法,該行為受到「合理使用」原則的保護,該原則允許在特定條件下未經授權使用受版權保護的材料,並且無需向作者支付報酬。
美國法官首次在人工智慧版權訴訟中支持科技公司而非創意人員,開創了在人工智慧版權糾紛中法院支持人工智慧公司的先例。這家估值615億美元、由亞馬遜和Alphabet支持的公司Anthropic,也是美國第一家贏得此類訴訟的人工智慧公司。在此先前的湯森路透訴Ross案中,法官裁定AI新創公司Ross使用湯森路透旗下法律研究公司Westlaw的資料進行訓練「不構成合理使用」-該案已進入上訴法院審理階段。
同一周裡(6月25日),美國另一位地方法官文斯·查布里亞( Vince Chhabria)裁定,Meta在未經許可的情況下使用13位作者的書籍訓練其人工智能工具,並未違反法律,因為原告沒有提供足夠的證據證明Meta對其書籍的使用是有害的。
在結合之前美國版權局長否認人工智慧訓練版權內容「合理使用」後旋即被辭的事件,可以說,美國人工智慧版權正在經歷一個歷史性的轉折。其結果可能對接下來OpenAI、Meta、微軟、Google、Anthropic和輝達相關的版權訴訟產生巨大影響,並可能重塑資訊生態系統和整個人工智慧產業,進而影響到網路上的幾乎每個人。
這場裁決也伴隨著巨大的爭議。6月27日,數百名美國作家發出了一封公開信,呼籲圖書出版商承諾限制使用人工智慧工具,並言辭激烈地宣稱,作家的作品被人工智慧公司「竊取」了。
「合理使用」原則是美國版權法中的一個概念,指允許未經版權所有者許可使用受版權保護的素材。 《版權法》第107條規定:「對受版權保護作品的合理使用…用於批評、評論、新聞報導、教學(包括課堂使用的多份副本)、獎學金或研究等目的,不構成侵犯版權」。
然而,對人工智慧大模型的訓練,顯然不符合這部最早制定於1790年、最近一次修訂於2018年的《版權法》所列舉的「合理使用」的傳統情形。因此,這有賴於法官如何解釋人工智慧公司的行為,以及「合理使用」的要素分析。
阿爾蘇普法官首先區分了Anthropic公司的兩種不同的行為:購買大量書籍以及從某網站下載盜版書籍對大模型進行訓練——“Anthropic購買的圖書館書籍和盜版之間的法律問題不同,因此該裁決將依次處理它們。”
問題主要集中在前者,即對於Anthropic公司購買書籍、複製、訓練大模型產品Claude,究竟是否經得起「合理使用」的分析。
1、訓練大模型與人類閱讀相似
首先,阿爾蘇普法官認為人工智慧大模型的訓練,幾乎等同於對「任何人閱讀和寫作一樣」的訓練,並且強調,Anthropic的大型語言模型Claude在訓練過程中藉鑑作品並非為了複製或取代它們,而是為了「另闢蹊徑,創造出不同的東西」。書籍的作者不能理所當然地拒絕任何人使用他們的作品來訓練或學習,也就不應該拒絕其作品被用來訓練大模型。
2、沒有外部分享就屬於合理使用
雖然Anthropic是一家商業機構,並能從這種複製書籍、訓練大模型中得到商業利益,但是法官特別區分了這些書籍被使用的“內部性和外部性”,由於“它沒有製作新的拷貝在外部分享或出售”,而只是用於內部大模型的訓練,因此就屬於“合理使用”。
法官認為,購買的印刷版被Anthropic已經銷毀,而數位替代品並沒有以其原本的內容向外重新分發,這就屬於「合理使用」。
3、數百萬本書對於大模型訓練是「合理必要」的
原告作家們提出一個觀點,認為Anthropic“複製整個作品”並使用數百萬本書訓練,這種量級對於“合理使用”來說,並非必要。
但阿爾蘇普法官認為,「合理必要」並不意味著「嚴格必要」。或許,使用數十萬本書也可以訓練出一個給定的大模型,但這不意味著Anthropic不可以使用更多的數百萬本書來訓練Claude,因此訓練內容中包含了原告作者的作品,甚至「使用任何一部作品來實際訓練LLM都是合理的」。
4、AI的產出並非作家出版作品的「競爭性替代」
阿爾蘇普法官認為,訓練特定大型語言模型使用大量書籍,本身並且不會減少市場對作者作品的需求,即便有所減少,也不符合《版權法》所關注的那種競爭性或創造性的替代。
他進一步解釋,《版權法》旨在促進原創作品的創作,而不是保護作者完全免受競爭。即,如果某位作家出版大量自己作品,並被一群讀者全部買去閱讀、研究,並成為與其形成競爭的作家,那麼原來的作家也無權對此加以阻止或控制。
總的來說,法院判定未經許可使用受版權保護的作品是否構成合理使用,最主要的標準是審查該使用是否具有“變革性”,這意味著它並非是對原作品的替代,而是某種新事物。
然而,在購買圖書之前,Anthropic曾下載了700多萬本盜版圖書,並沒有支付任何費用。雖然據稱它已經決定不再使用這些盜版書籍來訓練人工智慧,但仍將這些盜版書籍保存在其資料庫種中。Anthropic辯稱,因為其中一些圖書最終將被用於訓練大模型,就可以將這一行為視為「合理使用」。
這家人工智慧公司意圖在於,無限制地拓寬「合理使用」的範圍。Anthropic認為,因為這些書籍是“用於高度變革性的用途”,法律上就應對其獲得訓練數據的任何途徑進行正面評價。
但阿爾蘇普法官表示,盜版來就是不可挽回的侵權行為,即使盜版書籍立即被丟棄。所以,無論盜版書籍是僅用於建造一個數位圖書館,還是訓練大模型的語料庫,從法律性質上都與購買書籍的行為完全不同。法官在這個問題上打破了Anthropic提出的「AI即合理」的假設。
Anthropic複製並儲存的超過700萬本盜版書籍,侵犯了作者的版權,不構成合理使用。法官已下令於12月開庭審理,以確定Anthropic應承擔的侵權賠償金額。根據美國的《版權法》,故意侵犯版權可能會導致每部作品被處以最高15萬美元的法定賠償。
隨著人工智慧產業的擴張,美國法院正急於區分合法的變革性使用和超越創新範疇的純粹抄襲。所以,儘管本案的裁決表明,從受版權保護的作品中學習可以被視為“合理使用”,但它也明確指出了一點:人工智慧公司不能簡單地從最容易獲得的地方借用材料,因此必須謹慎地對待其抄襲的內容以及獲取資訊的方式。
這項判決對作家、藝術家和出版商來說無疑是一個巨大的打擊,他們正在對OpenAI、Meta、Midjourney、谷歌等公司提起與本案相似的數十起訴訟。
這些創作者聲稱,人工智慧公司使用他們的作品來訓練利潤豐厚且功能強大的人工智慧模型,這種行為無異於「偷竊」;而人工智慧公司經常依靠所謂的「合理使用」原則為自己辯護,認為建構人工智慧工具應該被視為一種合法使用,而無需獲得同意或向權利人支付報酬的情況。
就像Anthropic在本案中的辯詞所聲稱的,如果必須向權利人支付報酬,那麼交易成本將超過其獲得的預期收益。人工智慧公司只有兩個選擇:停止與任何權利持有人打交道,或完全停止開發AI技術。因此,人工智慧公司甚至不惜以盜版的方式試探法律的底線。
雖然這項裁決並不能保證其他法官也會效仿阿爾蘇普法官的做法,但它為法院站在科技公司這邊、而非創意人士的立場奠定了基礎。值得注意的是,阿爾蘇普在合理使用問題上的經驗遠超一般聯邦法官,他曾主持谷歌訴甲骨文案(Google v. Oracle)的初審。
同時,美國版權局也在經歷歷史上最動盪的時刻。2025年5月,就在版權局發布了一份關於生成式人工智慧訓練和合理使用的報告幾天后,美國版權局局長珀爾穆特突然被解僱。於是版權局「出於謹慎」立即暫停了版權登記證書的發放,影響了約2萬份登記。5月29日美國版權局雖然恢復了工作,但現在發出的登記證書上,局長簽名處卻變成了空白,成為一份可被挑戰的法律文件。版權局內部的現實是:其實無人掌權。
或許,接下來人工智慧公司將贏得大部分訴訟,並獲得美國政府的各種支援和版權局的認可。(Internet Law Review)