Anthropic可能在未來幾個月內破產。
上周,舊金山聯邦法官William Alsup做出了一個幾乎沒有被主流媒體報導的裁決——
認證了針對Anthropic的集體訴訟,這家AI新創公司因使用盜版書籍訓練模型,可能面臨數十億甚至數千億美元的賠償。
這是美國法院首次允許針對生成式AI訓練的集體訴訟繼續進行。
Garrison Lovely(@GarrisonLovely) 在Obsolete上詳細報導了這個案例:
法官已經基本裁定Anthropic下載盜版書籍構成了版權侵權,留下的真正問題是陪審團計演算法定賠償金額。
根據法院命令,Anthropic不僅下載了數百萬本盜版書籍,還讓工程師可以存取這些書籍,有時甚至保存了多個副本,並在訓練後很長一段時間內將這些書籍用於各種內部任務。
更糟的是,當盜版網站開始關閉時,Anthropic還爭先恐後地下載新副本。
當一位共同創辦人發現了被FBI關閉的「Z-Library」的鏡像站時,他給同事發訊息說:「正好趕上」。
一位同事回覆:「zlibrary我的最愛」。
像極了廣西周某偷電瓶車電池的樣子…
集體訴訟涵蓋了500萬到700萬本書——儘管只有在美國註冊版權的作品才有資格獲得法定賠償。
假設只有五分之二的書籍被涵蓋,陪審團判決每部作品的法定最低賠償750美元,那就是15億美元的賠償。
若依照法定最高賠償每部作品15萬美元,涵蓋500萬本書?
那就是7500億美元——
Anthropic的律師稱之為「毀滅性的」。
雖然沒有陪審團會判決那麼高的金額,但數十億美元的判決是完全可能的。
根據Crunchbase的數據,Anthropic總共籌集了172億美元。
但其中很大一部分是以Amazon和Google雲端運算積分的形式——
不是真金白銀,沒有完全到帳。
在所有前沿AI公司中,Anthropic獲得資本的管道最少。如果真的面臨數十億美元的賠償,公司可能無法負擔。
就在集體訴訟認證幾天后,CEO Dario Amodei向員工發送了一份備忘錄,宣佈公司將尋求來自海灣國家的投資,包括阿聯酋和卡達。
Amodei承認這個決定可能會讓「獨裁者」致富,他稱之為「真正的不利因素」。
但他寫道,公司無法忽視「中東真正龐大的資本,輕鬆超過1,000億美元」。
他在備忘錄中寫道:
不幸的是,我認為「任何壞人都不應該從我們的成功中受益」是一個很難經營企業的原則。
Anthropic從2024年開始花費數百萬美元購買書籍,通常是二手書,然後將它們切開、內部掃描,然後將原件打成紙漿,再用來訓練Claude,這是其他競爭對手都沒有公開做過的。
Claude 之所以能好用,是因為背後有人在幹這些髒活累活…
相較之下,Meta儘管財力雄厚,卻完全跳過了購買和掃描階段。
內部消息顯示,工程師們稱LibGen是「明顯的盜版」數據,而這種方法得到了Mark Zuckerberg的批准。
OpenAI和Microsoft現在面臨著12起合併的版權訴訟,包括《紐約時報》等新聞機構的訴訟。
如果法官採用與Alsup類似的裁決方法,考慮到潛在涵蓋作品的數量,OpenAI的潛在責任可能遠遠超過Anthropic。
審判暫定於12月1日進行。
如果Anthropic在此之前未能在上訴中獲勝,整個產業即將學到一個教訓:
當你打破的是版權法時,「快速行動,打破常規」的代價有多昂貴——尤其是當你打破了幾百萬次的時候。
Ed Steussy(@esteussy) 指出了Alsup先前裁決的重要性:
在集體訴訟被認證之前,就已經很清楚處罰會是什麼。
而對於西方AI實驗室面臨法律挑戰時,ahtoshkaa(@ahtoshkaa) 提出了一個尖銳的問題:
所以基本上西方法院會吞噬西方實驗室,而中國會佔上風?聽起來很合理...
雖然Trump總統在周三AI行動計劃的發布會上駁斥了AI公司應該為訓練數據中使用的每本書或文章付費的想法,稱嚴格的版權執行“不可行”,並堅稱“中國不會這樣做”。
但政府的計劃在版權問題上明顯保持沉默——
也許反映了任何有意義的改變都需要國會修改版權法。
Anthropic不只是倒楣第一個被起訴。
法官形容這個案件是集體訴訟的“經典”候選:一家公司批次下載數百萬本書,一次性完成,使用檔案雜湊值和ISBN來識別作品。
現在,Anthropic面臨著殘酷的選擇,要麼達成可能數十億美元的和解,要麼冒著災難性賠償判決和多年不確定性的風險。
如果Anthropic在審判中敗訴並在上訴中失敗,由此產生的先例可能會將Meta、OpenAI,甚至可能Google拖入類似的責任泥淖。 (AGI Hunt)