配合OpenAI搞資料壟斷，排擠Anthropic？Reddit撕破臉：賠錢！網友：網際網路還沒死！AGI太快這官司打完早沒意義了

2025/06/05

•

6月5日凌晨，就在WindSurf被Claude“斷供”的消息傳出來的第二天，Anthropic後院著火了。

這次的主角是大家熟悉的社交討論平台Reddit。

Reddit在正式起訴Anthropic的檔案中稱，後者其在未經許可的情況下，大規模抓取Reddit公共內容，涉嫌侵犯版權。

消息一經傳開，在全球AI圈、Reddit社區和X平台上引發了激烈討論，一場關於“誰能用你的資料”“大模型究竟靠什麼喂養”的輿論地震，正在蔓延。

拋開 Reddit 能否勝訴另說，但受消息影響，Reddit 股價剛剛的收盤上漲超過了 6%。

Reddit的憤怒：曾主動接洽對方無權抓取

訴狀稱，Anthropic在未徵得使用者同意的情況下，利用Reddit使用者的個人資料訓練其AI模型，Reddit因此遭受損害。

訴狀的開頭先是來了一段“欲抑先揚”——將 Anthropic 形容為“姍姍來遲的AI公司”，自詡是“AI行業的白衣騎士”，但 Reddit 直言：“事實遠非如此。”

“儘管其對外行銷材料冠冕堂皇，Anthropic根本無視Reddit的規則和使用者權益，自認為有權任意攫取任何內容，隨意使用，無需承擔後果。”

訴狀檔案還稱，Reddit稱其曾主動與Anthropic接洽，明確告知對方無權抓取或使用Reddit內容，但Anthropic“拒絕配合”。此外，Reddit還指控Anthropic的爬蟲機器人無視網站標準的robots.txt協議（用於告知自動化程序禁止爬取的頁面），甚至在2024年聲稱已遮蔽相關爬蟲後，Anthropic的機器人依然對Reddit進行了超10萬次資料抓取。

Reddit首席法務官Ben Lee在發給外媒TechCrunch的一份聲明中表示：“我們絕不容忍像Anthropic這樣的逐利公司，肆意將Reddit社區的內容用於商業變現，賺取數十億美元，卻不給予使用者任何回報，也不尊重使用者隱私。”

這次到底吵什麼？

表面上看是版權，實際上是資料壟斷？

太陽底下無新事，此次訴訟的核心矛盾還是在於，Reddit認為自身平台內容被商業化利用，卻未獲得任何回報。

根據外媒報導，Reddit起訴Anthropic的核心是：未經許可，Anthropic擅自抓取Reddit內容，涉嫌侵權。而OpenAI和Google則早已和Reddit簽訂了內容授權協議。

這份內容授權協議的主要內容便是，允許它們在特定條款下，使用Reddit資料訓練AI模型，並將Reddit內容整合進自家AI聊天產品的回答中。但Reddit強調，這些合作都需遵守保障使用者權益與隱私的條款。

Reddit官方聲明：

“其他AI巨頭理解並尊重Reddit的規則。”
點名OpenAI、Google是“遵守許可”使用資料的典範。

但Anthropic顯然沒跟進，也沒付錢。

這樣看來，Reddit的訴訟沒毛病。但貓膩之處就在於，大家可能沒有注意到一個背景資訊，即：

OpenAI CEO Sam Altman目前持有Reddit 8.7%的股份，是該公司第三大股東，並曾任Reddit董事會成員。

這就讓這場糾紛變得複雜了起來，表面上看是版權官司，但本質卻是AI行業“資料壟斷”的冰山一角：誰擁有足夠多、足夠豐富的高品質人類資料，誰就能讓AI模型“更像人”，更具市場優勢。

為什麼AI大模型廠商繞不開Reddit？

做大模型，資料就是最寶貴的石油。而Reddit、Quora、Stack Overflow這類社區是天然的人類思維、觀點、情感、衝突、吐槽的寶庫，堪稱“石油中的精品汽油”。

GPT系列能從死板的機器邏輯，進化成現在“像人”的對話能力，靠的就是大量社交問答類文字。

正如一位X使用者說，Reddit是AI的“底層人性訓練場”。

“大家都愛罵Reddit資料被用來訓練AI，但你得承認，這是做出人味AI唯一有效的方法。”

為什麼Google和OpenAI願意付費？

而Anthropic拒絕

正如前文所述，OpenAI和Google選擇付費，讓Reddit授權使用其資料來進行模型訓練，而Anthropic卻遲遲不願付費，為什麼？

其實原因很直接。先來看OpenAI和Google。

首先，他們需要合法化大模型訓練的資料來源。現在AI圈最怕的就是版權風險，一旦被法院判定模型用了未授權內容，整套產品、商業化和融資都會遭殃。

OpenAI、Google體量太大，不可能冒這個險，一旦出事，損失是以百億美金計。而且這倆公司AI的核心業務就在美國，得按美國法律玩。

所以，和Reddit簽個授權協議，既能繼續用，又規避法律風險，還能給監管和投資方一個交代，這叫合法續命。

再有一個內幕，就是，Sam Altman本身是Reddit第三大股東。你看懂這層關係就明白了：

Reddit賣資料，OpenAI花錢，但錢其實等於給自己投資的公司回血。這種“左手倒右手”的操作，最適合鞏固雙方利益繫結，也便於排擠競爭對手。

那為什麼Anthropic不掏錢？

首先，Anthropic本來就跟OpenAI“撕破臉”了。眾所周知，Anthropic是當年OpenAI離職高管創立的，他們走的是“更安全、更透明”AI路線，和OpenAI是直接競品。

而Reddit跟OpenAI綁得死死的，Anthropic自然不願意給“敵對陣營”送錢，掏錢等於給對手養生意，用網友的話說；“死都不甘心”。

其次，Anthropic的模式更偏開源社群路線。Anthropic做Claude系列，比較倚重Common Crawl、維基百科、開源資料，社區氛圍裡就有種“我們不用付費平台資料，也能造好模型”的心氣，所以他們一直遊走在“公共內容”和“灰色資料”邊緣，能白嫖就不花錢，抱著“公共網際網路就該開放”的理想主義色彩。

最後，Reddit這份授權協議太貴。早在去年2月，就有消息報導，Reddit跟OpenAI、Google簽的資料協議，年費在6000萬美元以上。而Anthropic現階段融資遠不如OpenAI，支撐不起這個開支。而且甚至正如網友所言，“你Reddit又不是獨家資料來源，我能從別的地方搞”，更是減少了簽這份協議的必要性。

所以不難想像，Anthropic乾脆就硬著頭皮抓了，結果就在剛剛跟被OpenAI收購的WindSurd撕破臉，後腳就疑似被OpenAI通過Reddit反將了一軍。

兩相對比之下，你就會發現這事情變得有意思了，多少成了AI圈的利益分贓。OpenAI、Google之所以願意付錢，是因為：

買穩定、買合法、買關係網
鞏固資料壟斷，不給對手喘息機會

而Anthropic不願意，是因為：

拼不過資本、但要爭活路
理想主義+節流生存戰略

這其實也是AI圈現階段最真實的競爭格局：老牌資本巨頭買斷資料，擠壓後來者，開源派孤軍奮戰。

不難想像的是，這場Reddit官司，背後真正有所指的、甚至搞垮的，可能不單單是Anthropic，而是整個“開源AI社區”。

很快 Anthropic 官方就予以了回擊。Anthropic發言人在致TechCrunch的郵件聲明中表示：“我們不同意Reddit的指控，並將積極應訴。”

網友：網際網路還沒死！

配合OpenAI，排擠Anthropic

這個事情一早就在Reddit和X上炸鍋了，小編整體看下來，其實站隊還是很明顯的，一隊支援Reddit維權，另一隊認為Reddit的資料活該被抓取。

一位Reddit網友表示：Claude才不會承認自己用了Reddit資料，大公司才是最壞的人。

“Claude（Anthropic的AI助手）肯定說自己沒用Reddit資料：‘我才不偷資料呢，大公司才最壞，UBI萬歲，Bernie還能贏！’”

另一網友緊隨其後回覆道：等這場破事敲定了結果，AGI估計也快了。謝謝你證明了“網際網路已死”是錯的。

等這場破事塵埃落定，AGI 估計也快了。謝謝你證明了“網際網路已死論”是錯的，現在只有人類才會寫出這種神奇的字面沙拉。

甚至一位網友對於這種版權訴訟表示無力吐槽：等官司打完，這案子早沒意義了。

而Rddit真正值得做的，則應該是如何防止AI資料池的污染。並建議道：未來“Human Made”標籤會成大事。Reddit要想活，就該做“真人原創資訊庫”，不然都被AI自動生成內容淹沒。

LLM 發展太快了，等官司打完，這案子早沒意義了。OpenAI、DeepMind 這些年都在用看到啥就抓啥。OpenAI和Reddit、News Corp、華盛頓郵報的合作，不過是哄哄快變廢柴的媒體公司。Reddit 真要做的是，把自己定位成人類原創資訊庫，減少合成內容或者給人類內容上個數字水印。未來“Human Made” 標籤會成大事，因為 AI 普及會讓輿論徹底對立。

當然，小編髮現，不少網友則是批評Reddit的做派，比如一位網友諷刺道：

“Reddit自己從使用者身上賺了幾千萬美金，卻一分不給使用者。現在還裝模作樣搞維權。”

甚至眼尖的觀眾早已看穿了這場訴訟的本質：配合OpenIAI排擠Anthropic。

“OpenAI、DeepMind這些年啥內容都抓，Reddit現在搞這事就是為了配合OpenAI排擠Anthropic。”

整體看下來，Reddit不是反AI，是要錢+壟斷資料，也順便幫OpenAI卡競爭對手。

大模型廠商的資料大戰全面打響

很明顯，Reddit 這波訴訟其實遠沒有版權呢之爭那麼簡單。跟 OpenAI、Google 簽獨家協議，看著是賣資料，實際上也鎖住了核心輿論資料來源。而高昂的協議年費，幾乎只有有錢有背景的企業才能負擔得起，開源、公益性AI團隊都會在無形之中被排擠出局。

AI廠商之間資料大戰全面打響。OpenAI靠股權控制Reddit，Google付費，Anthropic挨告，其他廠商下一步將會採取怎樣的措施？而以後開源模型的“資料來源”問題會越來越敏感。

進一步設想，想像下未來新聞、社交、法律、招聘、信用評分，全部跑在AGI之上，而這些AGI訓練資料是由這幾家公司壟斷的，相當於未來的AI記憶和語言模型世界，只掌握在少數幾家大公司手裡。

尤其在 AGI 誕生之後，說什麼是“真相”、什麼是“謠言”、什麼是“主流價值觀”，都由這些模型決定。

那我們其實就進入了資料獨裁時代。

矽谷投資圈盛傳

OpenAI的AGI資料獨裁的內幕故事

在這個資料獨裁的AGI時代中：

OpenAI 和 Sam Altman：手握 AGI 最大話語權，又是 Reddit 第三大股東，自己簽協議，自己拿錢，順便排擠競爭對手。而且別忘了，Sam 一直對 AGI 世界統治有濃厚興趣，OpenAI 內部流傳的「AGI Governance Proposal」檔案，明確寫過：未來 AGI 應該由“負責任的大型公司聯合治理”。聽著像好事，實際上就是自己做裁判+運動員。

Google DeepMind：傳統科技巨頭，算是明著玩，不摻這些複雜利益結構但也一樣砸錢買資料，怕自己掉隊。

Anthropic：則成了理想主義孤膽英雄，號稱要做“安全、負責任、開源可控的 AGI”，但資金和資源都捉襟見肘。

講到這裡，小編想到了此前AI圈裡盛傳的一個內幕故事：OpenAI 的「失控版 AGI 提案」。去年有一次 OpenAI 內部爆料，一個叫Q*的項目，目標是：

用私有社交資料+搜尋資料+新聞評論區內容，訓練一個可以預測輿論走向、操縱情緒波動的語言模型
初步試點就在 Reddit、Twitter（X）和 YouTube 評論區裡跑了測試
後來因為內部人員擔憂“Q* 具備大規模操控能力”，才有 Anthropic 那批人集體出走

這事後來 OpenAI 沒公開，但不少矽谷投資圈、媒體圈私下流傳。

所以現在看 Reddit 這波起訴 Anthropic，更像是就是清理不聽話的“反骨AI公司”，方便自己繼續把控資料來源和話語權。

寫在最後：你的帖子值多少錢

別被表面版權官司迷惑了，所有社交平台，都是AI煉丹爐。

誰能掌握最大、最獨家的“人類資料池”，誰就能把AGI時代的主動權攥在手裡。OpenAI早已動手，Google在跟進，Reddit轉型“資料礦場”，未來Twitter、YouTube、知乎、小紅書也絕不會例外。

誰掌握資料，誰就能定義未來的AI話語權。

而普通內容創作者，將越來越邊緣化。這也是一種危險訊號。

AI廠商和平台高層打著使用者的幌子進行利益聯動，正以“公開合作+背地封殺”雙軌平行。

最後，問題又回到了我們這些使用者身上：你的帖子，值多少錢？

你願不願意看著自己的帖子、評論、吐槽，被訓練成AI的一部分，成就別人的利潤和專利？ (51CTO技術堆疊)