配合OpenAI搞資料壟斷,排擠Anthropic?Reddit撕破臉:賠錢!網友:網際網路還沒死!AGI太快這官司打完早沒意義了

6月5日凌晨,就在WindSurf被Claude“斷供”的消息傳出來的第二天,Anthropic後院著火了。

這次的主角是大家熟悉的社交討論平台Reddit。

Reddit在正式起訴Anthropic的檔案中稱,後者其在未經許可的情況下,大規模抓取Reddit公共內容,涉嫌侵犯版權。

消息一經傳開,在全球AI圈、Reddit社區和X平台上引發了激烈討論,一場關於“誰能用你的資料”“大模型究竟靠什麼喂養”的輿論地震,正在蔓延。

拋開 Reddit 能否勝訴另說,但受消息影響,Reddit 股價剛剛的收盤上漲超過了 6%。

Reddit的憤怒:曾主動接洽對方無權抓取

訴狀稱,Anthropic在未徵得使用者同意的情況下,利用Reddit使用者的個人資料訓練其AI模型,Reddit因此遭受損害。

訴狀的開頭先是來了一段“欲抑先揚”——將 Anthropic 形容為“姍姍來遲的AI公司”,自詡是“AI行業的白衣騎士”,但 Reddit 直言:“事實遠非如此。”

“儘管其對外行銷材料冠冕堂皇,Anthropic根本無視Reddit的規則和使用者權益,自認為有權任意攫取任何內容,隨意使用,無需承擔後果。”

訴狀檔案還稱,Reddit稱其曾主動與Anthropic接洽,明確告知對方無權抓取或使用Reddit內容,但Anthropic“拒絕配合”。此外,Reddit還指控Anthropic的爬蟲機器人無視網站標準的robots.txt協議(用於告知自動化程序禁止爬取的頁面),甚至在2024年聲稱已遮蔽相關爬蟲後,Anthropic的機器人依然對Reddit進行了超10萬次資料抓取。

Reddit首席法務官Ben Lee在發給外媒TechCrunch的一份聲明中表示:“我們絕不容忍像Anthropic這樣的逐利公司,肆意將Reddit社區的內容用於商業變現,賺取數十億美元,卻不給予使用者任何回報,也不尊重使用者隱私。”

這次到底吵什麼?

表面上看是版權,實際上是資料壟斷?

太陽底下無新事,此次訴訟的核心矛盾還是在於,Reddit認為自身平台內容被商業化利用,卻未獲得任何回報。

根據外媒報導,Reddit起訴Anthropic的核心是:未經許可,Anthropic擅自抓取Reddit內容,涉嫌侵權。而OpenAI和Google則早已和Reddit簽訂了內容授權協議。

這份內容授權協議的主要內容便是,允許它們在特定條款下,使用Reddit資料訓練AI模型,並將Reddit內容整合進自家AI聊天產品的回答中。但Reddit強調,這些合作都需遵守保障使用者權益與隱私的條款。

Reddit官方聲明:

“其他AI巨頭理解並尊重Reddit的規則。”
點名OpenAI、Google是“遵守許可”使用資料的典範。

但Anthropic顯然沒跟進,也沒付錢。

這樣看來,Reddit的訴訟沒毛病。但貓膩之處就在於,大家可能沒有注意到一個背景資訊,即:

OpenAI CEO Sam Altman目前持有Reddit 8.7%的股份,是該公司第三大股東,並曾任Reddit董事會成員。

這就讓這場糾紛變得複雜了起來,表面上看是版權官司,但本質卻是AI行業“資料壟斷”的冰山一角:誰擁有足夠多、足夠豐富的高品質人類資料,誰就能讓AI模型“更像人”,更具市場優勢。

為什麼AI大模型廠商繞不開Reddit?

做大模型,資料就是最寶貴的石油。而Reddit、Quora、Stack Overflow這類社區是天然的人類思維、觀點、情感、衝突、吐槽的寶庫,堪稱“石油中的精品汽油”。

GPT系列能從死板的機器邏輯,進化成現在“像人”的對話能力,靠的就是大量社交問答類文字。

正如一位X使用者說,Reddit是AI的“底層人性訓練場”。

“大家都愛罵Reddit資料被用來訓練AI,但你得承認,這是做出人味AI唯一有效的方法。”

為什麼Google和OpenAI願意付費?

而Anthropic拒絕

正如前文所述,OpenAI和Google選擇付費,讓Reddit授權使用其資料來進行模型訓練,而Anthropic卻遲遲不願付費,為什麼?

其實原因很直接。先來看OpenAI和Google。

首先,他們需要合法化大模型訓練的資料來源。現在AI圈最怕的就是版權風險,一旦被法院判定模型用了未授權內容,整套產品、商業化和融資都會遭殃

OpenAI、Google體量太大,不可能冒這個險,一旦出事,損失是以百億美金計。而且這倆公司AI的核心業務就在美國,得按美國法律玩。

所以,和Reddit簽個授權協議,既能繼續用,又規避法律風險,還能給監管和投資方一個交代,這叫合法續命。

再有一個內幕,就是,Sam Altman本身是Reddit第三大股東。你看懂這層關係就明白了:

Reddit賣資料,OpenAI花錢,但錢其實等於給自己投資的公司回血。這種“左手倒右手”的操作,最適合鞏固雙方利益繫結,也便於排擠競爭對手。

那為什麼Anthropic不掏錢?

首先,Anthropic本來就跟OpenAI“撕破臉”了。眾所周知,Anthropic是當年OpenAI離職高管創立的,他們走的是“更安全、更透明”AI路線,和OpenAI是直接競品。

而Reddit跟OpenAI綁得死死的,Anthropic自然不願意給“敵對陣營”送錢,掏錢等於給對手養生意,用網友的話說;“死都不甘心”。

其次,Anthropic的模式更偏開源社群路線。Anthropic做Claude系列,比較倚重Common Crawl、維基百科、開源資料,社區氛圍裡就有種“我們不用付費平台資料,也能造好模型”的心氣,所以他們一直遊走在“公共內容”和“灰色資料”邊緣,能白嫖就不花錢,抱著“公共網際網路就該開放”的理想主義色彩。

最後,Reddit這份授權協議太貴。早在去年2月,就有消息報導,Reddit跟OpenAI、Google簽的資料協議,年費在6000萬美元以上。而Anthropic現階段融資遠不如OpenAI,支撐不起這個開支。而且甚至正如網友所言,“你Reddit又不是獨家資料來源,我能從別的地方搞”,更是減少了簽這份協議的必要性。

所以不難想像,Anthropic乾脆就硬著頭皮抓了,結果就在剛剛跟被OpenAI收購的WindSurd撕破臉,後腳就疑似被OpenAI通過Reddit反將了一軍。

兩相對比之下,你就會發現這事情變得有意思了,多少成了AI圈的利益分贓。OpenAI、Google之所以願意付錢,是因為:

  • 買穩定、買合法、買關係網
  • 鞏固資料壟斷,不給對手喘息機會

而Anthropic不願意,是因為:

  • 拼不過資本、但要爭活路
  • 理想主義+節流生存戰略

這其實也是AI圈現階段最真實的競爭格局:老牌資本巨頭買斷資料,擠壓後來者,開源派孤軍奮戰。

不難想像的是,這場Reddit官司,背後真正有所指的、甚至搞垮的,可能不單單是Anthropic,而是整個“開源AI社區”

很快 Anthropic 官方就予以了回擊。Anthropic發言人在致TechCrunch的郵件聲明中表示:“我們不同意Reddit的指控,並將積極應訴。”

網友:網際網路還沒死!

配合OpenAI,排擠Anthropic

這個事情一早就在Reddit和X上炸鍋了,小編整體看下來,其實站隊還是很明顯的,一隊支援Reddit維權,另一隊認為Reddit的資料活該被抓取。

一位Reddit網友表示:Claude才不會承認自己用了Reddit資料,大公司才是最壞的人。

“Claude(Anthropic的AI助手)肯定說自己沒用Reddit資料:‘我才不偷資料呢,大公司才最壞,UBI萬歲,Bernie還能贏!’”

另一網友緊隨其後回覆道:等這場破事敲定了結果,AGI估計也快了。謝謝你證明了“網際網路已死”是錯的。

等這場破事塵埃落定,AGI 估計也快了。謝謝你證明了“網際網路已死論”是錯的,現在只有人類才會寫出這種神奇的字面沙拉。

甚至一位網友對於這種版權訴訟表示無力吐槽:等官司打完,這案子早沒意義了。

而Rddit真正值得做的,則應該是如何防止AI資料池的污染。並建議道:未來“Human Made”標籤會成大事。Reddit要想活,就該做“真人原創資訊庫”,不然都被AI自動生成內容淹沒。

LLM 發展太快了,等官司打完,這案子早沒意義了。OpenAI、DeepMind 這些年都在用看到啥就抓啥。OpenAI和Reddit、News Corp、華盛頓郵報的合作,不過是哄哄快變廢柴的媒體公司。Reddit 真要做的是,把自己定位成人類原創資訊庫,減少合成內容或者給人類內容上個數字水印。未來“Human Made” 標籤會成大事,因為 AI 普及會讓輿論徹底對立。

當然,小編髮現,不少網友則是批評Reddit的做派,比如一位網友諷刺道:

“Reddit自己從使用者身上賺了幾千萬美金,卻一分不給使用者。現在還裝模作樣搞維權。”

甚至眼尖的觀眾早已看穿了這場訴訟的本質:配合OpenIAI排擠Anthropic

“OpenAI、DeepMind這些年啥內容都抓,Reddit現在搞這事就是為了配合OpenAI排擠Anthropic。”

整體看下來,Reddit不是反AI,是要錢+壟斷資料,也順便幫OpenAI卡競爭對手。

大模型廠商的資料大戰全面打響

很明顯,Reddit 這波訴訟其實遠沒有版權呢之爭那麼簡單。跟 OpenAI、Google 簽獨家協議,看著是賣資料,實際上也鎖住了核心輿論資料來源。而高昂的協議年費,幾乎只有有錢有背景的企業才能負擔得起,開源、公益性AI團隊都會在無形之中被排擠出局。

AI廠商之間資料大戰全面打響。OpenAI靠股權控制Reddit,Google付費,Anthropic挨告,其他廠商下一步將會採取怎樣的措施?而以後開源模型的“資料來源”問題會越來越敏感。

進一步設想,想像下未來新聞、社交、法律、招聘、信用評分,全部跑在AGI之上,而這些AGI訓練資料是由這幾家公司壟斷的,相當於未來的AI記憶和語言模型世界,只掌握在少數幾家大公司手裡

尤其在 AGI 誕生之後,說什麼是“真相”、什麼是“謠言”、什麼是“主流價值觀”,都由這些模型決定。

那我們其實就進入了資料獨裁時代。

矽谷投資圈盛傳

OpenAI的AGI資料獨裁的內幕故事

在這個資料獨裁的AGI時代中:

OpenAI 和 Sam Altman:手握 AGI 最大話語權,又是 Reddit 第三大股東,自己簽協議,自己拿錢,順便排擠競爭對手。而且別忘了,Sam 一直對 AGI 世界統治有濃厚興趣,OpenAI 內部流傳的「AGI Governance Proposal」檔案,明確寫過:未來 AGI 應該由“負責任的大型公司聯合治理”。聽著像好事,實際上就是自己做裁判+運動員。

Google DeepMind:傳統科技巨頭,算是明著玩,不摻這些複雜利益結構但也一樣砸錢買資料,怕自己掉隊。

Anthropic:則成了理想主義孤膽英雄,號稱要做“安全、負責任、開源可控的 AGI”,但資金和資源都捉襟見肘。

講到這裡,小編想到了此前AI圈裡盛傳的一個內幕故事:OpenAI 的「失控版 AGI 提案」。去年有一次 OpenAI 內部爆料,一個叫Q*的項目,目標是:

  • 私有社交資料+搜尋資料+新聞評論區內容,訓練一個可以預測輿論走向、操縱情緒波動的語言模型
  • 初步試點就在 Reddit、Twitter(X) 和 YouTube 評論區裡跑了測試
  • 後來因為內部人員擔憂“Q* 具備大規模操控能力”,才有 Anthropic 那批人集體出走

這事後來 OpenAI 沒公開,但不少矽谷投資圈、媒體圈私下流傳。

所以現在看 Reddit 這波起訴 Anthropic,更像是就是清理不聽話的“反骨AI公司”,方便自己繼續把控資料來源和話語權。

寫在最後:你的帖子值多少錢

別被表面版權官司迷惑了,所有社交平台,都是AI煉丹爐。

誰能掌握最大、最獨家的“人類資料池”,誰就能把AGI時代的主動權攥在手裡。OpenAI早已動手,Google在跟進,Reddit轉型“資料礦場”,未來Twitter、YouTube、知乎、小紅書也絕不會例外。

誰掌握資料,誰就能定義未來的AI話語權。

而普通內容創作者,將越來越邊緣化。這也是一種危險訊號。

AI廠商和平台高層打著使用者的幌子進行利益聯動,正以“公開合作+背地封殺”雙軌平行。

最後,問題又回到了我們這些使用者身上:你的帖子,值多少錢?

你願不願意看著自己的帖子、評論、吐槽,被訓練成AI的一部分,成就別人的利潤和專利? (51CTO技術堆疊)