#AI學習
OpenAI,德國人要控告你侵權
“德國法院判定OpenAI訓練資料侵權,形成司法判例標竿。2025年11月11日,德國慕尼黑地方法院裁定OpenAI侵犯GEMA成員作品歌詞版權。這標誌著德國首起“AI訓練階段侵權”司法判決,意味著AI與版權的灰色地帶被法律照亮。AI學習的邊界究竟何在?歐洲會成為AI監管秩序的制定者嗎?中國的AI企業會受到何種影響?對此,本文將以該案件為切入點,梳理美國人工智慧巨頭(OpenAI、Meta、Google、Perplexity、Suno等)在歐洲的一系列糾紛,剖析背後的制度邏輯與地緣經濟動因,並探討這一趨勢對中國人工智慧企業的警示和借鑑意義:當人工智慧的底層邏輯是“學習一切”,而歐洲的規則邏輯是“許可一切”,二者的碰撞勢必引發全球格局的重構。全球首例“訓練侵權”判決為行業敲響警鐘2025年11月,德國慕尼黑地方法院判定OpenAI在訓練與輸出歌詞過程中侵犯音樂版權,成為全球首例AI大模型被判“訓練侵權”的正式案例。這一事件不僅標誌著AI與版權的衝突邁入司法化階段,也預示著歐洲在AI治理、資料主權、版權分配方面展開系統性反攻。法院在判決書中指出,OpenAI的語言模型在訓練過程中存在“記憶行為”。即,將訓練資料完整複製到模型參數中,這導致ChatGPT在輸出中再現了歌詞,從而侵犯了版權。法院強調,當模型訓練不僅從資料集中提取資訊,還在參數中包含訓練資料的完整複製時,這就構成了版權法意義上的“複製”。模型輸出相似歌詞則進一步構成未經授權的“複製與公開傳播”。這一判決,引發了全球關注。值得注意的是,此次判決,明確了AI模型訓練過程中使用受版權保護內容可能構成侵權,即使這些內容在模型中以參數形式存在,該判決給從業者們敲響警鐘,實際上,德國慕尼黑地方法院的判決僅是OpenAI面臨的眾多法律挑戰之一。在過去的3至5年中,隨著ChatGPT的發佈到商業化的快速擴張,OpenAI已陷入多起版權和隱私訴訟的漩渦。從更長遠的時間線來看,以下是資料猿梳理的一些具有代表性的案例:OpenAI被美國作家協會(Authors Guild)集體訴訟。2023年9月20日,OpenAI被美國作家協會(Authors Guild)集體訴訟。美國作家協會聯合17位知名作家,在紐約南區法院提起集體訴訟,原告指控OpenAI從盜版電子書庫批次下載其作品,將這些“專業創作、編輯和出版的書籍”複製到GPT-3.5和GPT-4的模型參數中,使其能夠生成模仿原告風格的內容,直接威脅作家生計。《紐約時報》起訴OpenAI新聞內容侵權。2023年12月,《紐約時報》向紐約南區法院起訴OpenAI和微軟,指控其未經許可使用數百萬篇文章訓練AI模型。《紐約時報》提供了100多個GPT-4輸出內容與時報報導高度相似的例子,證明模型能夠原封不動或模仿風格生成其內容,直接威脅其訂閱和廣告收入。NOYB在奧地利投訴OpenAI違反GDPR。2024年4月29日,歐洲隱私倡導組織NOYB向奧地利資料保護機構正式投訴OpenAI,指控ChatGPT違反歐盟《通用資料保護條例》(GDPR)。原告指出,ChatGPT資料不精準,捏造使用者出生日期等個人資訊。NOYB要求OpenAI糾正某公眾人物的錯誤出生日期。梳理髮現,在上述訴訟案例中,除德國慕尼黑地方法院已作出判決外,截至2025年11月,其餘訴訟仍處於審理階段。2025年就新增10余起!各地針對AI的版權糾紛浪潮此起彼伏除了OpenAI,美國AI巨頭,像Meta、Google、Anthropic等在歐洲同樣面臨著類似的訴訟潮。實際上,近兩年來,各地針對AI的版權糾紛浪潮此起彼伏,僅2025年就新增了十余起相關案件。這些案件大多指控人工智慧開發者在未事先獲得授權的情況下使用受版權保護的作品來訓練大型語言模型。如,Meta在2025年面臨來自法國出版界集體訴訟、Google被處以2.5億歐元天價罰款、Perplexity被BBC與《金融時報》指控抓取新聞內容……具體展開來看:·Meta:面臨來自法國出版界集體訴訟。2025年,Meta公司面臨來自法國出版界集體訴訟。原告指控Meta未經授權通過社交媒體平台非法抓取法語書籍、劇本及音樂作品用於訓練Llama模型。·Google:被處以2.5億歐元天價罰款。2024年,Google因使用新聞訓練被法國罰款2.5億歐元,成為全球首家因AI訓練資料侵權被處以巨額罰款的科技巨頭,開創監管先例。2024年3月,法國競爭管理局(Autorité de la concurrence)對Google處以2.5億歐元(約2.72億美元)罰款。Google未經法國出版商和新聞機構許可,擅自使用其內容訓練Bard基礎模型,違反歐盟智慧財產權規則。實際上,這是Google在同一問題上的第二次重大處罰,2021年已因類似違規被罰款5億歐元。法國監管機構指出,Google不僅侵犯版權,還破壞了與出版商的公平談判機制。·Perplexity:被BBC與《金融時報》指控抓取新聞內容。2025年6月,BBC向Perplexity發出法律警告,要求立即停止抓取BBC內容。Perplexity被指在未授權情況下抓取全球媒體內容建構資料庫,並在輸出中使用這些內容。原告方提供了大量直接複製或高度相似的內容對比,證明Perplexity“系統性剽竊”,BBC在警告信中要求Perplexity立即停止抓取所有內容,刪除所有BBC資料副本,並提供賠償方案。·Suno(美國AI音樂公司):遭丹麥KODA起訴這也是丹麥首次對AI音樂服務提起版權訴訟。2025年11月,丹麥音樂版權組織 Koda向哥本哈根城市法院提起訴訟,指控美國AI音樂公司Suno侵權,核心指控為,Suno未經許可使用Koda會員(約5.2萬名作曲家、詞曲作者和音樂出版商)的作品訓練AI模型,Koda稱這是“音樂史上最大規模的盜竊”,並指責Suno隱瞞訓練資料來源和範圍。這也是丹麥首次對AI音樂服務提起版權訴訟,Koda 要求法院判決Suno停止侵權、賠償損失,並建立透明的授權機制。·Clearview AI:生物識別資料的全球合規圍剿Clearview AI是美國一家專注於臉部辨識技術的公司,主要業務是開發麵部識別軟體,為執法機構和政府部門提供服務,其演算法可將人臉與從網際網路收集的數十億圖像資料庫匹配。2023年4月,法國資料保護機構對其處以520萬歐元罰款;2024年5月,荷蘭監管機構再罰3050萬歐元,疊加其他地區處罰,其全球罰款總額已遠超1500萬歐元。目前該公司在歐洲幾乎被全面禁止提供服務。此外,還有一些AI巨頭被訴訟的案例,如美國公司Midjourney於2025年6月、9月先後遭迪士尼、環球影業及華納兄弟起訴、美國Anthropic公司同年9月以15億美元和解因使用超50萬本版權書籍(含盜版)訓練Claude引發的集體訴訟……AI版權糾紛核心爭議背後:美歐在法律制度、版權理念具有差異綜合上述糾紛案例,我們可以看到,以上糾紛本質上是AI技術創新與傳統智慧財產權保護體系的衝突,背後卻折射出不同法域在法律制度、版權理念上的深層差異。實際上,歐洲對版權的嚴格保護,自有其一套成熟的版權集體管理體系(CMOs)。這一核心機制運轉百年,覆蓋音樂、文學、影視等全內容領域。權利人與CMOs建立委託代理關係後,CMOs可直接以自身名義談判授權、收取費用並行起維權訴訟,形成了高度組織化的保護網路。相比之下,美國AI企業長期依賴“合理使用”原則豁免責任,缺乏歐洲式的透明化合規機制,這本質是美歐版權保護理念的根本區別。上述案例也能看出,美國 AI公司習慣的"先使用後許可"或"合理使用抗辯"在歐洲似乎行不通了。歐洲秉持嚴格保護立場,歐盟《版權指令》要求"全球合規",無論訓練行為發生在何處,只要產品進入歐盟市場就必須遵守。除此之外,還有理念的分野。通過多個典型案例也可印證。如,英國AI公司Stability AI因未經授權使用數百萬版權圖像訓練Stable Diffusion遭起訴,2025年11月英國高等法院以“模型不儲存原作”判其不侵權,而美國法院因更關注訓練資料合法性仍未下判,進一步凸顯不同法域對AI訓練版權邊界的認定差異。值得注意的是,歐盟《人工智慧法案》(AI Act)已於2024年8月生效,並將於2026年全面實施,這意味著AI企業的合規要求將進一步收緊。對於全球化營運的企業而言,提前適配各個區域規則、搭建合規體系已成為必然要求。1.“先使用後驗證”與歐洲版權體系的“事前授權事後問責”形成對立AI技術的核心學習邏輯是“無限抓取、參數化模仿”,這種模式依賴對海量資料的無差別採集與內化。以上述提到的公司Meta舉例,Meta的Llama模型就被曝使用82TB的盜版書籍資料,覆蓋大量法語書籍、劇本及音樂作品,而OpenAI的ChatGPT訓練過程中也納入了未經授權的歌曲歌詞等內容。這種“先使用後驗證”的技術路徑,與歐洲版權體系“事前授權、事後問責”的核心邏輯形成天然對立。歐洲版權制度的根基是“授權方控制使用”,要求任何商業性質的內容使用必須提前獲得權利人許可,而AI的“參數化模仿”並非簡單提取資訊,而是通過模型參數“記憶”內容核心表達,當技術發展到能“近似復現”原作品時,技術邊界與法律邊界完全重疊。德國慕尼黑地方法院對OpenAI的判決正是這一沖突的集中體現:法院明確認定,模型將歌詞“記憶”並在輸出中再現的行為,構成版權法意義上的“複製”,而Suno AI能生成與版權音樂高度相似的旋律,也直接觸發了丹麥KODA 的侵權訴訟,讓技術行為無法再規避法律問責。2、歐洲在內容與法規層擁有主導權,是否會成為AI版權規則的“制定者”?在全球AI產業格局中,歐洲在基礎層明顯處於弱勢。算力核心硬體領域依賴輝達,本土AI巨頭市場影響力遠不及美國的OpenAI、Meta、Google,即便法國培育出Mistral AI等獨角獸,2023年法國AI市場規模也僅佔歐洲的17.3%,與中美差距顯著。但歐洲在內容與法規層擁有絕對主導權。內容端沉澱了全球最豐富的版權文化資源,法規端則建構了全球最嚴格的監管體系。為扭轉被動局面,歐洲通過訴訟、立法、罰款等機制重塑價值分配秩序。比如,在立法上,2024年生效、2026年全面實施的歐盟《人工智慧法案》(AI Act),要求通用目的AI模型在訓練時必須遵守歐盟版權法,並披露訓練資料來源摘要;若在訓練中違規使用受版權保護的內容,不僅違反版權法本身,也可能觸發AI Act下最高可達全球年營業額7%的罰款。司法上,德國法院判定OpenAI訓練侵權、法國法院受理Meta版權訴訟,形成司法判例標竿;罰款上,法國競爭管理局對Google處以2.5億歐元天價罰款,懲罰其未經許可使用新聞內容訓練Bard模型。這一系列動作讓歐洲成功將“被訓練者”的被動地位,轉化為AI版權規則的“制定者”。3.集體管理組織的產業性反攻GEMA、KODA、SNE/SGDL等歐洲版權集體管理組織(CMOs),已成為AI時代的“新版權談判代表團”。這些組織擁有成熟的運作機制和強大的資源整合能力:德國GEMA代表約6萬多名作曲家、作詞家和音樂出版商,2025年預計向全球權利人分配11.33億歐元版權費;法國SNE(國家出版聯盟)聯合SNAC(國家作者與作曲家聯盟)、SGDL(法國作家協會),能快速動員全行業力量發起集體訴訟;丹麥KODA則代表5.2萬名音樂創作者,覆蓋歐洲音樂版權的核心領域。面對AI廠商無償使用版權內容的現狀,這些組織發起系統性反攻。GEMA率先起訴OpenAI並勝訴,為全球AI訓練侵權訴訟樹立標竿;KODA針對Suno AI發起丹麥首例AI音樂版權訴訟,指控其“大規模盜用音樂作品”;SNE聯合多家機構起訴Meta,要求其刪除非法訓練資料集並賠償損失。它們的核心目標明確:通過集體訴訟形成壓力,迫使AI廠商放棄“免費抓取”模式,進入標準化的付費授權體系,Anthropic支付15億美元和解作者集體訴訟的案例,已證明這種產業性反攻的實際效果。4.地緣與輿論的共振在歐洲輿論場中,美國AI公司的“無限抓取”行為被普遍視為“文化掠奪”,這種認知背後是文化主權與科技主權的雙重焦慮。IE大學對歐洲10國3000餘人的調查顯示,歐洲民眾對AI的信任存在明顯邊界,尤其警惕外來科技公司對本土文化的侵蝕。法國出版商聯盟在起訴Meta時明確指責其行為是“版權掠奪”,強調要保護法語文化遺產免受“AI無償侵佔”;德國GEMA的訴訟也被賦予“守護德國音樂創作生態”的意義,反映出歐洲對本土文化內容被美國AI公司無償使用的強烈擔憂。在科技主權層面,歐洲深知自身在AI基礎層的短板,轉而通過版權監管建構“非技術壁壘,比如歐盟《人工智慧法案》的出台、多國對美國AI公司的罰款與訴訟,本質上是通過規則制定權避險美國的技術優勢。這些舉動,試圖讓歐洲民眾、監管機構與版權組織形成共識,推動針對美國AI公司的侵權糾紛集中爆發,而法國總統馬克宏提出的AI“第三極”戰略,更讓這種共振帶上了明確的地緣競爭色彩。從“野蠻生長”轉向“合規競逐”合規調整已箭在弦上基於歐洲AI版權訴訟浪潮與監管框架的成型,可以預見的是,全球AI產業將從“野蠻生長”轉向“合規競逐”。1.從判決到機制:AI版權許可制度成型,各家AI廠商不得不付費入場?如今,美國AI巨頭已被迫開啟“付費入場”模式。如上述提及的多個案例,Anthropic支付15億美元和解作者集體訴訟,成為首個大規範本權補償案例;Meta正與法國SNE聯盟談判法語書籍授權,以規避Llama模型的侵權風險;Google在2.5億歐元罰款後,已與歐洲新聞機構達成年度授權協議,金額超3億歐元。未來幾年內,歐洲將完成判決案、行業標準再到結算機制的落地,拒絕接入該機制的AI廠商將被限制在歐盟4.48億人口市場的商業變現,OpenAI、Perplexity 等依賴歐洲使用者的企業,將不得不每年支付數相關的版權費用。未來歐洲將建立AI訓練資料授權體系,形成類似Spotify的“AI版權結算機制”,各家AI廠商不得不付費入場。2.歐盟的AI Act與GDPR疊加,將形成嚴格的AI監管閉環AI模型須提供資料來源說明、權利人申訴通道、可解釋性文件和透明報告。合規將成為競爭壁壘。歐盟AI Act將於2026年全面實施,這一政策的實施與GDPR的疊加,將形成全球最嚴格的AI監管閉環,例如,未來將要求生成式AI必鬚髮布訓練資料詳細摘要,公開資料來源合法性證明;建立權利人專屬申訴通道,24小時內響應侵權投訴;提供模型決策邏輯的可解釋性文件,接受監管機構的定期合規審計。未來,合規能力將成為企業能否立足歐洲市場的“生死線”,並形成顯著競爭壁壘。從另一方面來說,單模型的合規審計和資料溯源投入,可能達到數十萬歐元甚至更高的等級,對中小企業而言構成不小的成本壓力,這將加速行業“馬太效應”。預計2027年歐洲AI市場前5大廠商將佔據大部分市場份額,大量不合規的中小玩家被淘汰。3.全球溢出效應:亞洲與中國必將被波及中國企業若在模型訓練中使用歌詞、書籍、影視、新聞等受保護內容,也將面臨“歐式合規標準”壓力。歐盟作為全球第二大AI市場,其監管規則將通過“市場准入倒逼”形成全球溢出效應,亞洲國家已率先做出反應:日本多家出版商聯合成立CODA聯盟,要求OpenAI停止使用其作品訓練Sora2,明確反對“默認授權”模式,其訴求與歐洲版權保護邏輯高度一致;韓國正修訂《版權法》,擬將AI訓練資料使用納入“事前授權”框架。這也意味著,像文心一言、通義千問、火山方舟等希望出海的中國模型,在進入歐洲市場時也不得不排查訓練資料中涉及歐洲版權內容的部分。另一方面,國內監管正加速跟進,國務院《關於深入實施“人工智慧+”行動的意見》明確要求完善AI版權制度,北京、江蘇已出現AI生成內容侵權判例,法院認定“人機協作作品受版權保護”,倒逼企業規範訓練資料來源。4.商業化路徑再塑:合規能力將成為AI公司的競爭力之一未來,合規能力將成為AI公司的競爭力之一。AI行業的競爭焦點將從“參數規模”轉向“合規能力”,“可審計訓練”“反覆現檢測”“版權清潔室”三大技術成為破局關鍵,直接決定企業的跨國合作與商業變現能力。頭部企業已率先佈局。Anthropic的Claude3推出“版權過濾”功能,可自動識別並排除訓練資料中的未授權內容,其“版權清潔室”技術吸引美聯社、大英百科全書等內容方合作;Stability AI在英國勝訴後,升級了“反覆現檢測系統”,確保生成圖像不與版權作品高度相似,成為首個獲得歐洲藝術協會授權的AI圖像廠商;Google Gemini則開放“訓練審計介面”,允許監管機構追溯資料使用全流程,合規優勢使其拿下歐洲多個政府項目訂單。商業化模式也隨之重構:一是“合規版模型”溢價銷售,如Meta針對歐洲市場推出Llama3合規版,訂閱費較基礎版高30%,仍吸引大量企業客戶;二是“版權分成”合作,Suno AI與KODA談判達成協議,將AI音樂生成收入的4%分給版權方,成為首個合法落地歐洲的AI音樂平台;三是合規技術輸出,如青鸞印的區塊鏈存證系統已被多家AI公司採用,年服務收入突破億元,催生“AI合規服務商”新賽道。對創作者而言,這一趨勢似乎會帶來新的收入增長點。通過CMOs接入AI版權結算機制,無需直接談判即可獲得訓練授權收入。“AI內容經紀人”等新職業出現,個體創作者可通過批次存證、打包授權實現規模化收益等等。如此看來,合規是挑戰,更是轉型契機。對於未來的AI企業而言,合規不是負擔,而是全球化競爭的入場券和商業模式升級的催化劑。誰能率先建立完善的版權合規體系,誰就能在這場全球AI治理變革中佔據主動,實現從"技術跟隨者" 到"規則參與者"的角色轉變。 (資料猿)
Demis Hassabis最新採訪:宇宙的本質是資訊,一切都將被AI學習,2030年可實現AGI
Demis Hassabis最新採訪:宇宙的本質是資訊,一切都將被AI學習GoogleDeepMind掌門人Demis Hassabis再度做客Lex Fridman播客,貢獻了一場長達兩個多小時、資訊量爆炸的深度對話在這場對話中,Hassabis不僅給出了AGI實現的驚人時間表,更首次系統性地闡述了他關於宇宙、現實與AI的大一統哲學思想。他將AlphaFold、視訊模型Veo、電子遊戲、P vs NP問題,乃至生命的起源和意識,全部串聯到了一個宏大的框架之下全程兩個多小時,3萬多字,強烈建議去看原視訊:搜尋Demis Hassabis: Future of AI, Simulating Reality, Physics and Video Games以下是我覺得比較有意的的點,分享給大家宇宙的本質是資訊,因此萬物皆可被AI高效學習資訊第一性: Hassabis明確提出,資訊是比能量和物質更根本的宇宙單位。整個宇宙可以被看作一個巨大的、在物理基底上運行的資訊系統宇宙不是隨機的: 從蛋白質摺疊、山脈形態到行星軌道,我們看到的一切都經過了某種形式的演化或篩選過程(他稱之為“最穩定者生存”),因此其背後必然存在可學習的內在結構(a learnable manifold)P vs NP是物理問題: 在這個資訊宇宙觀下,P vs NP問題不再只是一個數學難題,而是一個關於物理現實的根本問題。如果宇宙的結構是可學習的,那麼許多看似指數級複雜的NP問題(如蛋白質摺疊),其實都可以通過AI建模,找到捷徑在多項式時間內解決Veo模型是證據: 為什麼像Veo這樣的視訊模型能如此好地模擬流體、光照等複雜物理現象?Hassabis認為,這恰恰證明了AI正在從海量視訊中反向工程出物理現實的底層規律,發現了那個可以被高效學習的低維流形, 像AlphaFold和Veo這樣的AI系統,其成功之處在於它們正在反向工程並學習這些自然界中存在的底層資訊模式,從而實現了對複雜系統的高效建模和預測AGI的終極使命是成為科學家的望遠鏡對於Hassabis而言,打造AGI本身不是目的,使用AGI來回答宇宙最宏大的問題才是。AGI的圖靈測試: 如何判斷AGI已實現?不是通過枯燥的測試集。Hassabis提出了一個愛因斯坦測試:將時間撥回1900年,給AI系統當時所有的物理知識,看它能否獨立提出相對論。或者,讓它發明一款像圍棋一樣深邃、優雅的新遊戲。這才是真正的創造力,AGI的“Move 37”時刻5年內或見分曉: 他給出了明確的時間表,認為有50%的機率在未來五年內(即2030年前)實現AGIAGI的應用藍圖:1. 模擬生命:他25年的夢想——虛擬細胞計畫,即完整模擬一個細胞(如酵母)的內部動態。AlphaFold 3解決了靜態結構和互動,下一步就是模擬整個生命通路,最終模擬生命的起源2. 解決能源:幫助設計可控核聚變反應堆、發現室溫超導材料、最佳化太陽能電池,最終實現激進的富足(Radical Abundance),讓人類擺脫資源束縛3. 宇宙遠征:能源問題解決後,人類將進入太空巴士時代,走向星辰大海,用卡爾·薩根的話說,就是讓意識覺醒宇宙電子遊戲是模擬現實與探索人性的最佳沙盒作為骨灰級遊戲玩家和製作人(《主題公園》、《黑與白》),Hassabis對遊戲的理解遠超娛樂。遊戲是微縮宇宙: 無論是象棋、圍棋還是足球,遊戲都是對現實世界某種決策、衝突或合作的簡化模擬。它讓我們在安全的環境中,練習決策、體驗成敗、理解人性未來的遊戲是可玩的Veo: 他夢想中的終極遊戲,是一個由AI即時生成的、完全開放的世界。玩家的每一個選擇都會動態地塑造劇情和世界,實現真正的與世界共創故事,這是任何其他媒介都無法比擬的遊戲塑造思維: Hassabis坦言,他之所以能將複雜的科學問題分解、建模並尋找解決方案,很大程度上得益於從小接受的遊戲和棋類思維訓練意識可能是經典計算,但基底決定感受在談到意識這個終極難題時,Hassabise認為:傾向經典計算: 他並不同意彭羅斯的量子意識假說,認為大腦的計算過程大機率是經典的,因此可以在經典電腦上被模擬基底決定感受: 意識最神秘的部分是主觀體驗(Qualia)。我們之所以能推斷他人有意識,一是因為行為相似,二是因為我們擁有相同的碳基硬體。AI即使行為再像人,它的矽基硬體也決定了它的感受可能與我們完全不同腦洞大開的未來: 如何跨越這道鴻溝?Hassabis設想,未來通過腦機介面,我們或許能親身感受一下資訊在矽基晶片上被處理是什麼感覺,從而真正理解不同智能體的意識。總結來說,在Demis Hassabis看來,AI、物理、遊戲、生命、意識,最終都指向同一個終極問題:現實的本質是什麼?而他畢生的事業,就是打造出AGI這個最強大的工具,去探索這個問題的答案。這不僅關乎技術,更關乎人類文明的未來和我們在宇宙中的終極位置 (AI寒武紀)