#訓練資料 | 熱門關鍵字 | 鉅亨號

Gemini 3的逆襲，給業界帶來了太多的驚喜和問號。與此前不同的是，業界到現在似乎也沒有逆向出Gemini3的秘方出來。本周五，繼Google兩位大佬 Demis、Jeff Dean 播客訪談之後，終於有一位一線的負責人出來爆料了。這位可沒有前面兩位大佬嘴嚴。Google DeepMind 的 Gemini 3 預訓練負責人 Sebastian Bourjou，在訪談中被主持人挖出來不少關於 Gemini 3 的消息。比如，跟上一代相比，Gemini3 在模型架構的改動並沒有大到脫離了 transformer 架構，大體上還是能看出它是Transformer MoE架構的影子。並坦承，Gemini 3之所以提升如此大，是大中小多重因素疊加的結果。再比如，他自曝說自己感覺不是在做大模型，而是在建構一個複雜的系統。“這件事實際上會深刻改變研究方式，以及我們思考問題的方法。”Bourjou 還特別提到了一種範式的變化：過去，我們基本處在一個“資料幾乎無限”的規模化階段；而現在，我們正在進入一個“資料受限”的階段。關於“預訓練到頭了嗎？Scaling Law 到頭了嗎？”Bourjou很果斷的給出了否定的答案，並指出，自己並沒有看到這條研究路線在短期內會走到盡頭。“至少 1 年內，它仍然會持續為我們帶來進展。”這次訪談非常的technical，從預訓練、到後訓練、對齊、RL，再到Gemini3所用的訓練資料，再到最近大火的持續學習。都給出了自己的“研究品味”。在他看來，工程與研究的邊界已經開始分不清了！訪談中，他還聊到了，Gemini 3 在底層是如何建構的、從“無限資料時代”轉向“資料受限階段”的變化、DeepMind 內部研究團隊的組織方式，以及 AI 接下來可能會走向那裡。下面是小編整理的採訪全文，enjoy！Oriol 的“秘密配方”：更好的預訓練 + 後訓練Matt Turk大家好，今天的嘉賓是Sebastian Bourjou，Google DeepMind 的 Gemini 3 預訓練負責人。Sebastian 是全球頂尖的 AI 研究者之一，同時也入選了 Meta 的研究員榜單。這一期節目格外特別，因為這是他第一次參加播客訪談。Matt Turk我想從一條推文聊起。這條推文來自 Oriol Vinyals，他是 Google DeepMind 的研究副總裁、深度學習負責人，也是 Gemini 的聯合負責人之一。在 Gemini 3 發佈時，他說這個模型背後的“秘密”其實非常簡單：更好的預訓練，以及更好的後訓練。考慮到 Gemini 3 相比之前的 SOTA 有這麼大的躍遷，這樣的說法聽起來反而有點“樸素”。我很好奇，你怎麼看？事情真的就這麼簡單嗎？Sebastian Bourjou我不確定這算不算什麼“秘密”。至少從我的視角來看，這其實挺正常的。很多人會期待，從一個 Gemini 版本到下一個版本，一定會有某個“巨大變化”，突然帶來質的飛躍。但根據我的經驗，確實會有一兩個因素，比其他因素的影響更大一些，但真正決定結果的，往往是大量改進的累積。Gemini 3 之所以明顯優於前幾代，並不是因為某一個單點突破，而是一個非常龐大的團隊，在非常多細節上持續改進，最終匯聚成了這個結果。我想這也是一個會在後面反覆出現的主題：像 Gemini 3 這樣的發佈，本質上是一個大規模團隊協作的成果。AI 進展為什麼還沒有放緩Matt Turk從這個角度來看，這對我們理解 AI 的發展階段意味著什麼？僅僅通過“調參數”“擰旋鈕”，就能帶來如此大的提升，這說明了什麼？對未來的進展，我們應該有什麼預期？Sebastian Bourjou我覺得有兩點。第一點是：通過這種方式，我們依然能夠取得如此顯著的進展，這件事本身就非常值得注意。而且，這種進展並沒有明顯放緩。我們每天都會發現新的“旋鈕”、新的改進點，幾乎是日常層面的發現——這些都會讓模型變得更好。第二點是：我們已經不再只是建構一個模型了。我們現在建構的是一個系統。有些人會認為，我們只是訓練了一個神經網路架構，僅此而已。但實際上，我們建構的是圍繞這個網路的整個系統。這是一個整體工程，而不是單一模型。模型真的在“變聰明”嗎？Matt Turk這是很多人心中的核心問題：這究竟意味著什麼樣的智能進展？我們不一定非要討論 AGI，畢竟誰也說不清它到底指什麼。但問題是：我們是否應該把這種模型進展，看作是真正通往智能的一條路徑？還是說，它更多隻是為了在某個基準測試上取得好成績？是什麼讓你相信，模型的“核心能力”正在變得更強？Sebastian Bourjou從基準測試的角度看，成績確實在持續提升。而且如果你觀察這些前沿 benchmark 的設計方式，它們本身也在變得越來越難。即便是對我這樣有電腦科學背景的人來說，模型現在能回答的一些問題，我自己也需要花相當多時間才能解出來。當然，這只是一個視角——基準測試視角。我們也會非常頻繁地做評估，對測試集保持嚴格隔離。但即便如此，人們還是會擔心過擬合，或者所謂的“刷榜”。我個人並不太認同這些擔憂。但真正讓我有信心的，是另一件事：內部使用模型的時間，在持續增加。每一代新模型，都非常明顯地展現出新的能力，它們在研究和日常工程工作中，能比上一代幫到我們更多。這一點非常清楚。這說明模型不僅在分數上更好，而且在做真正有用的事情，能力也在實質性提升。兩三年後：最先發生變化的是什麼？Matt Turk作為一名深度參與其中的 AI 研究者，我一直很好奇：如果你把視角拉遠一點來看，現在的進展還會讓你感到意外嗎？從你的角度看，我們是明顯走在預期前面，還是基本符合當初的判斷，甚至有點落後？Sebastian Bourjou事後回看，說“我們在正軌上”其實很容易。但如果我對自己足夠誠實，我會說，我們確實走在了我當初預期的前面。2019 或 2020 年剛開始做大語言模型時，很難想像今天的規模，也很難想像模型現在能做到的事情。當年從 scaling law 的角度看，確實有人認為會走到這一步，但我不確定自己當時是否真敢下注，賭它會如此完整地實現。接下來兩到三年，會發生什麼？Sebastian Bourjou一個自然的問題是：如果我們假設未來五年的進展節奏，和過去五年差不多，那接下來會發生什麼？我覺得未來幾年會非常有意思。Matt Turk那你怎麼看短期內的變化？比如兩到三年內，AI 會不會做出全新的科學發現，甚至拿到諾貝爾獎？你覺得最近的方向會走向那裡？Sebastian Bourjou我覺得這是其中的一部分。在科學研究層面，DeepMind 一直在這方面投入很多，我也相信未來幾年我們確實有機會做出一些重大的科學發現。Sebastian Bourjou但在我自己的日常工作中，不論是研究還是工程，我更興奮的是：這些模型如何幫助我們更快推進工作，同時也幫助我們更好地理解我們正在建構的系統，並進一步深化自己的研究理解。Matt Turk現在行業裡有一個很大的話題：AI 是否會自動化 AI 研究和工程。如果順著這個邏輯往下推，就會走向那種“AI 2027” 的斷點式場景。從一個非常現實的角度看，你現在是如何使用 AI 的？你覺得兩年後會變成什麼樣？Sebastian Bourjou我覺得重點不在“自動化”，而在“加速”。AI 會讓我們把更多時間投入到更高層次的研究本身。AI 做 AI 研究：更快，但不是全自動Sebastian Bourjou在語言模型研究中，我們每天面對的是非常複雜、非常龐大的系統，尤其是在基礎設施層面。大量時間花在跑實驗、盯實驗、分析資料、整理結果上，真正有價值的部分是形成假設和設計新實驗。後面這兩件事，人仍然會深度參與；而前面的部分，在接下來一年裡，隨著更具 Agent 特性的工作流成熟，會被顯著加速。前沿實驗室：相似的路，分叉的研究樹Matt Turk你覺得各家前沿 AI 實驗室，本質上是不是都在做同一件事？作為行業觀察者，我們會感覺每隔幾周就冒出一個“驚豔模型”，大家反而有點被寵壞了。比如 Gemini 3 剛發佈沒多久，幾乎同時 GPT-5.2 也出來了。你怎麼看這種現象？最終會不會有人明顯跑出來，還是說會長期維持“少數頂級實驗室 + 一些新興團隊”的格局？Sebastian Bourjou先說第一點，各家確實有很多相似之處，底層技術路徑也比較接近。如果所有人都在訓練 transformer 類模型，我也不會感到太意外，但在此之上，大家確實在做不同方向的專精。不同公司會探索不同的研究分支。比如從歷史上看，DeepMind 在視覺和多模態方向一直很強，這一點現在仍然很明顯，無論是使用者使用方式還是 benchmark 表現。推理能力也是類似的情況，OpenAI 首先推出了相關模型，但我們內部其實也有對應的研究線。為什麼在Google 做研究很有吸引力規模、資源與潛在顛覆Sebastian Bourjou至於第二個問題，我不確定有沒有標準答案。很現實的一點是：今天要推動 Gemini 這種等級的模型進展，確實需要非常大的團隊和資源。但這並不意味著當前路徑是最優的，未來完全可能出現顛覆性研究，讓小團隊也能實現突破。Sebastian Bourjou這也是我很享受在 Google 的原因之一。這裡一直有大量探索性研究，研究廣度非常高，而且很多工作是和 Gemini 平行進行的。這些成果最終也能被吸收進 Gemini，形成正向循環。Transformer 之後，會不會有突然的斷裂式創新？Matt Turk在 DeepMind 或整個行業裡，是否存在一些半公開甚至完全保密的團隊，在研究“後 Transformer”架構，有一天突然公佈成果，讓所有人都措手不及？Sebastian Bourjou我相信是有的。在 Google、在 DeepMind 內部，確實有人在研究模型架構層面的新方向。至於這些研究是否最終會成功，很難說——這就是研究本身的特性。DeepMind 的優勢：研究 × 工程 × 基礎設施Matt Turk真正能成功的研究想法其實非常少。所以在這個過程中，一家公司相對另一家的核心優勢，往往歸結為“人”的質量。回到我剛才提到的那條推文，Demis Hassabis 轉發並評論說，真正的秘密在於研究、工程和基礎設施的結合。這是不是 Google 的“秘密配方”？你們做的是完整技術堆疊。Sebastian Bourjou這確實非常有幫助，我認為這是一個重要因素。另外，“研究”和“工程”之間的邊界，也在不斷變得模糊。Sebastian Bourjou在今天這種超大規模系統中，研究看起來越來越像工程，工程也越來越像研究。這種心態在 DeepMind 過去幾年變化很大，尤其是在 Gemini 項目中，現在更像是“研究工程”。基礎設施同樣關鍵，我們建構的是極其複雜的系統，可靠、穩定、可擴展的基礎設施，直接決定研究和工程能否不被拖慢。Matt TurkGemini 3 是在 TPU 上訓練的，對嗎？不是用輝達的晶片。這基本算是完全垂直整合了。進入Gemini 3 深水區之前，先聊聊你Matt Turk在深入 Gemini 3 之前，我想先聊聊你本人。你是 Gemini 3 的預訓練負責人之一，這具體意味著什麼？然後我們再談談你的背景和經歷。Gemini 3 預訓練負責人，到底在做什麼？Sebastian Bourjou我是 Gemini 預訓練的幾位負責人之一，這個角色其實包含很多方面。一部分是研究本身，目標是讓模型變得更好；但現在更多是設計實驗、和團隊一起評估結果，而不是自己親自跑實驗。Sebastian Bourjou另一部分——而且我覺得很有意思——是協調與整合。現在預訓練團隊已經非常大了，很難精確統計，但日常參與的人大概在 150 到 200 人之間，涵蓋資料、模型、基礎設施等多個方向。大團隊協作，才是長期效率的來源Sebastian Bourjou把這麼多人的工作整合成一個統一、可推進的系統，本身就是一件非常複雜、也非常耗時的事情。但我認為這是最重要的，因為真正推動長期進展的，是讓所有人都能持續產出，而不是只讓一小撮人跑在最前面。短期或許能靠小團隊突進，但長期來看，真正成功的路徑是大規模協作與整合。“逆向”頂級AI 研究者的成長路徑| 天才往往搬家Matt Turk我一直很好奇，你是在那里長大的？很多人都想“逆向工程”頂級 AI 研究者的成長路徑——他們來自那裡，又是如何走到今天的？Sebastian Bourjou我在歐洲各地長大，搬過很多次家。我出生在荷蘭，7 歲時搬到瑞士；我父親是瑞士人，母親是德國人。我在瑞士完成了大部分中小學教育，用的是法語和德語。15 歲左右我搬去了義大利，在那裡完成了高中，直到 19 歲。原本我打算去蘇黎世聯邦理工學院（ETH）讀大學，但有一天我隨手查了下大學排名，看到了劍橋，就想“那我也申請一下試試吧”。幾個月後我收到了錄取通知，於是去了劍橋，在電腦實驗室完成了本科和碩士。| 從小就擅長數學和程式設計Matt Turk你小時候就是那種數學特別強、偏電腦的孩子嗎？Sebastian Bourjou我父親有技術背景，所以我大概在 10、11 歲時就跟著他開始寫點程序。我一直挺喜歡這些東西，在學校裡數學和理科也比較輕鬆。高中時我幾乎不用怎麼複習數學考試，也能考得不錯——不過這在大學裡就完全不成立了。| 從學校到DeepMind：一次勇氣，換一次機會Matt Turk很好。那你從學校走到今天這個位置，中間經歷了怎樣的路徑？Sebastian Bourjou說實話，這裡面有一點運氣成分。我碩士期間有一門課的老師，剛好也是 DeepMind 的研究員。最後一節課結束時，我心想不如直接問他要個內推，最壞的情況也就是被拒絕。Sebastian Bourjou我就鼓起勇氣走過去問了，他說：“可以，把你的簡歷發給我，我看看能做什麼。”這就是我拿到 DeepMind 面試的起點，大概是在 2018 年。畢業後我加入了當時還沒併入 Google 的 DeepMind，職位是研究工程師。| 從強化學習開始，轉向真實世界資料Matt Turk你最開始做的是什麼？又是怎樣一步步走到 Gemini 3 預訓練負責人的？Sebastian Bourjou剛加入 DeepMind 時，它以強化學習聞名，所以我一開始也做的是 RL。具體來說，是在 Atari 環境裡訓練無監督網路，學習關鍵點，讓智能體玩遊戲。我做了大概半年，但逐漸發現我不太喜歡這種偏“合成世界”的研究。我更希望做和真實世界資料有關、能產生現實影響的事情。我本質上喜歡“造東西”，而且是能真正跑起來的東西，對純學術研究的興趣反而沒那麼強。這推動我轉向表徵學習（representation learning），訓練能支撐多種任務的通用表徵網路。這裡，有個我經常跟團隊講的小故事：我最早參與的項目叫“從真實世界資料中進行表徵學習”，當時必須特意強調“真實世界資料”，否則大家默認你是在做合成環境或合成資料——而現在，這個前提已經完全反過來了。| 從表徵學習到Transformer 和 LLMSebastian Bourjou這也是我第一次系統性地進入 Transformer 和大語言模型方向。當時我們在研究像 BERT、XLNet 這樣的模型，重點是如何學到更好的表示，以及如何改進這些表示。這為我後續進入大規模預訓練打下了基礎。Matt Turk後來你參與了 RETRO，對嗎？可以講講那段經歷嗎？Sebastian Bourjou在那之後，我們開始真正推進大語言模型的規模化。最早是 Gopher，那應該是 DeepMind 發佈的第一篇 LLM 論文，當時團隊已經有 10 到 12 個人了。從那一刻起，就很清楚這類研究不可能靠個人完成。這也是我真正開始做大規模預訓練的階段。我們訓練了第一個 dense Transformer，大約 2800 億參數、3000 億 token。今天回看，那些做法肯定不會再用，但當時是一次非常寶貴、也很有趣的學習過程。兩條預訓練的研究線| Chinchilla：重新思考“怎麼用算力”Sebastian Bourjou之後分化出了兩條重要的研究線：Chinchilla 和 RETRO。在 Chinchilla 中，我們重新審視一個核心問題：在固定訓練算力下，模型規模和資料規模該如何平衡？結論是，資料規模應該比之前認為的更快增長，而不是一味放大模型。有意思的是，這個結論在今天仍然非常關鍵，因為它直接影響模型部署後的推理成本，以及實際使用有多昂貴。這並不是一個“歷史問題”，而是一個持續影響工程決策的結論。| RETRO：把“記憶”外包給系統Sebastian Bourjou另一條研究線是 RETRO，更偏架構創新。核心思想是：與其把所有知識都塞進模型參數里，不如讓模型在訓練和推理時，能從一個大型文字庫中檢索資訊。也就是把“記憶”部分，從參數中解耦出來。“研究品味”Matt Turk你剛才用了一個詞——“研究品味”（research taste），我覺得特別有意思。你會如何定義它？它對研究者來說有多重要？Sebastian Bourjou它在今天非常重要，但也確實很難量化。第一點是：你的研究不是孤立存在的，它必須能和其他人的研究很好地協同、被整合進系統裡。好想法，如果拖慢別人，就不是好權衡。假設你提出了一個改進，讓模型性能提升了，但同時讓其他所有人的使用成本增加了 5%。這通常不是一個好的權衡，因為你會拖慢其他人的研究節奏，而這會在長期累積中減慢整體進展。這是研究品味中的第一層判斷。Sebastian Bourjou第二點是對複雜度保持警惕。複雜度本身是主觀的，但我們始終有一個“複雜度預算”和“研究風險上限”，超過之後，系統就會開始失控。因此，我們常常會犧牲一點性能，換取更低複雜度的方案，以便未來能走得更遠。Matt Turk聽起來研究品味裡也包含一種直覺判斷——什麼可能行得通，什麼不值得繼續投入。在算力有限的前提下，這種直覺是不是也很關鍵？Sebastian Bourjou是的，這一點非常重要，而且不同人差異很大。經驗在這裡非常有幫助，而我們在研究層面確實受限於算力。多數研究都會失敗，這本身就是現實Sebastian Bourjou研究的關鍵在於選擇探索那一條“研究樹”的分支，以及在這條分支上該做那些實驗。而且要知道，大多數研究想法都會失敗，你需要判斷什麼時候該停下來、什麼時候值得繼續推進。在深度學習中，負結果往往並不代表“不可能”，而是“你還沒把它做對”。修復、探索，如何平衡？Matt Turk既然談到研究組織方式，我們再深入一點。一個典型的權衡是短期和長期之間的取捨，你們是怎麼平衡的？Sebastian Bourjou這是我花很多時間思考的問題。一方面，總有一些明確的“關鍵路徑”問題，比如模型某個部分明顯不夠好，這些我們會優先修。這些修復是相對安全的投入，而且往往能直接提升模型。更重要的是，那些當前看起來“不夠完美”的地方，往往會在模型規模變大、能力增強後放大成大問題。所以在早期就非常嚴謹地處理這些問題，其實是在為未來降風險。另一部分，則是更探索性的研究，可能會影響下一代或下下代 Gemini，但尚未被驗證。這兩者的平衡並沒有固定公式，也和階段有關。在擴容階段，探索會多一些；在發佈前，則高度聚焦執行與去風險。研究vs 產品壓力Matt Turk在類似的維度上，還有研究與產品目標之間的張力。在激烈競爭中，是否會有“必須贏某個榜單”的現實壓力？Sebastian Bourjou在 Google，其實這種壓力相對很少。因為管理層大多有研究背景，他們很清楚：你可以短期“刷榜”，但真正重要的是研究本身是否走在正確方向上。至少對我個人來說，日常工作中幾乎感受不到這種壓力。DeepMind 的組織結構是怎樣的？Matt TurkDeepMind 的團隊是如何組織的？你提到預訓練有幾百人，那是否還有後訓練、對齊等不同團隊？Sebastian Bourjou有預訓練團隊，也有後訓練團隊。預訓練涵蓋模型、資料、基礎設施和評測，而評測本身常被低估，但其實非常難、也非常關鍵。此外還有大規模的基礎設施和服務團隊。Gemini 3：架構上基本仍然是TransformerMatt Turk好，我們稍微換個話題。按照之前的約定，我們來深入聊聊 Gemini 3 的內部設計。Matt Turk從使用者角度看，Gemini 3 和 2.5 的感覺差異很大。是否有某個重大的架構決策，解釋了這種變化？Sebastian Bourjou從高層來看，架構並沒有發生根本性變化。更多是多個改進點疊加在一起，最終帶來了顯著提升。整體上，它仍然是基於 Transformer 的混合專家（MoE）架構。Matt Turk能否用更教學一點的方式，解釋什麼是 MoE 架構？Sebastian BourjouTransformer 主要有兩個模組：第一個是注意力模組，負責在不同 token 之間混合資訊；第二個則是前饋模組，則提供模型的“記憶”和計算能力，它們是平行作用在單個 token 上的。在原始 Transformer 中，前饋模組是一個 dense 的全連線到網路。而MoE 的核心思想是：將計算量與參數規模解耦，通過路由機制，動態選擇“專家”來處理輸入。這樣就能在不線性增加計算成本的前提下，提升模型容量。原生多模態，真實成本如何Matt TurkGemini 是原生多模態模型。在實踐中，這對模型來說到底意味著什麼？Sebastian Bourjou這意味著我們不是為圖像、音訊、文字分別訓練不同模型。而是同一個神經網路，同時處理所有模態的資訊。Matt Turk這種原生多模態在成本上會更貴嗎？比如 token 成本？Sebastian Bourjou這是個好問題，成本主要體現在兩個方面。第一是研究複雜度，多模態互動會增加系統複雜性，需要額外思考和設計。第二是計算成本，圖像輸入通常比純文字更大，但這也是效率最佳化的重要研究方向。Scaling Law 真的“死”了嗎？Matt Turk回到你最擅長的預訓練領域。2025 年有不少聲音在討論“Scaling Law 是否已經失效”，Gemini 3 是否給出了反證？Sebastian Bourjou是的，這類討論對我來說一直有點奇怪，因為它們和我的實際經驗並不完全一致。我們看到的情況是：Scaling在預訓練中依然非常重要，也是讓模型變得更強的關鍵因素之一。但問題在於，過去人們有點高估了規模這一維度。規模確實能讓模型變好，而且它的優勢在於結果相對可預測——這正是規模定律告訴我們的：當模型變大時，性能大致會提升多少。但這只是其中一部分。另外兩大關鍵因素是模型架構和資料層面的創新，它們在當下的預訓練性能中同樣、甚至可能比“純粹堆規模”更重要。當然，規模依然是一個重要因素，對吧？而且我們這裡討論的是預訓練階段。因為今年我們看到的是：後訓練階段有規模化的 RL，推理時有規模化的 test-time compute 等等。但在預訓練中，你們看到的情況似乎是，不僅 scaling loss 沒有放緩，甚至還有加速的跡象——我的理解是，這主要來自資料和不同架構的變化，對嗎？Sebastian Bourjou我覺得更準確的說法是：這些因素是疊加在一起發揮作用的。規模只是其中一個軸，而模型本身和資料的改進，同樣會推動整體性能提升。Matt Turk當你在模型架構層面做出改進時，通常意味著什麼？是不是用同樣規模的資料，模型能得到更好的結果；或者反過來，用更少的資料，就能達到上一代模型的效果？Sebastian Bourjou對，這正是第一個層面的含義。架構改進本質上提高了資料效率。不過就資料體量而言，我們現在使用的資料規模，依然比人類一生可接觸到的量高出好幾個數量級。進化過程常被拿來類比，但那類高層討論往往依賴太多假設。至少在一階近似下，看起來我們確實比人類“喂”了模型更多資料。未來研究方向Matt Turk在整個預訓練進展上，除了規模之外，你在行業裡還對那些方向感到興奮？Sebastian Bourjou一個明顯的方向是長上下文。在 Gemini 1.5 中，我們在長上下文能力上實現了一次很大的躍遷，這直接支撐了如今模型和智能體處理大型程式碼庫等複雜工作的能力。接下來一年，我預計會看到更多關於“如何高效支援長上下文”的創新，以及進一步拉長上下文字身的研究。此外，在注意力機制上，我們最近也有一些很有意思的發現，可能會深刻影響接下來幾個月的研究方向。整體來看，進步往往來自大量中小改進的疊加：修一個問題、補一個漏洞、驗證一項看似不起眼但有效的研究，最終一起推動整體向前。長上下文會取代RAG嗎？否Matt Turk這讓我想到你早期參與的 RETRO。它強調的是效率、讓小模型做更多事；而現在你在 Gemini 3 上，面對的是超大規模資料和極長上下文窗口。你覺得這種範式會不會逐步消解 RAG、搜尋這些機制的必要性？備註：RETRO，DeepMind 在 2021–2022 年提出的一種語言模型研究方向，全稱通常被稱為 Retrieval-Enhanced Transformer。Sebastian BourjouRETRO 的核心並不是讓模型變小，而是“檢索而不是儲存”：讓模型在推理時去取資訊，而不是把一切都壓進參數里。這個理念今天依然成立。過去，預訓練的迭代周期很長，風險和成本都很高；而 RAG 或搜尋更多發生在後訓練階段，迭代更快、效果也很強。從長期來看，我相信真正的答案是把檢索和搜尋以可微的方式納入訓練本身——可能通過預訓練，或未來的其他範式。RL 的規模化或許只是一個開端，架構層面還有很多事要做，但這會是未來幾年逐步展開的過程。後訓練的Scaling Law跟預訓練很類似Matt Turk我理解你們的觀察是：在預訓練階段，規模依然非常關鍵，但今年大家又在後訓練階段放大了 RL、測試時計算等變數。那在預訓練中，我們看到的不只是 loss 放緩，甚至還有加速現象，這是不是更多來自資料和架構的變化？Sebastian Bourjou可以這樣理解：這些因素是疊加起作用的。規模只是其中一個維度，模型架構和資料同樣會顯著提升性能。有時候，架構或資料層面的創新，帶來的收益會超過單純繼續放大規模；但在某些階段，直接擴規模依然是最有效的路徑。這主要針對預訓練而言。至於 RL 和 RL 的規模化，其實我們正在看到很多和早期預訓練階段相似的現象，只是現在可以把當年的經驗直接遷移過來。Gemini3一開始就是多模態資料混合體合成資料明顯增加了Matt Turk說到資料，Gemini 3 的預訓練資料大致是怎樣的組合？你們之前好像發佈過 model card，透露過一部分資訊。Sebastian Bourjou：整體是多模態、從一開始就如此設計的資料混合體，來源非常多樣。一個經常被問到的問題是：我們會不會很快用完資料？一方面是算力是否不足，另一方面是資料是否不足。今年合成資料的使用明顯增加了，你怎麼看它的價值和邊界？Sebastian Bourjou合成資料確實很有意思，但使用時必須非常謹慎，很容易用錯。常見做法是先用一個很強的模型生成合成資料，再用小規模實驗驗證它是否真的有效。一個更難的問題是：能不能用合成資料，訓練出一個比“生成這些資料的模型”本身還要更強的模型？這是我們投入大量精力研究的方向。至於“資料是否用完了”，我個人並不這麼認為。我們研究中發現，更可能發生的是一種範式轉變：過去我們默認處在“資料幾乎無限”的階段，現在正在進入“資料有限”的階段，這會徹底改變研究思路。有點像 LLM 出現之前，大家在 ImageNet 等小資料集上的工作，很多當年的方法又重新變得有價值。範式正在轉變：資料有限的情況下如何更好Matt Turk行業裡還有一個反覆出現的概念：基於“推理軌跡”的訓練，也就是要求模型展示中間思考過程，再用這些過程訓練下一代模型。你怎麼看這個方向？Sebastian Bourjou具體細節我不能展開評論，但你的問題方向確實很對。這和你剛才問的合成資料高度相關。更宏觀地看，一個核心主題正在浮現：模型如何在有限資料條件下學習得更好。這裡的“有限”並不一定是更少，而是資料量是有上限的。從這個角度看，模型架構研究本身，正是在回答你提到的那個問題。Sebastian Bourjou還有一點我想強調：大家經常只談模型架構，但基礎設施、資料和評測同樣關鍵。評測尤其困難，在預訓練階段更是如此。一方面，我們用來做評測的小模型，必須能預測大模型的表現；另一方面，預訓練後的模型還會經歷後訓練，評測指標也要能反映最終使用效果。內部評測體系在這裡非常重要，因為外部基準很快就會被“污染”，一旦訓練資料中洩漏了評測內容，你幾乎無法察覺。真正防止自欺的方式，就是維護嚴格隔離的內部評測集。為什麼對齊不發生在預訓練？Matt Turk那對齊更多是在預訓練階段考慮，還是主要發生在後訓練？Sebastian Bourjou我會說大部分是在後訓練階段，但確實有一些部分和預訓練相關，具體細節我不便展開。不過我們在預訓練階段也會考慮這些問題。Matt Turk一個很直觀的問題：如果核心資料集來自網際網路，而網際網路裡充滿糟糕內容，那對齊的第一步是不是乾脆不把這些東西喂給模型？Sebastian Bourjou這是個很難給出確定答案的問題。你當然不希望模型去做那些糟糕的事，但在更底層的層面，模型至少要“知道”這些東西是什麼，才能學會避開它們。否則當使用者提到某些糟糕內容時，模型甚至無法判斷那是什麼，也就談不上明確拒絕。Deep Think 與模型的關係Matt Turk：我們來聊聊 Deep Think 吧，也就是在 Gemini 3 發佈幾天後推出的那個“思考模型”。它是一個獨立模型，還是同一個模型的不同形態？應該怎麼理解？Sebastian Bourjou：這個我不能講太多。至於你提到的，當模型“思考”十幾秒甚至更久時，背後發生了什麼，其實行業裡已經討論過不少了。本質上，是讓計算不只發生在模型深度上，也發生在序列長度上：模型會生成假設、測試假設，呼叫工具、發起搜尋，然後最後給出一個確定性的回答。圍繞“思維鏈”的這種範式，已經在行業裡逐漸形成共識。程式設計AgentMatt Turk：那從 agent 的角度呢？比如 Google 的 Anti-Gravity，你覺得它有意思的地方在那？Sebastian Bourjou：這正好和我之前提到的日常工作相關。很多時候我們的工作是偏執行層面的，比如盯實驗。但 agent 化真正放大了模型的價值。對預訓練來說，感知和視覺能力變得非常關鍵，因為模型現在要直接和螢幕互動，螢幕理解做不好，agent 基本無從談起。Matt Turk：Anti-Gravity 裡還有個“vibe coding”的說法，幾乎就是“憑感覺寫程式碼”。這種“vibe”是預訓練出來的，還是後訓練？怎麼把“感覺”塞進模型裡？Sebastian Bourjou：這個問題你問五個研究員，大概會得到五種答案。確實存在一種“模型氣場”的說法，歷史上有人認為 GPT-4.5 這種大模型“感覺不一樣”。我不太喜歡用這種表述，但直覺上，預訓練在塑造這種“感覺”上起的作用，可能比後訓練還大。如果專指 vibe coding，我會更傾向於把它看作 RL scaling 和後訓練的結果：你可以收集大量相關資料，系統性地把這種行為教給模型。持續學習的熱門方向長上下文、大中小疊加、降低成本Matt Turk：拉遠一點看。最近一年在很多會議上，大家都在談“持續學習”。從預訓練角度看，你怎麼理解它？如果持續學習真的成立，對重新訓練意味著什麼？Sebastian Bourjou：持續學習，本質上是讓模型隨著新知識不斷更新。比如明天出現一個新的科學突破，昨天訓練好的基礎模型並不知道它。近幾年更多進展發生在後訓練階段，比如通過搜尋工具即時獲取新資訊。RETRO 做的事情也是類似的：把知識外部化，用檢索配合推理。在預訓練側，一個相關方向是長上下文。如果上下文不斷擴展，模型就能在一次互動中吸收越來越多資訊，某種意義上形成“准持續學習”。更激進的設想是改變訓練演算法，讓模型持續地從真實世界的資料流中學習，但那是更大的範式轉變。Matt Turk：那你現在覺得，研究裡那些方向最熱、最有意思？Sebastian Bourjou：依然是大量中小改進的疊加，這在歷史上一直是進步的主要來源。具體來說，長上下文架構、注意力機制，以及從“無限資料”轉向“有限資料”這一範式變化，都會帶來很多新的研究問題。另一條線是使用成本：模型被越來越多的人使用，預訓練階段就必須考慮部署和推理的代價。如何在保證質量的同時，讓模型更便宜、更省資源，這會反過來影響預訓練設計。條件已經成熟：既要做研究，也得理解系統Matt Turk：如果有學生或博士生在聽這期節目，想在幾年後做到你現在的位置，你覺得他們該關注什麼問題？Sebastian Bourjou：一個越來越重要的能力，是既能做研究，又理解系統。我們現在建構的是非常複雜的系統，能從 TPU 到模型研究全鏈路理解整個棧，是一種“超能力”。這樣你能看到不同層之間的空隙，也能推演一個研究想法對系統底層的影響。另外，我個人依然對檢索方向很感興趣。RETRO 當年還不成熟，但條件正在變化。未來幾年，這類方法進入頂級模型並非不可想像。Matt Turk：那為什麼當時不成熟？現在又為什麼可能改變？Sebastian Bourjou：主要還是複雜度和迭代效率的問題。很多能力通過後訓練和搜尋就能更簡單地實現，迭代也更快。但隨著後訓練和 RL scaling 的發展，重心可能再次向預訓練側回擺。專用模型被過度投資了Matt Turk：你覺得現在 AI 領域有沒有被過度投資的方向？Sebastian Bourjou：情況已經好很多了。兩年前還有很多人在做高度專用模型，但這些任務往往很快就會被通用模型覆蓋。現在更多人接受一個判斷：對大多數通用任務，與其做專用模型，不如等下一代通用模型。這也讓“如何使用模型”“如何建構可靠的 harness”“如何容錯和恢復”變得越來越重要。創業者的機會Matt Turk那對創業者呢？基礎模型越來越強，覆蓋面越來越廣，留給初創公司的空間是不是在縮小？Sebastian Bourjou可以回頭看看一年前模型能做什麼，再看看現在能做什麼，然後外推。我認為模型正在快速進步的方向，短期內還會繼續；而進步緩慢的地方，反而可能是更有意思的機會。暫時我沒有具體案例，但這是一個總體判斷。未來一年，基礎模型不會放緩Matt Turk最後一個問題。未來一兩年，從你個人的角度看，最讓你期待的是什麼？Sebastian Bourjou我最喜歡的一點，是每天能和很多非常聰明的人一起工作，不斷學到新東西。這是驅動我前進的核心動力。同時，就像我反覆說的，還有太多可以改進的空間。我暫時看不到這條路的盡頭，也不覺得未來一年會放緩。能親眼看到它能走多遠，本身就非常令人興奮。Matt Turk太好了，這正是一個完美的收尾點。Sebastian，非常感謝你來做客播客。 (51CTO技術堆疊)

“德國法院判定OpenAI訓練資料侵權，形成司法判例標竿。2025年11月11日，德國慕尼黑地方法院裁定OpenAI侵犯GEMA成員作品歌詞版權。這標誌著德國首起“AI訓練階段侵權”司法判決，意味著AI與版權的灰色地帶被法律照亮。AI學習的邊界究竟何在？歐洲會成為AI監管秩序的制定者嗎？中國的AI企業會受到何種影響？對此，本文將以該案件為切入點，梳理美國人工智慧巨頭（OpenAI、Meta、Google、Perplexity、Suno等）在歐洲的一系列糾紛，剖析背後的制度邏輯與地緣經濟動因，並探討這一趨勢對中國人工智慧企業的警示和借鑑意義：當人工智慧的底層邏輯是“學習一切”，而歐洲的規則邏輯是“許可一切”，二者的碰撞勢必引發全球格局的重構。全球首例“訓練侵權”判決為行業敲響警鐘2025年11月，德國慕尼黑地方法院判定OpenAI在訓練與輸出歌詞過程中侵犯音樂版權，成為全球首例AI大模型被判“訓練侵權”的正式案例。這一事件不僅標誌著AI與版權的衝突邁入司法化階段，也預示著歐洲在AI治理、資料主權、版權分配方面展開系統性反攻。法院在判決書中指出，OpenAI的語言模型在訓練過程中存在“記憶行為”。即，將訓練資料完整複製到模型參數中，這導致ChatGPT在輸出中再現了歌詞，從而侵犯了版權。法院強調，當模型訓練不僅從資料集中提取資訊，還在參數中包含訓練資料的完整複製時，這就構成了版權法意義上的“複製”。模型輸出相似歌詞則進一步構成未經授權的“複製與公開傳播”。這一判決，引發了全球關注。值得注意的是，此次判決，明確了AI模型訓練過程中使用受版權保護內容可能構成侵權，即使這些內容在模型中以參數形式存在，該判決給從業者們敲響警鐘，實際上，德國慕尼黑地方法院的判決僅是OpenAI面臨的眾多法律挑戰之一。在過去的3至5年中，隨著ChatGPT的發佈到商業化的快速擴張，OpenAI已陷入多起版權和隱私訴訟的漩渦。從更長遠的時間線來看，以下是資料猿梳理的一些具有代表性的案例：OpenAI被美國作家協會（Authors Guild）集體訴訟。2023年9月20日，OpenAI被美國作家協會（Authors Guild）集體訴訟。美國作家協會聯合17位知名作家，在紐約南區法院提起集體訴訟，原告指控OpenAI從盜版電子書庫批次下載其作品，將這些“專業創作、編輯和出版的書籍”複製到GPT-3.5和GPT-4的模型參數中，使其能夠生成模仿原告風格的內容，直接威脅作家生計。《紐約時報》起訴OpenAI新聞內容侵權。2023年12月，《紐約時報》向紐約南區法院起訴OpenAI和微軟，指控其未經許可使用數百萬篇文章訓練AI模型。《紐約時報》提供了100多個GPT-4輸出內容與時報報導高度相似的例子，證明模型能夠原封不動或模仿風格生成其內容，直接威脅其訂閱和廣告收入。NOYB在奧地利投訴OpenAI違反GDPR。2024年4月29日，歐洲隱私倡導組織NOYB向奧地利資料保護機構正式投訴OpenAI，指控ChatGPT違反歐盟《通用資料保護條例》（GDPR）。原告指出，ChatGPT資料不精準，捏造使用者出生日期等個人資訊。NOYB要求OpenAI糾正某公眾人物的錯誤出生日期。梳理髮現，在上述訴訟案例中，除德國慕尼黑地方法院已作出判決外，截至2025年11月，其餘訴訟仍處於審理階段。2025年就新增10余起！各地針對AI的版權糾紛浪潮此起彼伏除了OpenAI，美國AI巨頭，像Meta、Google、Anthropic等在歐洲同樣面臨著類似的訴訟潮。實際上，近兩年來，各地針對AI的版權糾紛浪潮此起彼伏，僅2025年就新增了十余起相關案件。這些案件大多指控人工智慧開發者在未事先獲得授權的情況下使用受版權保護的作品來訓練大型語言模型。如，Meta在2025年面臨來自法國出版界集體訴訟、Google被處以2.5億歐元天價罰款、Perplexity被BBC與《金融時報》指控抓取新聞內容……具體展開來看：·Meta：面臨來自法國出版界集體訴訟。2025年，Meta公司面臨來自法國出版界集體訴訟。原告指控Meta未經授權通過社交媒體平台非法抓取法語書籍、劇本及音樂作品用於訓練Llama模型。·Google：被處以2.5億歐元天價罰款。2024年，Google因使用新聞訓練被法國罰款2.5億歐元，成為全球首家因AI訓練資料侵權被處以巨額罰款的科技巨頭，開創監管先例。2024年3月，法國競爭管理局(Autorité de la concurrence)對Google處以2.5億歐元（約2.72億美元）罰款。Google未經法國出版商和新聞機構許可，擅自使用其內容訓練Bard基礎模型，違反歐盟智慧財產權規則。實際上，這是Google在同一問題上的第二次重大處罰，2021年已因類似違規被罰款5億歐元。法國監管機構指出，Google不僅侵犯版權，還破壞了與出版商的公平談判機制。·Perplexity：被BBC與《金融時報》指控抓取新聞內容。2025年6月，BBC向Perplexity發出法律警告，要求立即停止抓取BBC內容。Perplexity被指在未授權情況下抓取全球媒體內容建構資料庫，並在輸出中使用這些內容。原告方提供了大量直接複製或高度相似的內容對比，證明Perplexity“系統性剽竊”，BBC在警告信中要求Perplexity立即停止抓取所有內容，刪除所有BBC資料副本，並提供賠償方案。·Suno（美國AI音樂公司）：遭丹麥KODA起訴這也是丹麥首次對AI音樂服務提起版權訴訟。2025年11月，丹麥音樂版權組織 Koda向哥本哈根城市法院提起訴訟，指控美國AI音樂公司Suno侵權，核心指控為，Suno未經許可使用Koda會員（約5.2萬名作曲家、詞曲作者和音樂出版商）的作品訓練AI模型，Koda稱這是“音樂史上最大規模的盜竊”，並指責Suno隱瞞訓練資料來源和範圍。這也是丹麥首次對AI音樂服務提起版權訴訟，Koda 要求法院判決Suno停止侵權、賠償損失，並建立透明的授權機制。·Clearview AI：生物識別資料的全球合規圍剿Clearview AI是美國一家專注於臉部辨識技術的公司，主要業務是開發麵部識別軟體，為執法機構和政府部門提供服務，其演算法可將人臉與從網際網路收集的數十億圖像資料庫匹配。2023年4月，法國資料保護機構對其處以520萬歐元罰款；2024年5月，荷蘭監管機構再罰3050萬歐元，疊加其他地區處罰，其全球罰款總額已遠超1500萬歐元。目前該公司在歐洲幾乎被全面禁止提供服務。此外，還有一些AI巨頭被訴訟的案例，如美國公司Midjourney於2025年6月、9月先後遭迪士尼、環球影業及華納兄弟起訴、美國Anthropic公司同年9月以15億美元和解因使用超50萬本版權書籍（含盜版）訓練Claude引發的集體訴訟……AI版權糾紛核心爭議背後：美歐在法律制度、版權理念具有差異綜合上述糾紛案例，我們可以看到，以上糾紛本質上是AI技術創新與傳統智慧財產權保護體系的衝突，背後卻折射出不同法域在法律制度、版權理念上的深層差異。實際上，歐洲對版權的嚴格保護，自有其一套成熟的版權集體管理體系（CMOs）。這一核心機制運轉百年，覆蓋音樂、文學、影視等全內容領域。權利人與CMOs建立委託代理關係後，CMOs可直接以自身名義談判授權、收取費用並行起維權訴訟，形成了高度組織化的保護網路。相比之下，美國AI企業長期依賴“合理使用”原則豁免責任，缺乏歐洲式的透明化合規機制，這本質是美歐版權保護理念的根本區別。上述案例也能看出，美國 AI公司習慣的"先使用後許可"或"合理使用抗辯"在歐洲似乎行不通了。歐洲秉持嚴格保護立場，歐盟《版權指令》要求"全球合規"，無論訓練行為發生在何處，只要產品進入歐盟市場就必須遵守。除此之外，還有理念的分野。通過多個典型案例也可印證。如，英國AI公司Stability AI因未經授權使用數百萬版權圖像訓練Stable Diffusion遭起訴，2025年11月英國高等法院以“模型不儲存原作”判其不侵權，而美國法院因更關注訓練資料合法性仍未下判，進一步凸顯不同法域對AI訓練版權邊界的認定差異。值得注意的是，歐盟《人工智慧法案》（AI Act）已於2024年8月生效，並將於2026年全面實施，這意味著AI企業的合規要求將進一步收緊。對於全球化營運的企業而言，提前適配各個區域規則、搭建合規體系已成為必然要求。1.“先使用後驗證”與歐洲版權體系的“事前授權事後問責”形成對立AI技術的核心學習邏輯是“無限抓取、參數化模仿”，這種模式依賴對海量資料的無差別採集與內化。以上述提到的公司Meta舉例，Meta的Llama模型就被曝使用82TB的盜版書籍資料，覆蓋大量法語書籍、劇本及音樂作品，而OpenAI的ChatGPT訓練過程中也納入了未經授權的歌曲歌詞等內容。這種“先使用後驗證”的技術路徑，與歐洲版權體系“事前授權、事後問責”的核心邏輯形成天然對立。歐洲版權制度的根基是“授權方控制使用”，要求任何商業性質的內容使用必須提前獲得權利人許可，而AI的“參數化模仿”並非簡單提取資訊，而是通過模型參數“記憶”內容核心表達，當技術發展到能“近似復現”原作品時，技術邊界與法律邊界完全重疊。德國慕尼黑地方法院對OpenAI的判決正是這一沖突的集中體現：法院明確認定，模型將歌詞“記憶”並在輸出中再現的行為，構成版權法意義上的“複製”，而Suno AI能生成與版權音樂高度相似的旋律，也直接觸發了丹麥KODA 的侵權訴訟，讓技術行為無法再規避法律問責。2、歐洲在內容與法規層擁有主導權，是否會成為AI版權規則的“制定者”？在全球AI產業格局中，歐洲在基礎層明顯處於弱勢。算力核心硬體領域依賴輝達，本土AI巨頭市場影響力遠不及美國的OpenAI、Meta、Google，即便法國培育出Mistral AI等獨角獸，2023年法國AI市場規模也僅佔歐洲的17.3%，與中美差距顯著。但歐洲在內容與法規層擁有絕對主導權。內容端沉澱了全球最豐富的版權文化資源，法規端則建構了全球最嚴格的監管體系。為扭轉被動局面，歐洲通過訴訟、立法、罰款等機制重塑價值分配秩序。比如，在立法上，2024年生效、2026年全面實施的歐盟《人工智慧法案》（AI Act），要求通用目的AI模型在訓練時必須遵守歐盟版權法，並披露訓練資料來源摘要；若在訓練中違規使用受版權保護的內容，不僅違反版權法本身，也可能觸發AI Act下最高可達全球年營業額7%的罰款。司法上，德國法院判定OpenAI訓練侵權、法國法院受理Meta版權訴訟，形成司法判例標竿；罰款上，法國競爭管理局對Google處以2.5億歐元天價罰款，懲罰其未經許可使用新聞內容訓練Bard模型。這一系列動作讓歐洲成功將“被訓練者”的被動地位，轉化為AI版權規則的“制定者”。3.集體管理組織的產業性反攻GEMA、KODA、SNE/SGDL等歐洲版權集體管理組織（CMOs），已成為AI時代的“新版權談判代表團”。這些組織擁有成熟的運作機制和強大的資源整合能力：德國GEMA代表約6萬多名作曲家、作詞家和音樂出版商，2025年預計向全球權利人分配11.33億歐元版權費；法國SNE（國家出版聯盟）聯合SNAC（國家作者與作曲家聯盟）、SGDL（法國作家協會），能快速動員全行業力量發起集體訴訟；丹麥KODA則代表5.2萬名音樂創作者，覆蓋歐洲音樂版權的核心領域。面對AI廠商無償使用版權內容的現狀，這些組織發起系統性反攻。GEMA率先起訴OpenAI並勝訴，為全球AI訓練侵權訴訟樹立標竿；KODA針對Suno AI發起丹麥首例AI音樂版權訴訟，指控其“大規模盜用音樂作品”；SNE聯合多家機構起訴Meta，要求其刪除非法訓練資料集並賠償損失。它們的核心目標明確：通過集體訴訟形成壓力，迫使AI廠商放棄“免費抓取”模式，進入標準化的付費授權體系，Anthropic支付15億美元和解作者集體訴訟的案例，已證明這種產業性反攻的實際效果。4.地緣與輿論的共振在歐洲輿論場中，美國AI公司的“無限抓取”行為被普遍視為“文化掠奪”，這種認知背後是文化主權與科技主權的雙重焦慮。IE大學對歐洲10國3000餘人的調查顯示，歐洲民眾對AI的信任存在明顯邊界，尤其警惕外來科技公司對本土文化的侵蝕。法國出版商聯盟在起訴Meta時明確指責其行為是“版權掠奪”，強調要保護法語文化遺產免受“AI無償侵佔”；德國GEMA的訴訟也被賦予“守護德國音樂創作生態”的意義，反映出歐洲對本土文化內容被美國AI公司無償使用的強烈擔憂。在科技主權層面，歐洲深知自身在AI基礎層的短板，轉而通過版權監管建構“非技術壁壘，比如歐盟《人工智慧法案》的出台、多國對美國AI公司的罰款與訴訟，本質上是通過規則制定權避險美國的技術優勢。這些舉動，試圖讓歐洲民眾、監管機構與版權組織形成共識，推動針對美國AI公司的侵權糾紛集中爆發，而法國總統馬克宏提出的AI“第三極”戰略，更讓這種共振帶上了明確的地緣競爭色彩。從“野蠻生長”轉向“合規競逐”合規調整已箭在弦上基於歐洲AI版權訴訟浪潮與監管框架的成型，可以預見的是，全球AI產業將從“野蠻生長”轉向“合規競逐”。1.從判決到機制：AI版權許可制度成型，各家AI廠商不得不付費入場？如今，美國AI巨頭已被迫開啟“付費入場”模式。如上述提及的多個案例，Anthropic支付15億美元和解作者集體訴訟，成為首個大規範本權補償案例；Meta正與法國SNE聯盟談判法語書籍授權，以規避Llama模型的侵權風險；Google在2.5億歐元罰款後，已與歐洲新聞機構達成年度授權協議，金額超3億歐元。未來幾年內，歐洲將完成判決案、行業標準再到結算機制的落地，拒絕接入該機制的AI廠商將被限制在歐盟4.48億人口市場的商業變現，OpenAI、Perplexity 等依賴歐洲使用者的企業，將不得不每年支付數相關的版權費用。未來歐洲將建立AI訓練資料授權體系，形成類似Spotify的“AI版權結算機制”，各家AI廠商不得不付費入場。2.歐盟的AI Act與GDPR疊加，將形成嚴格的AI監管閉環AI模型須提供資料來源說明、權利人申訴通道、可解釋性文件和透明報告。合規將成為競爭壁壘。歐盟AI Act將於2026年全面實施，這一政策的實施與GDPR的疊加，將形成全球最嚴格的AI監管閉環，例如，未來將要求生成式AI必鬚髮布訓練資料詳細摘要，公開資料來源合法性證明；建立權利人專屬申訴通道，24小時內響應侵權投訴；提供模型決策邏輯的可解釋性文件，接受監管機構的定期合規審計。未來，合規能力將成為企業能否立足歐洲市場的“生死線”，並形成顯著競爭壁壘。從另一方面來說，單模型的合規審計和資料溯源投入，可能達到數十萬歐元甚至更高的等級，對中小企業而言構成不小的成本壓力，這將加速行業“馬太效應”。預計2027年歐洲AI市場前5大廠商將佔據大部分市場份額，大量不合規的中小玩家被淘汰。3.全球溢出效應：亞洲與中國必將被波及中國企業若在模型訓練中使用歌詞、書籍、影視、新聞等受保護內容，也將面臨“歐式合規標準”壓力。歐盟作為全球第二大AI市場，其監管規則將通過“市場准入倒逼”形成全球溢出效應，亞洲國家已率先做出反應：日本多家出版商聯合成立CODA聯盟，要求OpenAI停止使用其作品訓練Sora2，明確反對“默認授權”模式，其訴求與歐洲版權保護邏輯高度一致；韓國正修訂《版權法》，擬將AI訓練資料使用納入“事前授權”框架。這也意味著，像文心一言、通義千問、火山方舟等希望出海的中國模型，在進入歐洲市場時也不得不排查訓練資料中涉及歐洲版權內容的部分。另一方面，國內監管正加速跟進，國務院《關於深入實施“人工智慧+”行動的意見》明確要求完善AI版權制度，北京、江蘇已出現AI生成內容侵權判例，法院認定“人機協作作品受版權保護”，倒逼企業規範訓練資料來源。4.商業化路徑再塑：合規能力將成為AI公司的競爭力之一未來，合規能力將成為AI公司的競爭力之一。AI行業的競爭焦點將從“參數規模”轉向“合規能力”，“可審計訓練”“反覆現檢測”“版權清潔室”三大技術成為破局關鍵，直接決定企業的跨國合作與商業變現能力。頭部企業已率先佈局。Anthropic的Claude3推出“版權過濾”功能，可自動識別並排除訓練資料中的未授權內容，其“版權清潔室”技術吸引美聯社、大英百科全書等內容方合作；Stability AI在英國勝訴後，升級了“反覆現檢測系統”，確保生成圖像不與版權作品高度相似，成為首個獲得歐洲藝術協會授權的AI圖像廠商；Google Gemini則開放“訓練審計介面”，允許監管機構追溯資料使用全流程，合規優勢使其拿下歐洲多個政府項目訂單。商業化模式也隨之重構：一是“合規版模型”溢價銷售，如Meta針對歐洲市場推出Llama3合規版，訂閱費較基礎版高30%，仍吸引大量企業客戶；二是“版權分成”合作，Suno AI與KODA談判達成協議，將AI音樂生成收入的4%分給版權方，成為首個合法落地歐洲的AI音樂平台；三是合規技術輸出，如青鸞印的區塊鏈存證系統已被多家AI公司採用，年服務收入突破億元，催生“AI合規服務商”新賽道。對創作者而言，這一趨勢似乎會帶來新的收入增長點。通過CMOs接入AI版權結算機制，無需直接談判即可獲得訓練授權收入。“AI內容經紀人”等新職業出現，個體創作者可通過批次存證、打包授權實現規模化收益等等。如此看來，合規是挑戰，更是轉型契機。對於未來的AI企業而言，合規不是負擔，而是全球化競爭的入場券和商業模式升級的催化劑。誰能率先建立完善的版權合規體系，誰就能在這場全球AI治理變革中佔據主動，實現從"技術跟隨者" 到"規則參與者"的角色轉變。 (資料猿)