大模型六小老虎，要撞上版權牆了

2025/01/13

•

「幾乎沒有一家大模型公司的AI影片產生訓練，會找影片網站授權。」 2025 年伊始，在影片產生領域立志「追平Sora」的大模型公司，撞上了版權牆。

AI創業家陳臨告訴字母榜（ID：wujicaijing），其中也包括被稱為「AI六小虎」的6家中國大模型獨角獸。而缺乏授權的模型訓練，勢必將成為大模型公司們的潛在風險。

如今，在熱度不減的AI影片產生賽道，「視訊平台訴大模型侵權」第一案已經出現。

日前，有報導稱愛奇藝起訴MiniMax旗下海螺AI侵害著作權，據悉事由或為MiniMax未經授權使用了愛奇藝享有版權的素材進行模型訓練，目前正在走司法程序。對此，愛奇藝回覆字母榜，確認案件正在審理中。 MiniMax則尚無正式回應。

就在去年9月MiniMax剛推出視訊大模型時，其創辦人髕俊傑對字母榜表示，MiniMax用於訓練的數據，除了語料公司的高品質數據，還有部分採購來的平台化數據。

圖源：字母榜拍攝

大公司也屢屢因版權陷入糾紛。去年8月，OpenAI被超過100位YouTube主播集體訴訟，指控其擅自轉錄數百萬個YouTube 影片來訓練大模型。輝達、蘋果、Anthropic等巨人也涉及其中。 OpenAI的前任CEO Mira，曾在採訪中被記者提問是否拿YouTube的影片訓練Sora，Mira選擇了拒絕回答。

雖然OpenAI已經和Politico、《大西洋月刊》《時代》《金融時報》等簽訂了付費協議用於訓練，但這類授權都屬於文字領域，陳臨告訴字母榜，在Sora視頻的訓練協議中，“ OpenAI還沒有簽過相應的協議。

資料、演算法和算力是AI大模型的三大支柱，其中資料更是大模型進行訓練的根本。可以說，生成式AI的繁榮是建立在資料規模之上的。訓練資料越多，模型就越強大。數據賦予模型用於學習和思考的大量知識，數據也成了模型廠商技術壁壘的一部分。

不像BAT們，在圖文時代、行動網路時代早已累積鉅量的私域資料庫，而這些資料早已被不同平台瓜分。晚來的大模型六小龍，被重重壁壘所環繞。

一旦愛奇藝的訴訟成功，或許預告著更大規模的大模型版權糾紛時代的來臨。

「愛奇藝成功了，優酷、騰訊影片也可能會起訴，」陳臨表示，這無疑是兜頭澆了狂奔中的大模型公司們一盆冷水。對於獨立進行大模型訓練的公司來說，“視頻要版權費，圖片也要版權費，文字可能也要版權費，致使AI的訓練成本會比現在高出許多。”

如今，孰是孰非暫無定論，只是可以肯定的是，大模型的狂飆路上，正豎起一面新的版權牆。

0 1.中國國內AI影片產生第一個侵權案，已經出現了。

近日，根據外媒報導，MiniMax被指控未經授權使用愛奇藝享有版權的素材進行模型訓練，愛奇藝已向上海市徐匯區人民法院提起訴訟，要求MiniMax立即停止侵權行為，並索賠約10萬元人民幣。

去年8月底，MiniMax推出視訊大模型，使用者登入海螺AI就能體驗MiniMax的視訊生成模型。根據AI產品榜數據，去年9月，海螺AI搜尋熱度暴漲，海螺AI網頁版9月瀏覽量增幅達860%，一舉登頂2024年9月全球及中國國內AI應用增速榜首。

不過，加入「追平Sora」大軍的MiniMax，也如同OpenAI被《紐約時報》起訴一樣，撞上了版權牆。

根據中國法律規定，生成式人工智慧服務提供者必須採用「合法來源」的資料和基礎模型，以確保不侵犯他人的智慧財產權。

《網路法律評論》主編張穎告訴字母榜，在這場民事訴訟中，愛奇藝起訴，需要證明MiniMax存在未經其允許的情況下使用愛奇藝資料訓練，並且在生成內容中包含了其版權內容。此外，愛奇藝也需要證明被告在主觀上有過錯‌，即故意或未盡到注意義務。

也就是說，海螺AI的「侵權」有兩種可能。

一種可能是MiniMax海螺AI影片產生的訓練中，未經授權使用了愛奇藝享有版權的素材內容。

另一種可能，則是使用者使用海螺AI時，未經愛奇藝授權，上傳了版權素材做AI「魔改」。

圖源：字母榜截圖

《甄嬛傳》變槍戰片、《紅樓夢》變武打劇，用AI視頻工具就能讓爾康喝啤酒、甄嬛啃漢堡、林黛玉抄起加特林。陳臨表示，以上這些AI“魔改”經典影視劇的小視頻，都在社交平台上得到數百萬的播放量。

這些「沒有邏輯，只有搞笑」的AI「魔改」視頻，大多沒有授權，「部分是大模型公司推廣產品時，委託第三方投流公司的作品，更多的則是用戶的無厘頭腦洞。「去年12月，廣電網路視聽司也發布了《管理提示》，提出要排查清理AI「魔改」影視劇的短片。這意味著生成式AI將面臨更細緻的內容審核。

而作為被起訴方，如果MiniMax想證明自己沒有侵權，大概需要證明自身資料來源、產生內容與愛奇藝無關，或是沒有故意侵權。

在海螺AI的使用者協議中，也要求使用者保證不利用平台製作的內容或用於相關用途，包括「未經授權自行剪切、改編電影、電視劇、網路影視劇等各類視聽節目及片段」。

不過，值得注意的是，「10萬元賠償金對愛奇藝來說太少了。」張穎表示，儘管缺乏愛奇藝的起訴書作為依據，但從金額來看，推測MiniMax的侵權情況可能不嚴重，雙方和解的可能性很高。走向和解，對於MiniMax來說，不管是照價賠償10萬元，還是交上一筆不菲的版權費，都似乎免不了為版權牆「破財」了。

0 2.實際上，“中國國內AI從業者對於訓練資料沒有很高的版權意識，通常認為版權會阻礙AI訓練。”

離開某大廠開始AI應用創業後，陳臨發現，中國國內主動要求版權授權的AI訓練公司似乎不多。原因不僅在於本身便高昂的AI訓練成本，也是由於一旦視頻、圖片，甚至文字都需要版權，對於AI創企來說，“模型就沒法訓練了。”

不少AI創企做影片產生訓練的第一步，正是「從網路扒影片訓練」。

為了規避版權風險，企業會透過關鍵字過濾，盡量避免使用者輸入例如米老鼠這種版權字眼，來減少產生侵權內容。

圖源：陳臨提供

新壹科技CEO雷濤告訴字母榜，作為To B的AIGC視訊生成公司，新壹科技用來訓練AI視頻大模型的數據，來自此前在秒拍、小咖秀等應用的數據積累，還有定向合作資料庫，以及依托原演算法訓練的「從無到有」的素材。但只有AI影片生成的夠真實，才能起到訓練效果。

而對於既沒有存夠數據，又付不起定向合作版權費的AI創企而言，想要坐上牌桌，撞上版權牆，或早或晚，都是必然的結果。

不過，這種爭議並不是新鮮事。

在圖文時代，圖片版權的糾紛一度讓創作者「不敢配圖」。有自媒體大V被告知，歷史文章中有數十張來自搜尋引擎的圖片涉嫌侵權，在刪除全部原創文章後，還支付了不菲的侵權費用於和解。有攝影師使用了自己拍攝的173張照片進行配圖，卻被視覺中國提起訴訟，指其侵權。

如今，輪到AI站上了被告席。

在中國國內，去年6月，4名畫師起訴小紅書AI大模型「Trik AI」侵權，這是中國國內第一起AI模型訓練資料集體侵權的案件，如今訴訟正在進行。

在國外，Meta、OpenAI都曾陷入版權糾紛。

去年4月底，《紐約每日新聞》《芝加哥論壇報》等美國八家知名報紙聯合起訴OpenAI和微軟，指控它們未經允許使用數百萬篇版權新聞文章訓練其AI聊天機器人。為此，OpenAI 與Politico、《大西洋月刊》《時代》《金融時報》等新聞出版商達成付費協議，使用並引用版權新聞文章。

早在2023年5月，OpenAI執行長奧特曼便公開承認，AI公司在不久的將來會耗盡網路上所有的資料。 2024年6月，研究機構Epoch AI也發布研究預測，可用於AI語言模型公開訓練的數據，將在2026年到2032年間，被科技公司耗盡。

對大模型創企來說，高品質的數據永遠稀缺，大模型公司間的算力戰、應用戰，也將拓展到資料戰。

只是OpenAI的訴訟或許傳達出了明確的訊號，高品質的訓練資料不是免費的。對於大模型創企而言，不像Meta、BAT等公司，早已累積起近20年的社群媒體數據，它們或許只能「花錢開路」。

0 3.不過，想要解決版權這個絆腳石，大模型公司們需要回答一個問題，錢從那裡來？

對於尚未獲利的大模型創企而言，投資人的錢袋子越來越緊了。

根據字母榜統計，大模型六小虎（包括零一萬物、MiniMax、百川智能、智譜AI、階躍星辰、月之暗面）中，2024年有五家拿到億元級融資。目前，智譜、月之暗面、百川智能、階躍星辰的估值均已超200億元。

但根據《智能湧現》報導，隨著估值跨上200億元台階，中國國內大模型公司最新的單輪次融資規模將卡在50億元左右。即估值越高，融資越難。根據華興資本數據，2024年前三季中國國內全市場投融資總額為2,603億元，不如近三年同期的40%。

以月之暗面為例，2024年2月A+輪完成超10億美元融資，投後估值一路漲至25億美元。隨後的8月，首輪參投的小紅書、美團龍珠、紅杉中國已不見身影，月之暗面B輪的融資額為超3億美元。風波中的MiniMax，則在去年3月拿到6億美元B輪融資後，暫未等來新的融資消息。

對於大模型創企業而言，「等錢開乾」的迫切性無異於等米下鍋。

等來的數十億元融資，大模型創企不僅要分給持續堆參數的模型訓練，還要分給需要上億元投流燒錢行銷的AI應用，能留給大模型購買版權的錢，並不富裕。

而大模型創企的靈魂拷問遠不止版權糾紛這一點，高昂的研發投入和頗為有限的商業變現，才是懸在「六小虎」頭頂的達摩克利斯之劍。

馬斯克曾估算，GPT-5的訓練成本是3萬-5萬張H100，光是晶片成本就超過7億美元（約50億元）。目前六小虎的收入均未透露，僅根據外媒爆料，MiniMax預計年收入7,000萬美元。目前看來，即使是已經在海外靠Talkie賺到錢的MiniMax，也難以短期內實現營收打正。

大模型水溫轉涼，最先感知到的或許是撲騰其中的從業人員。

“有一家大模型公司裁員後人數已經降到500人，另一家直接放棄了預訓練和C端市場，剩下的幾家幾乎進入靜默狀態，不再開放HC（招聘名額）了。”

陳臨告訴字母榜，2024年底幾乎已經拿不到70w+的AI offer了。 2023年只要有AI相關經驗，就能有面試機會，現在過去一年，不只要求有落地經驗，漲薪幅度也打了折扣。目前除了北京之外，其他城市的AI職位招募也是少的可憐。

可以肯定的是，2025年想要繼續留在牌桌上的大模型創企們，在模型訓練過程中為版權付費只是第一步，降本不是長久之計，想法子賺錢增效，才是關鍵。（文中陳臨為化名）

中國AIGC產業應用高峰會回顧

2024 年1 月5 日，【智求共贏・中國AIGC 產業應用高峰會暨無界AI 生態合作夥伴大會】在杭州未來科技城會議中心舉行。

大會匯集業界資深專家及領導企業，共同聚焦AIGC領域，圍繞當下熱門議題進行深度延展，探討產業激烈競爭下的營運新想法、發展新模式！點擊文章，回顧精彩內容~(AIGC新智界)