大模型六小老虎,要撞上版權牆了


圖片來源:由無界AI生成

「幾乎沒有一家大模型公司的AI影片產生訓練,會找影片網站授權。」 ​​2025 年伊始,在影片產生領域立志「追平Sora」的大模型公司,撞上了版權牆。

AI創業家陳臨告訴字母榜(ID:wujicaijing),其中也包括被稱為「AI六小虎」的6家中國大模型獨角獸。而缺乏授權的模型訓練,勢必將成為大模型公司們的潛在風險。

如今,在熱度不減的AI影片產生賽道,「視訊平台訴大模型侵權」第一案已經出現。

日前,有報導稱愛奇藝起訴MiniMax旗下海螺AI侵害著作權,據悉事由或為MiniMax未經授權使用了愛奇藝享有版權的素材進行模型訓練,目前正在走司法程序。對此,愛奇藝回覆字母榜,確認案件正在審理中。 MiniMax則尚無正式回應。

就在去年9月MiniMax剛推出視訊大模型時,其創辦人髕俊傑對字母榜表示,MiniMax用於訓練的數據,除了語料公司的高品質數據,還有部分採購來的平台化數據。

圖註:MiniMAX創辦人閔俊文介紹海螺AI

圖源:字母榜拍攝


大公司也屢屢因版權陷入糾紛。去年8月,OpenAI被超過100位YouTube主播集體訴訟,指控其擅自轉錄數百萬個YouTube 影片來訓練大模型。輝達、蘋果、Anthropic等巨人也涉及其中。 OpenAI的前任CEO Mira,曾在採訪中被記者提問是否拿YouTube的影片訓練Sora,Mira選擇了拒絕回答。

雖然OpenAI已經和Politico、《大西洋月刊》《時代》《金融時報》等簽訂了付費協議用於訓練,但這類授權都屬於文字領域,陳臨告訴字母榜,在Sora視頻的訓練協議中,“ OpenAI還沒有簽過相應的協議。

資料、演算法和算力是AI大模型的三大支柱,其中資料更是大模型進行訓練的根本。可以說,生成式AI的繁榮是建立在資料規模之上的。訓練資料越多,模型就越強大。數據賦予模型用於學習和思考的大量知識,數據也成了模型廠商技術壁壘的一部分。

不像BAT們,在圖文時代、行動網路時代早已累積鉅量的私域資料庫,而這些資料早已被不同平台瓜分。晚來的大模型六小龍,被重重壁壘所環繞。

一旦愛奇藝的訴訟成功,或許預告著更大規模的大模型版權糾紛時代的來臨。

「愛奇藝成功了,優酷、騰訊影片也可能會起訴,」陳臨表示,這無疑是兜頭澆了狂奔中的大模型公司們一盆冷水。對於獨立進行大模型訓練的公司來說,“視頻要版權費,圖片也要版權費,文字可能也要版權費,致使AI的訓練成本會比現在高出許多。”

如今,孰是孰非暫無定論,只是可以肯定的是,大模型的狂飆路上,正豎起一面新的版權牆。


0 1.中國國內AI影片產生第一個侵權案,已經出現了。

近日,根據外媒報導,MiniMax被指控未經授權使用愛奇藝享有版權的素材進行模型訓練,愛奇藝已向上海市徐匯區人民法院提起訴訟,要求MiniMax立即停止侵權行為,並索賠約10萬元人民幣。

去年8月底,MiniMax推出視訊大模型,使用者登入海螺AI就能體驗MiniMax的視訊生成模型。根據AI產品榜數據,去年9月,海螺AI搜尋熱度暴漲,海螺AI網頁版9月瀏覽量增幅達860%,一舉登頂2024年9月全球及中國國內AI應用增速榜首。

不過,加入「追平Sora」大軍的MiniMax,也如同OpenAI被《紐約時報》起訴一樣,撞上了版權牆。

根據中國法律規定,生成式人工智慧服務提供者必須採用「合法來源」的資料和基礎模型,以確保不侵犯他人的智慧財產權。

《網路法律評論》主編張穎告訴字母榜,在這場民事訴訟中,愛奇藝起訴,需要證明MiniMax存在未經其允許的情況下使用愛奇藝資料訓練,並且在生成內容中包含了其版權內容。此外,愛奇藝也需要證明被告在主觀上有過錯‌,即故意或未盡到注意義務。

也就是說,海螺AI的「侵權」有兩種可能

一種可能是MiniMax海螺AI影片產生的訓練中,未經授權使用了愛奇藝享有版權的素材內容。

另一種可能,則是使用者使用海螺AI時,未經愛奇藝授權,上傳了版權素材做AI「魔改」。

圖註:AI魔改視頻,下方都備註內容疑似用AI技術合成

圖源:字母榜截圖


《甄嬛傳》變槍戰片、《紅樓夢》變武打劇,用AI視頻工具就能讓爾康喝啤酒、甄嬛啃漢堡、林黛玉抄起加特林。陳臨表示,以上這些AI“魔改”經典影視劇的小視頻,都在社交平台上得到數百萬的播放量。

這些「沒有邏輯,只有搞笑」的AI「魔改」視頻,大多沒有授權,「部分是大模型公司推廣產品時,委託第三方投流公司的作品,更多的則是用戶的無厘頭腦洞。 「去年12月,廣電網路視聽司也發布了《管理提示》,提出要排查清理AI「魔改」影視劇的短片。這意味著生成式AI將面臨更細緻的內容審核。

而作為被起訴方,如果MiniMax想證明自己沒有侵權,大概需要證明自身資料來源、產生內容與愛奇藝無關,或是沒有故意侵權。

在海螺AI的使用者協議中,也要求使用者保證不利用平台製作的內容或用於相關用途,包括「未經授權自行剪切、改編電影、電視劇、網路影視劇等各類視聽節目及片段」。

不過,值得注意的是,「10萬元賠償金對愛奇藝來說太少了。」張穎表示,儘管缺乏愛奇藝的起訴書作為依據,但從金額來看,推測MiniMax的侵權情況可能不嚴重,雙方和解的可能性很高。 走向和解,對於MiniMax來說,不管是照價賠償10萬元,還是交上一筆不菲的版權費,都似乎免不了為版權牆「破財」了。


0 2.實際上,“中國國內AI從業者對於訓練資料沒有很高的版權意識,通常認為版權會阻礙AI訓練。”

離開某大廠開始AI應用創業後,陳臨發現,中國國內主動要求版權授權的AI訓練公司似乎不多。原因不僅在於本身便高昂的AI訓練成本,也是由於一旦視頻、圖片,甚至文字都需要版權,對於AI創企來說,“模型就沒法訓練了。”


不少AI創企做影片產生訓練的第一步,正是「從網路扒影片訓練」。

為了規避版權風險,企業會透過關鍵字過濾,盡量避免使用者輸入例如米老鼠這種版權字眼,來減少產生侵權內容。

圖註:以即夢AI為例,AI影片產生自動過濾關鍵字

圖源:陳臨提供


新壹科技CEO雷濤告訴字母榜,作為To B的AIGC視訊生成公司,新壹科技用來訓練AI視頻大模型的數據,來自此前在秒拍、小咖秀等應用的數據積累,還有定向合作資料庫,以及依托原演算法訓練的「從無到有」的素材。但只有AI影片生成的夠真實,才能起到訓練效果。

而對於既沒有存夠數據,又付不起定向合作版權費的AI創企而言,想要坐上牌桌,撞上版權牆,或早或晚,都是必然的結果。

不過,這種爭議並不是新鮮事。

在圖文時代,圖片版權的糾紛一度讓創作者「不敢配圖」。有自媒體大V被告知,歷史文章中有數十張來自搜尋引擎的圖片涉嫌侵權,在刪除全部原創文章後,還支付了不菲的侵權費用於和解。有攝影師使用了自己拍攝的173張照片進行配圖,卻被視覺中國提起訴訟,指其侵權。

如今,輪到AI站上了被告席。

在中國國內,去年6月,4名畫師起訴小紅書AI大模型「Trik AI」侵權,這是中國國內第一起AI模型訓練資料集體侵權的案件,如今訴訟正在進行。


在國外,Meta、OpenAI都曾陷入版權糾紛。

去年4月底,《紐約每日新聞》《芝加哥論壇報》等美國八家知名報紙聯合起訴OpenAI和微軟,指控它們未經允許使用數百萬篇版權新聞文章訓練其AI聊天機器人。為此,OpenAI 與Politico、《大西洋月刊》《時代》《金融時報》等新聞出版商達成付費協議,使用並引用版權新聞文章。

早在2023年5月,OpenAI執行長奧特曼便公開承認,AI公司在不久的將來會耗盡網路上所有的資料。 2024年6月,研究機構Epoch AI也發布研究預測,可用於AI語言模型公開訓練的數據,將在2026年到2032年間,被科技公司耗盡。

對大模型創企來說,高品質的數據永遠稀缺,大模型公司間的算力戰、應用戰,也將拓展到資料戰。

只是OpenAI的訴訟或許傳達出了明確的訊號,高品質的訓練資料不是免費的。對於大模型創企而言,不像Meta、BAT等公司,早已累積起近20年的社群媒體數據,它們或許只能「花錢開路」。


0 3.不過,想要解決版權這個絆腳石,大模型公司們需要回答一個問題,錢從那裡來?

對於尚未獲利的大模型創企而言,投資人的錢袋子越來越緊了。

根據字母榜統計,大模型六小虎(包括零一萬物、MiniMax、百川智能、智譜AI、階躍星辰、月之暗面)中,2024年有五家拿到億元級融資。目前,智譜、月之暗面、百川智能、階躍星辰的估值均已超200億元。

但根據《智能湧現》報導,隨著估值跨上200億元台階,中國國內大模型公司最新的單輪次融資規模將卡在50億元左右。即估值越高,融資越難。根據華興資本數據,2024年前三季中國國內全市場投融資總額為2,603億元,不如近三年同期的40%。

以月之暗面為例,2024年2月A+輪完成超10億美元融資,投後估值一路漲至25億美元。隨後的8月,首輪參投的小紅書、美團龍珠、紅杉中國已不見身影,月之暗面B輪的融資額為超3億美元。風波中的MiniMax,則在去年3月拿到6億美元B輪融資後,暫未等來新的融資消息。

對於大模型創企業而言,「等錢開乾」的迫切性無異於等米下鍋。

等來的數十億元融資,大模型創企不僅要分給持續堆參數的模型訓練,還要分給需要上億元投流燒錢行銷的AI應用,能留給大模型購買版權的錢,並不富裕。


而大模型創企的靈魂拷問遠不止版權糾紛這一點,高昂的研發投入和頗為有限的商業變現,才是懸在「六小虎」頭頂的達摩克利斯之劍。

馬斯克曾估算,GPT-5的訓練成本是3萬-5萬張H100,光是晶片成本就超過7億美元(約50億元)。目前六小虎的收入均未透露,僅根據外媒爆料,MiniMax預計年收入7,000萬美元。目前看來,即使是已經在海外靠Talkie賺到錢的MiniMax,也難以短期內實現營收打正。

大模型水溫轉涼,最先感知到的或許是撲騰其中的從業人員。

“有一家大模型公司裁員後人數已經降到500人,另一家直接放棄了預訓練和C端市場,剩下的幾家幾乎進入靜默狀態,不再開放HC(招聘名額)了。”

陳臨告訴字母榜,2024年底幾乎已經拿不到70w+的AI offer了。 2023年只要有AI相關經驗,就能有面試機會,現在過去一年,不只要求有落地經驗,漲薪幅度也打了折扣。目前除了北京之外,其他城市的AI職位招募也是少的可憐。

可以肯定的是,2025年想要繼續留在牌桌上的大模型創企們,在模型訓練過程中為版權付費只是第一步,降本不是長久之計,想法子賺錢增效,才是關鍵。(文中陳臨為化名)


中國AIGC產業應用高峰會回顧

2024 年1 月5 日,【智求共贏・中國AIGC 產業應用高峰會暨無界AI 生態合作夥伴大會】在杭州未來科技城會議中心舉行。

大會匯集業界資深專家及領導企業,共同聚焦AIGC領域,圍繞當下熱門議題進行深度延展,探討產業激烈競爭下的營運新想法、發展新模式!點擊文章,回顧精彩內容~(AIGC新智界)