OpenAI新推出的文生視訊模型Sora,是最近社群媒體上的「頂流」。
Sora的骨幹研究成員比爾·皮布爾斯和提姆·布魯克斯在X上不斷更新Sora的新作。根據布魯克斯2月18日的動態,Sora已經具備同時產生多個影片的能力。
Sora空降,引起了人工智慧領域的產業震盪,餘波直接蔓延到了影視產業。一個直觀的例子是,在Sora發布後,美國導演泰勒派瑞直接叫停了耗資8億美元的亞特蘭大製片廠擴建計畫。他認為,人工智慧將導致電影業大量工作流失。不少媒體也指出,Sora或將改變包括電影製作、廣告、平面設計和遊戲開發在內的一系列創意產業。
對影視創作來說,人工智慧已是不可忽視的存在——Sora一問世,就成了柏林國際影展的討論焦點。Sora公佈幾天後,柏林電影節組織了一場人工智慧和影視世界構建的論壇,Sora的前景和危險主導了所有人的焦點。
片商的老闆們為之興奮、著迷,認為人工智慧將帶來好萊塢故事敘述的新篇章。
恐懼來自那些沒有話語權的「打工人」。過去一年,好萊塢編劇、演員們曠日持久的罷工浪潮,就已經將行業的生存焦慮推到檯面上:人工智能寫劇本、人工智能合成演員,在好萊塢也不再是稀罕事,編劇和演員們看到了自身隨時被取締的命運。
Sora的降臨,讓這些行業的人們又一次感受到了危機,激起了更大範圍的不安。《好萊塢報導》說,對於視覺特效和其他後期工作人員來說,人工智慧是一種「生存威脅」。
在科技巨頭為AI的里程碑式進展雀躍的同時,影視業人員半是期待,半是警戒。當人工智慧一步步成熟到足以替換面孔、替換背景、替換群演,再到直接從文本生成視頻,這個行業會在多大程度上被改變?
更進一步,這多大程度上會改變我們對影像藝術的固有認知?
Sora空降
從提姆布魯克斯最近發布的Sora生成影片來看,畫面中無論背景或人物,都非常接近相機拍攝的效果——即便是在指尖反覆捻搓的白雪特寫,也看不出什麼明顯的破綻。
在人工智慧生成影片領域,OpenAI並不是第一家付諸行動的企業。在此之前,Google、Meta和Runway都曾開發過類似的文生視訊技術。但不論是對一般受眾還是影視內容生產者來說,真正形成衝擊力的,是近期的Sora。
而讓人感到震撼的,不僅是Sora的“成熟”,還有人工智慧發展之迅速。從文字到圖像再到視頻,人工智慧接近人類的速度,快得出乎人們的預料。
此時距離上一次ChatGPT在現實世界掀起軒然大波,才過了短短一年多。在Sora橫空出世之前,Sora的兩個主要「競爭對手」Pika和Runway,最長都只能產生四秒鐘的影片。與Runway和Pika相比,Sora有不少優勢——影片時間更長、人物的身體運動更為逼真,且支援較複雜的運動場景等。
不過,Sora在一些細節上仍然顯得有些「笨拙」——例如,在空間的辨認上有些左右不分,在因果關係上存在理解障礙(影片中的人咬了一口餅乾,但餅乾卻沒有出現咬痕)。全網刷屏的女子漫步東京街頭視頻,也存在多處細節錯誤,街頭招牌上的日語文字絕大多數並不准確,街景中也有不合常規的障礙物。
即便如此,Sora還是代表著人工智慧生成影片的新里程碑。這一新興的風口,讓科技巨頭們爭破了頭。Google的Lumiere、Meta的Emu和位元組跳動的MagicVideo-V2以及Runway、Pika Labs、Genmo和StabilityAI等新創公司,都在加碼文生視訊模型的賭注,Midjourney也準備在今年稍後涉足視訊生成領域。
人工智慧的未來備受矚目。根據Statista的數據,2024年生成式人工智慧的市場規模預計將達到666.2億美元。而據彭博社預計,2032年,市場規模將再擴大至1.3兆美元。國內360董事長週鴻禕判斷:“Sora意味著AGI(通用人工智慧)的實現將從十年縮短到一年。”
Sora帶來的影響不可能只停留在Sora自身。市場研究公司ABI Research的高級分析師里斯海登說,這類人工智慧模式可能會對數位娛樂市場產生巨大影響,因為新的個人化內容將在各個管道流傳。
這意味著,價值數千億美元的影視產業的生產方式,將迎來巨大變化。而賴此生存的影視從業者,只好拿出比AI有利的條件。
必須與AI合作
受眾能在多大程度上感受到人和人工智慧的區別,在Sora正式開放使用之前尚未可知。
一年前,由人工智慧生成的威爾史密斯吃麵影片在網路上引起了病毒式傳播。當時,人物的表情和動作、麵條入口前後的形狀變化都存在明顯的bug。最近Sora掀起熱議後,威爾·史密斯親自錄製了一段吃麵視頻,但在得到解釋之前,不少人還以為是Sora的“傑作”。
威爾史密斯的“以真亂假”,恰恰說明了:在真實性這一點上,人們在很大程度上相信,人工智慧即將擁有人類作品的說服力。
在此基礎上,從“AI換臉”,到Runway和Elevenlabs的“變身”和背景替換功能,再到Sora直接由文字輸出視頻,人工智能給影視行業帶來的衝擊是不可忽略的。
《紐約客》2月16日刊文提出,Sora對影片領域的衝擊,可以類比ChatGPT對寫作的影響。
人工智慧最為顯著的優點之一,就是效率高。《科學》雜誌的研究人員招募了453名行銷人員、數據分析師和受過大學教育的專業人士,其中選擇使用ChatGPT的作家完成任務的時間減少了40%,並且製作的作品質量比未使用ChatGPT的參與者高出18%。
另一個優點可能是成本低廉。美國最具影響力的商業雜誌之一《Fast Company》表示,Sora將改變人們創作內容的方式——未來使用生成式人工智慧要比使用3D建模、傳統視覺特效和CGI等便宜上百倍,它甚至可能比架一台攝影機還要便宜。
以知名科幻電影《流浪地球》為例,製作團隊共為影片繪製了5310張概念設計、9989張分鏡頭畫稿,搭建了102個科幻類主場景,耗費了龐大的人力物力。導演郭帆曾在訪談中表示,在設計科幻電影的概念圖方面,Midjourney更有優勢——因為一個有幾十年經驗的設計師可能需要一周的時間才能完成,而Midjourney一夜之間就可以製作出大量畫面。
《流浪地球2》劇組拍攝期間有1,189位常駐工作人員,超過22,000位參與群眾演員。郭帆覺得,有了人工智慧工具,《流浪地球3》的劇組人數或許可以減少至少一半。
道具製作師西蒙魏斯,曾為導演魏斯安德森創造出布達佩斯大飯店微縮模型,他表示,以前還「擔心自己會失業」。但如今,他也開始使用新的人工智慧技術來輔助傳統的道具製作,「我們必須與之合作」。
他說:“人工智能可以更快地找到照片,為構建微縮場景提供靈感,用ChatGPT找到所需的圖片,就不用在谷歌上搜索好幾天。”
Sora帶來的危機
人工智慧參與文字、影像甚至影片、甚至是電影的未來是可以預見的,或許還能拿出傲人的成績。就在去年,一部由人類和AI共同寫就的《機憶之地》還拿下了第五屆江蘇青年科普科幻作品大賽的二等獎。
洛杉磯導演戴夫克拉克認為:“創作者需要擁抱人工智慧技術,以獲得從未想過或實現過的內容。”
然而,新科技將如何衝擊既成規範的社會生活?人類似乎還沒想清楚。不久前,人工智慧剛捲入一場風波:1月25日,一名X用戶分享了一張泰勒絲的露骨圖片,被瀏覽了4700萬次。儘管X平台努力刪除,但這些內容還是得到了瘋狂傳播。
這並非孤例。去年11月,新澤西州30多名女高中生的照片,也被AI竄改成色情圖片,並發在了網路上。此前,深偽影片在色情平台已經氾濫,但隨著新技術的到來,情況將如何惡化,沒人說得清楚。
身份驗證公司iProov的首席科學員安德魯·紐維爾說:“Sora將使那些帶有惡意的人更容易生成高質量的深度偽造視頻,更便於他們創建用於攻擊目的的視頻。”
人工智慧生成影片正一步步深入人類的工作和生活。可以想見的是,不久的未來,整個網路都將充斥著AI偽造影片。最終,人類引以為傲的影像藝術的最後堡壘──電影,也可能被顛覆。
只不過,到那時,我們需要重新界定什麼是“偽造”,什麼又是創作。
以Sora為代表的工具,將如何影響未來的影視產業,並不完全以業內人員的意見為準——再好的AI作品,都要觀眾買單才有意義。
從目前的數據看來,觀眾對於人工智慧深度參與的作品態度不算樂觀。雅虎娛樂和YouGov的一項調查顯示,大多數美國人並不想看人工智慧生成的有深度偽造演員的電影。民調發現,在受訪的1,665名美國成年人中,有61%的人認為「在電影和電視節目中加入人工智慧生成的演員數位複製品是個『壞主意』」;另有63%的人認為,好萊塢不應允許人工智慧取代人類編劇產生電影和電視劇本。
人工智慧走多遠,人類還沒有定數。
但可以確定的是,創作最終還是人的藝術。就如德國視覺特效工作室Trixter的總經理克里斯蒂娜·卡斯珀斯-羅梅爾所說,即便像Sora這樣的人工智慧工具在工作流程上更有效率,電影和電視製作還是將繼續依賴人類創作者。(南風窗)