人工智能“技術奇點”越來越近了。
近日,聊天機器人模型ChatGPT風靡全網。憑藉背後強大的技術,ChatGPT可以完成流暢對答、寫劇本、寫代碼等各項功能,目前全球已經積累超過百萬的用戶。它甚至可以創作詩歌和笑話,這是一種之前被認為只屬於人類的能力。
OpenAI的聯合創始人馬斯克評價道,“好得可怕,我們離強大到危險的AI不遠了。”
這並不是AIGC(AI generated content,AI技術生成內容)第一次震驚人類。時間推回到八個月以前,主業從事PPT設計的博主阿文偶然刷到一位藝術家的微博,內容包括幾張十分驚豔的圖片,“一開始我還以為是他自己畫的,結果他說那是直接通過文字生成的,在那時的我看來這是一件不可思議的事情。”
被深深震撼的阿文投身關注起AI繪畫這個領域,並在微博上做起了相關技術的推廣者。短短幾個月,阿文深刻感受到技術的飛速精進與完善,“4月份的時候生成的圖片還是比較偏意識流的,五六月份的時候已經畫得越來越像人,尤其是現在已經非常恐怖了。”
OpenAI創始人兼CEO Sam Altman曾表示:“十年前的傳統觀點認為,人工智能首先會影響體力勞動,然後是認知勞動,再然後,也許有一天可以做創造性工作。現在看起來,它會以相反的順序進行。”
“這項技術出來了,你就不可能再把它塞回去,”阿文表示,“這是一場離我們特別近的技術革命,我們能做的就只有調整心態迎接它。”
AIGC走向大眾
在AIGC逐步“爆發”的過程裡,看似兩條路徑的ChatGPT和AI繪畫,其實始終由一根線串連。想了解整個過程,要先看回這根線的始端:ChatGPT背後的科技公司,OpenAI。
背靠微軟的全球頂級AI實驗室OpenAI提出了強大的預訓練語言模型:GPT(Generative Pre-trained Transformer)系列,這一系列的模型可以在非常複雜的NLP任務中完成諸如生成文字、生成代碼、回答問題等。
有趣的是,2018年,當第一代GPT剛剛面世時,一心專注於強化學習的OpenAI還只是用它來做語言理解方面任務,未曾想到,GPT的生成潛力才將是帶領該公司走向聞名的技術道路。
這並沒有持續很久,在GTP-2出世之時,OpenAI顯然已經發現了GTP真正的強項。得益於更高的數據質量和更大的數據規模,彼時GTP-2生成的故事在流暢度和邏輯性上已經有了驚人的效果。
更大的轉變在2020年,也就是GTP-3的現身。1750億參數的GPT-3曾一度是AI歷史上最大的機器學習模型,預訓練的數據量是GTP-2的十倍不止。至此,OpenAI對GPT-3的期望已經放在了實用性和通用性上,商業化路徑逐漸顯露,釋放出API接口供公眾調用,不到一年就吸引了約300家公司。
隨後的一年裡,OpenAI進行了多次多模態的探索,比較知名的是文字生成圖片的模型DALLE和DALLE2,可以將它們理解為是GPT-3的圖像版本。尤其是2022年推出的新版DALLE2,其使用的擴散模型將圖片的生成提升到了一個新的高度,對文字的理解更加精確、繪畫水平更高、渲染更快,已經可以生成完整的人像和圖片,AI繪畫的能力開始被更多人關注。
今年8月,借鑒DALLE2的思路,StabilityAI的Stable Diffusion模型橫空出世,該模型是最新的擴散模型,能夠在消費級顯卡上實現DALLE2級別的圖像生成,生成效率卻提高了30倍。目前在該模型下,AI生成的圖片已經具有極高的藝術性,甚至可以與專業畫師媲美。
此外,與DALLE2不同的是,Stable Diffusion完全免費開源,所有代碼均在GitHub上公開,任何人都可以拷貝使用,這為AI繪畫帶來新的生機。
目前,Stable Diffusion的各渠道累計日活用戶超千萬,已經吸引超過20萬開發者。其背後的公司Stability AI作為初創公司,於10月宣布獲得了1.01億美元超額融資,估值已達10億美元,成為新晉獨角獸。而在這波AIGC的浪潮裡,開頭提到的領頭企業OpenAI,如今估值更是已經超過了200億美元。
商業化初嘗試
在紅杉資本一篇名為《生成式AI:一個充滿創造力的新世界》(Generative AI: A Creative New World)的文章中,紅杉表示,生成式AI,讓機器開始大規模涉足知識類和創造性工作,這涉及數十億人的工作,未來預計能夠產生數万億美元的經濟價值。
這點出了AIGC的商業化前景,一時間賽道火熱,國內外龍頭紛紛下場。
今年9月底,Meta發布了一個新的人工智能係統Make-A-Video,可以基於文本提示生成短視頻。緊接著,Google也發布兩款文本轉視頻工具,分別是強調視頻品質的Imagen Video,以及主打視頻長度的Phenaki。這較此前提到的文本生成圖像來說又是新一輪的技術升級。
西湖心辰COO俞佳在接受記者採訪時表示,已明顯感受到AI生成文字和AI生成圖像發展到了商業可用的階段。去年年底,西湖心辰上線了Firday平台,聚焦AI寫作;今年8月,AI繪畫平台盜夢師上線,創造出日增5萬用戶的增長速度。
從應用角度來看,如今的AIGC作為工具來說無疑已經是成熟的。
以文字生成為例,據俞佳介紹,西湖心辰的Firday平台可以生成短視頻腳本、口播、營銷文本、甚至雅思作文等,基本與國際上普遍的文字生成功能大同小異。
而這樣的商業模式已經被證明是可行的。海外初創公司Jasper提供生成Instagram標題,編寫TikTok視頻腳本、廣告營銷文本等內容,截至2021年,已擁有超過70000位客戶,包括Airbnb、IBM等知名企業,並創造了4000萬美元的收入。在最新一輪的融資裡,Jasper獲得了1.25億美元資金,目前估值已達15億美元。
文字生成圖片的應用雖仍主要是C端玩家的娛樂消遣,但已有專業用戶逐步入坑。據百度AI繪畫平台文心一格的相關負責人介紹,以文心一格為例,在輔助創作方面,該平台可以啟發畫師、設計師、藝術家等專業視覺內容創作者的靈感,提供創意思路,輔助進行藝術創作;在提升效率層面,可以為媒體、作者等文字內容創作者提供高質量、高效率的配圖,提升創作效率。
近期,OpenAI已經與全球最大的版權圖片供應商之一的Shutterstock達成深度合作,Shutterstock將AI繪畫引入商業圖庫。有分析人士認為,隨著AUGC的成熟和完善,AI繪畫必將代替類似的圖片素材。
“AIGC還處於非常早期,目前文字生成已經與行業結合地比較好了,圖片生成也會是一樣的,”俞佳表示,“畢竟行業本身的需求一直是存在的,只是之前還沒有被滿足而已。”
國盛證券認為,AIGC 將是Web 3.0 時代的生產力工具。當我們邁入Web 3.0時代,人工智能、關聯數據和語義網絡構建,形成人與網絡的全新鏈接,內容消費需求飛速增長,UGC、PGC這樣的內容生成方式將難以匹配擴張的需求。由此,將來文字生成、圖片繪製、視頻剪輯、遊戲內容生成皆可由AI替代。
抵制還是擁抱?
AIGC在短時間內帶來的衝擊有些大,正如阿文所說,我們正在經歷一場技術變革。只是這場變革既然來得突然,就必然會帶著眾多問題和懷疑,就像所有新技術初來乍到時一樣。
朱曉雯表示,當前,AIGC賽道尚處於孕育探索階段,相關法律法規、技術倫理等問題仍亟待解決,短期內還難以實現大規模商業化應用。
版權是當下比較敏感的話題之一,也是很多人抵制AIGC的原因之一,在AI繪畫領域尤為嚴重。一些原畫師抨擊AI繪畫是未經授權作品的拆解和再拼湊,這也導致了接受AI技術的畫師因擔心侵權,在日常工作中不敢商用該技術。
出現這個問題的原因與用來訓練AI的數據源有關,裡面很多內容沒有經過授權,而AI生成的成品中出現了與原畫相似的痕跡。“但如果想都經過授權幾乎是不可能的,比如一些非常好的模型,用的圖可能有20億張,不可能把所有的圖都去跟圖源作者確權。”阿文表示。
浙江漢鼎律師事務所張永輝律師表示,著作權法中針對作品的獨創性具有明確規定,作品必須具備獨創性和可複制性。
“AIGC的繪畫風格與繪畫內容都是由用戶通過網絡技術設計而成,與普通畫作一樣,可以體現一定的智力水平和作者的創作表達,其生成內容具有思想表現形式的作品外觀,應當獲得著作權法的保護。”張永輝律師表示,“如果AIGC軟件只是簡單地複制粘貼原畫作,或者照搬原作品成為自己的作品一部分,那就需要獲得原作者的同意並支付使用費。”
創作者們對於版權問題的敏感程度體現了他們對於自創內容的珍視,而AIGC如今所能做到的幾乎已經達到了創作者的平均水平,人類創作的價值突然被降低,這也是一些人抵制新技術的另一層原因,由此引出了那個老生常談話題:AI會取代人類嗎?
回答此問題或許可以從一段歷史中窺見結果。
19世紀時,法國詩人Charles Pierre Baudelaire曾稱攝影為“藝術最致命的敵人”,原本以寫實為目標的繪畫作品在照相機問世後變得失去了意義和光彩,人們對真實的定義出現新的變化。但這卻促使了畫家們思考如何化危為機,並積極探索出繪畫藝術的新形式。十九世紀六七十年代,以莫奈馬奈為代表的印象主義畫派產生,打破了寫實油畫長期一統天下的局面,藝術又迎來了新的春天。
李彥宏曾公開表示,AIGC需走過“助手階段”“協作階段”和“原創階段”三大階段。俞佳認為,如果按照這個來分,目前的AIGC已經處於“協作階段”,即除單純輔助外,AI還在一定程度上扮演引領者的角色,為人類提供靈感和思路。
高曉雯認為,一方面,AIGC還需針對需求離散化和時間精力的有限等痛點展開,進一步拓展深度學習等;另一方面需要對製作內容進行一定的管控,需要有完善的法律法規,確保其發展為一項有效、合規的高科技產業。
阿文的態度則更為開放,他認為知道風向在哪裡,及時調整自己就可以。“把AI納入到自己工作流程,我覺得是一個遲早的問題。既然躲不掉的話,還不如早一點擁抱它。”(21Tech)
