生成式AI在中國的發展究竟是快還是慢?
最近國外的Sora風頭正勁,讓不少國人產生了悲觀情緒。其實,國內生成式AI也在快速的發展中,就在Sora發布後不久的2月18日,網信辦發布了第四批深度合成服務算法備案信息,從中可以一窺我國生成式AI的現狀。
什麼是深度合成服務?指利用深度學習、虛擬實境等產生合成類演算法製作文字、影像、音訊、視訊、虛擬場景等網路資訊的技術,包括但不限於:
(一)篇章生成、文字風格轉換、問答對話等生成或編輯文字內容的技術;
(二)文字轉語音、語音轉換、語音屬性編輯等產生或編輯語音內容的技術;
(三)音樂生成、場景聲編輯等產生或編輯非語音內容的技術;
(四)人臉生成、人臉替換、人物屬性編輯、臉部操控、姿態操控等生成或編輯影像、影片內容中生物特徵的技術;
(五)影像生成、影像增強、影像修復等生成或編輯影像、影片內容中非生物特徵的技術;
(六)三維重建、數位模擬等產生或編輯數位人物、虛擬場景的技術。
《網路資訊服務深度合成管理規定》是在2022年11月3日審議通過的,在不到一個月後的11月30日,ChatGPT就橫空出世了。
圖片來源:網信辦
不難發現,深度合成服務的概念與生成式AI有很大的重疊──半年後我國發布的《生成式人工智慧服務管理暫行辦法》中,定義生成式人工智慧技術是指具有文字、圖片、音訊、視訊等內容生成能力的模型及相關技術。
按照規定,在我國境內提供深度合成服務,需要進行相應的備案,從2023年6月至今,已經有4批備案,合計546個算法,可以說是迎來了生成式AI的“物種大爆炸” 。
從圖不難看到,演算法備案的數量和頻率都在上升,第四批備案距離發布第三批備案僅一個月,演算法數也從129個增加到了266個。其中,服務技術支持者和服務提供者累積下來分別為151和395個。(深度合成服務提供者,指提供深度合成服務的組織、個人;深度合成服務技術支持者,指為深度合成服務提供技術支援的組織、個人。)
01. 大廠成為主力軍
在這些演算法中,既有來自網路大廠的,也包括垂直領域的領導企業,還有一眾的新創公司。
先看服務技術支持者,演算法備案數量的前十名基本上都來自大廠,在後面的榜單中,也有科大訊飛、京東科技、出門問問、360、獵戶星空等知名網路公司。相對來說,對外提供技術服務的門檻要高於自用,會出現這種情況也就不奇怪了。
去年大模型爆火,備案的546個演算法中,大模型的演算法足足有70個,不過大多數都是企業用於自身業務的,對外提供技術支援的僅有19個,並且包含多個垂類大模型,通用大模型為數並不多,可見「百模大戰」有些名不副實。
再來看服務提供者,由於數量過多(395個),就不一一列舉了,重點說一下大模型,表單中的內容和上表有些許重合,比如百度的文心大模型,因為有的大模型既可對外做技術支持,也可以用於自家的產品。
值得一提的是,2023年生成式AI的浪潮中,騰訊表現的較為低調,卻在技術支持者榜單中數量排名第一。除了技術強大外,大廠涉獵的行業多,因此有更多的落地場景,可以身兼“賣水人”和“掘金者”兩個角色,例如騰訊,深度合成服務算法備案中,囊括了人臉融合、語音合成、繪畫、P圖等多個領域。
與之類似的是網易,作為服務技術支持者,演算法涉及圖像、語音生成、文字生成、三維場景等多個行業;作為服務提供者,演算法則服務了有道詞典、逆水寒手遊等應用。
但要說自身應用演算法最廣泛的大廠,則莫過於阿里巴巴。可能源自於組織分割的緣故,阿里巴巴對外提供技術支援的演算法都來自達摩院,但淘寶、釘釘以及天貓等,又都有各自的演算法備案。DoNews向達摩院了解到,淘寶、釘釘等大部分技術來自於自研,也有部分技術有達摩院提供或聯合研發。
百度的文心大模型是目前國內大模型的領導者,在數位人、語音合成及辨識、文生文/圖、人臉融合等領域都有演算法,不過在產品層面就明顯單調許多,只展現了文心一言大模型的App與網站。由此可見,單純看演算法數量,並不能全面體現企業的AI能力。
華為雲則是徹底走「2B」路線,目前擁有6個演算法備案,全部作為服務技術支持者,主要分為兩類:盤古及MetaStudio(數位內容生產線)。
02. 產業應用加速落地
透過整理演算法備案的資料,我們也發現另一個情況,生成式AI在網路領域迅速擴展,並在向更多垂直領域蔓延。
例如,電商就是一個重點發展大模型的產業,阿里巴巴旗下的電商最積極擁抱AI。
短影片領域也大量應用了生成式AI技術,抖音和快手一如既往是領頭羊,應用場景集中在特效、合成、換臉幾大方向。
傳統產業也積極擁抱生成式AI,例如醫療健康,應用主要集中在健康諮詢、醫療內容生成。
2024年開年,AI手機成為了熱門話題,OPPO和vivo都提前進行了大模型的演算法備案。
此外,不少令人意想不到的行業,也在應用生成式AI。例如家電巨頭TCL,看似和生成式AI不沾邊,卻透過TCL智慧文字生成演算法,在APP中根據使用者輸入的文字內容,產生產品說明與使用指引。
在教育領域,好未來一共備案了多達8個演算法,既有自用也有對外做輸出的,展現了強大的科技實力。母嬰產業,寶寶樹孕育(APP)應用的寶寶樹母嬰家庭領域大模型產生合成演算法,可根據使用者提出的備孕教養問題,產生備孕育兒等相關知識內容,輸出文字內容回覆。
還有一個重要的落地場景,就是汽車產業。年初的CES上,賓士、寶馬、福斯等汽車廠商都展示了融合最新AI大模型技術的車機系統,比亞迪也在近期推出了全新的整車智慧化架構「璇璣」及其AI大模型「璇璣AI大模型”,“智駕”正在成為新能源汽車標配。
透過深度合成服務演算法備案訊息,我們可以看到,生成式AI在中國蓬勃發展,雖然有隻見廣度不見深度的嫌疑,但隨著生成式AI的不斷深入產業落地,未來我們也將看到更多和更好行業案例湧現。(DoNews)