虛擬人“人格化”

1月20日,虛擬人技術服務商慧夜科技宣布完成由順為資本獨家投資的Pre-A輪融資。本輪融資將進一步用於完善虛擬人驅動技術、擴充團隊,並探索商業化模式。

成立於2019年的慧夜科技,自我定位為一家虛擬⽣命AI 驅動技術服務商。公司曾於2020年8月獲得青山資本領投的天使輪融資。

自去年以來,國內虛擬人行業熱度明顯上升,但目前虛擬人的呈現形態仍以圖像和視頻為主,與用戶的交互往往通過真人動捕方式實現,存在設備、人力和時間成本較高的痛點。在這樣的背景下,不同技術路線的AI解決方案需求上升,當下虛擬人發展已經呈現一定的智能化趨勢。

慧夜科技創始人渠思源向共同虛擬表示,慧夜將虛擬人發展分為三個時代。在1.0時代虛擬人僅以圖片和視頻形式呈現;而2.0時代的虛擬人將更具交互性;最終在未來的3.0時代,虛擬人的核心為個性化。

在這其中對於技術的要求也有所不同。目前,慧夜自研的AI驅動引擎phantom engine服務於2.0時代需求,核心是基於深度學習的虛擬人動作、表情合成算法。在即將與次世文化合作推出的虛擬人產品DJ Purple上,這一技術已得到落地應用。

渠思源表示,慧夜以向B端客戶提供虛擬人技術為主營業務,在商業模式上,未來慧夜計劃打造AI Being & Service的SaaS平台。同時,慧夜科技也推出了自己的虛擬人產品,包括數字人DJ、虛擬健身教練和虛擬品牌代言人等。

按照渠思源的規劃,慧夜科技正在從2.0 向3.0 過渡。慧夜認為通過真人驅動的虛擬人屬於Avatar範疇,其本質是人類行為在虛擬世界的投射,而真正的虛擬人是存在於虛擬世界的獨立個體,即AI Being。

渠思源認為,當前虛擬人行業仍處於初級萌發階段,隨著AI技術不斷精進,最終虛擬人不僅與人產生交互,還將衍生出特有的性格和人生,成為真正的“虛擬生命體”。在未來虛擬世界中,真人的虛擬形象會與獨立的“虛擬生命體”共存,虛擬生命體可能承載著真人無法在物理世界中完成的工作。

智能化驅動虛擬人,定位虛擬⽣命AI 驅動技術服務商

2019年,一款國產遊戲《古劍奇譚三》成為慧夜科技創始團隊步入虛擬人行業的契機。

在遊戲過程中,創始團隊發現主角口型和語音不匹配的問題,便找到追光動畫合作,試圖通過動畫電影中語音和口型數據的深度學習,以算法生成解決這一問題。

“那時還是一個興趣小組,我們在思考如何對虛擬世界實現本質效率的提升,當時把它理解為一個沒有實體的機器人,由此我們引申出了AI Being(虛擬生命)的概念。” 渠思源說。

通過對年輕一代的觀察,渠思源感受到近來Z世代對虛擬世界的認可度正在提高,團隊一致認為“虛擬世界是未來剛需,而虛擬人是連接虛擬和物理世界的重要紐帶。長期來看,要實現交互,高效智能化驅動虛擬人的研究價值巨大。”

在這樣的認知下,慧夜科技投身虛擬人賽道,自我定位於“虛擬生命AI驅動技術的服務商”。

渠思源表示,慧夜從技術角度將虛擬人發展分為三個時代。1.0時代對應三維建模和渲染技術,虛擬人僅以圖片和視頻形式呈現;2.0時代的虛擬人將更具交互性,需要語音文字交互、動作合成技術和實時渲染技術作為支撐;在3.0時代,每一個數字人都可以有自己特定的人格和個性化行為,可以讓用戶相信他們真實存在於一個虛擬世界,將由個性化決策、語言、動作系統驅動。按照渠思源的規劃,慧夜科技正在從2.0 向3.0 過渡。

“我們核心團隊包括來自清華、北航、阿里的研究員和來自清華美院、湖北美院的藝術創作者,其中研發人員約佔60%,美術與產品佔40%。” 談及團隊構成,渠思源說道。

目前,慧夜自研的AI驅動引擎phantom engine服務於2.0時代需求,核心是基於深度學習的虛擬人動作、表情合成算法。

渠思源表示,自成立起慧夜團隊花費近一年的時間探索前沿技術與工業流程的融合,將美術設計、三維建模、物理引擎、CG渲染、深度學習等技術領域打通。

在其“生成式深度神經網絡框架”下,在系統中輸入一段音樂,虛擬人便會根據旋律自動起舞。此框架可應用於基於語音的口型生產、基於文本和指導命令的動作生產、基於音樂的舞蹈生成、基於音樂的DJ表演生產等多種內容製作任務。

此前公開的三維舞蹈動作生成算法DanceFormer,即採用運動參數曲線,在舞蹈數據集的訓練下,使虛擬人可以跟從給定音樂進行流暢舞蹈。

在渠思源看來,慧夜虛擬人技術的優勢有二,一是以AI驅動虛擬人在成本和效率上優於傳統動作捕捉技術,二是早期技術路線的選擇決定了訓練數據的可用性。

“以此次推出的DJ Purple為例,用戶輸入音樂後可以生產一段完整的DJ表演,用動捕技術製作的話,需要找專業演員培訓、錄製數據、修補數據,整個流程最快需要一周,但我們AI算法可以做到輸入一個小時的music set,播放音樂時同步合成預覽動畫。”

從數據可用性角度看,傳統影視遊戲的三維動畫數據,由於高度定制化、藝術化處理,在運動數據空間上的分佈高度畸形,難以進行屬性標註與系統歸類,因而很難用於機器學習。

基於這一認知,慧夜放棄定制化內容的變現方式,自創立之初就積累用於機器學習的3D動畫原始數據集,在嚴格數據採集規範下,保證較高可用性,建立智能化數據採集工作流。

服務B端市場,深耕AI虛擬人使用場景

“去年下半年開始,品牌方對虛擬人的需求不斷增加,我們的客戶也在以倍速增長,大家需要一個與虛擬世界連接的介質,目前來看,就是人性化的虛擬形象。”

渠思源認為,當前以圖片、視頻形態為主的1.0時代紅利不會持續太久,慧夜瞄準的正是2.0時代,通過提供智能化技術,虛擬人可以與用戶形成實時交互,甚至進行表演。

由此,慧夜主營業務深耕B端市場,為品牌方和虛擬形象製作公司提供技術服務,此次與次世文化推出的DJ Purple已得到落地應用。

虛擬DJ Purple)

 
談及行業客戶分佈,渠思源表示,“現在很多品牌有了自己的形象,但更多是海報或視頻的方式呈現,我們提供智能化技術讓它動起來。”此外,渠思源透露,目前還在探索與遊戲領域的公司合作,未來可能會針對遊戲方向推出產品。

在品牌虛擬IP之外,慧夜還計劃推出多個垂直場景的虛擬人,例如最近合作的虛擬DJ,以及計劃推出的虛擬健身教練。

當前,以DJ Purple和健身教練為例,慧夜產品可分為兩類—虛擬娛樂領域和功能性產品。

渠思源表示,團隊認為虛擬娛樂場景是未來虛擬人的主要應用方向之一,以DJ Purple為起點,慧夜還將推進類似虛擬歌姬、虛擬舞者等交互性產品,其自有引擎和技術打磨後可以服務於有音樂表演需求的用戶。“我們希望做一些可規模化的場景,通過輸入文字、語音、控制信號等引導信息,可以幫用戶完成深層次的動作表演。”

功能性產品方面,除健身教練,在核心架構或神經網絡主幹不變的情況下,慧夜將基於其對潛在市場的理解,切入更多規律性與邏輯性較強的細分場景,如虛擬心理醫生。其中,在健身場景上所積累的數據可以反向推進算法優化,為後續產品提供技術支持。

“要類比的話,我們後續打法可能類似於Epic Games,他們在打磨自有引擎技術的同時,也在做自己的產品內容。”

在商業模式上,未來慧夜計劃打造AI Being & Service的SaaS平台。“不管將AI虛擬人運用在哪種場景下,我們希望提供本地部署和雲原生兩種使用方式,根據虛擬人的功能不同,定價不同,本質上將它變為一個標準化服務。”

使用方式層面來看,對於在雲端完成渲染的虛擬人,將以市場標準和消耗的算力收費,本地部署的虛擬人僅需花費軟件授權費用。虛擬人功能層面,動作複雜程度越高,定價則越高,會按時長和消耗的算力進行收費。

逐步開始商業化,行業5年內有望步入3.0階段

當前,虛擬人智能化已經成為趨勢,一些相關產品已經出爐。比如小冰自2014年起以多項自研AI賦能虛擬人,去年7月,其公開的超級自然語音技術首次將AI語音自然度提升至真人水平,實現多場景下的交互性。

順為資本副總裁馮錚表示:“AI驅動的虛擬人,是虛擬世界的核心交互方式,也是虛擬世界的'機器人',賦能實體生活。這其中,AI驅動的動作、語言、感知等能力,是虛擬人的'大腦'。

就現階段的探索,馮錚認為,慧夜科技作為這個領域裡非常稀缺和前沿的一支團隊,擁有非常強的技術、產品和商務能力,並且一直在最前線探索新的AI虛擬人使用場景,並使用技術能力降低應用的成本。

未來計劃上,渠思源表示,今年慧夜將在產品、技術與團隊等方面深入佈局。

產品方面,慧夜往後可能以每季度1-2個的節奏推出更多交互性虛擬人,同時作為一家虛擬生命驅動公司,慧夜還計劃在官網上線可實時交互的專屬虛擬員工,依托虛擬人為主體,提升用戶在固定場景下的信息交互體驗。

慧夜科技虛擬生命產品矩陣)

技術方面,慧夜通過優化原有算法和AI渲染技術探索,更好地服務於2.0時代交互需求和3.0時代的虛擬人個性化。此外,慧夜會通過建立標準的智能化工作流,縮短新數字產品的孵化時間。

“一方面,我們現有AI驅動算法還有較大優化空間,要走向個性化,虛擬人應該擁有自己的性格、表情和動作,這是我們要解決的;另一方面,我們希望橫向擴展我們的技術棧,在AI輔助建模、自動綁定、以及神經網絡渲染加速等方向進行深入探索。”

對於目標的實現,渠思源表示,今年起慧夜團隊將進一步擴張,並且更為系統化,針對潛在客戶和目標人群會匹配相應打法,逐步擴大聲量。

在渠思源看來,當下虛擬人行業仍處於初級萌發階段,不少公司正在針對2.0階段進行佈局,尤其是2021年後半年起,許多應用的逐步落地讓市場看到了未來的可能性,但目前還要將重心放在優化用戶體驗和對產品本身的思考上。

渠思源預估,從1.0走向2.0階段可能需要2至3年時間,5年內有望步入3.0階段。屆時虛擬人將發生本質變化,不再是純粹的虛擬機器人,每個虛擬人都有獨特的性格和人生,要實現這一點還需更多的技術積累。

同時,渠思源將虛擬人智能化視為行業發展的必然路徑。“從2012年Deep Learning發展至今,大量時間、人才和資源的投入讓我們有能力驅動虛擬人完成部分任務,未來每個人日常生活中都會接觸到虛擬人。”

不過渠思源認為,雖然AI驅動必定會成為未來主流,但短期內真人動捕和傳統動畫製作技術不會被完全替代。兩種技術會在不同場景發揮作用,藝術創作性需求,如劇本或導演指導下的特定表演,仍需真人動捕實現,而對於邏輯性、規律性場景,如虛擬DJ、教練、品牌代言人,AI技術則是標配。
展望未來,渠思源認為,“無論是二次元還是超寫實虛擬人,未來都會在虛擬世界承載很多工作,虛擬世界未必是現實生活的映射,每個人會有自己的虛擬形象,但同時可能存在數倍於人的AI Being,他們可以完成許多在物理世界中做不到的事情,與人形成交互,融入每個人的生活。”(共同虛擬)