2023,元宇宙「脫虛向實」
元宇宙(Metaverse)一詞源自美國科幻作家尼爾·斯蒂芬森的科幻小說《雪崩》。原著中,Metaverse 是由meta(超越)和verse(宇宙)兩個單詞拼接組成,字面意思是「超越宇宙」,在書中代指一個平行於現實世界的虛擬數字空間,在這個虛擬世界中,人們可以娛樂、社交、工作,做任何想做的事情。
元宇宙一詞從書中走入商業世界有兩個重要節點:
第一個節點在2021 年3 月,遊戲公司Roblox 掛牌上市。Roblox 的核心產品是一個多人在線互動遊戲平台,玩家可以自主創作3D 遊戲世界,也可以進入別人創造的世界。Roblox 在招股書中將元宇宙寫入其中,視為自己的長期願景。
第二個契機則來自馬克·扎克伯格。《雪崩》中描述的Metaverse 與他重金投入VR/AR 想做的事情高度契合,2021 年10 月,他宣布All in 元宇宙,並將Facebook 更名為Meta。幾個月後,新生的Meta 推出了自己的第一個元宇宙平台——Horizon Worlds。
Meta 和Roblox 的共同點,是認為一個有著獨立經濟系統、支持UGC 創作三維內容的沉浸式數字化平台,會成為下一代互聯網的基石。元宇宙的描述最接近這種理念,二者選擇將其作為公司的長期願景。但要注意的是,這個觀點在今天並不是行業共識。
一部分從業者認為:未來把人連接在一起的不會是一個中心化的超級世界,可能是一個個去中心化的、分散的虛擬空間的集合。當然,更多人認為,今天硬件、內容等關鍵基礎設施還處於非常早期的狀態,現在討論和搭建元宇宙為時尚早。
今天圍繞元宇宙有著眾多爭論——這個行業正處於「大航海時代」到來的前夜,無數人試圖描繪心目中的「新大陸」,並堅信自己找到的是通往元宇宙的正確航線。各種概念和信息交織混雜,這給關注甚至在相關領域從業、創業的人們帶來了巨大的困擾。
我們認為元宇宙火熱背後,行業的底層邏輯是:尋找移動化後,信息革命的下一個技術浪潮。數字信息正在從二維向三維發展,元宇宙是3D 信息時代重新構建的三維化的虛擬空間網絡。今天所謂的元宇宙行業,就是圍繞這個大趨勢下構建起的技術、硬件、內容和服務公司。
2021 年下半年,以VR 頭顯銷量破千萬成為關鍵節點,開始突破「硬件賣不出去——做內容不賺錢——缺少好內容更沒人買硬件」的負面循環。
不過當前行業普遍的共識是:今天元宇宙賽道整體還處於非常早期的狀態。距離VR/AR 和元宇宙真正普及,成為擁有上億級甚至十億級用戶的通用計算平台,還需要至少十年的時間。從國內來看,2022 年二季度開始一級市場元宇宙投資的熱度開始出現下降,部分項目的估值也開始出現回調。
當前,元宇宙行業發展的關鍵,可以總結為下面三個問題:
- 創造人類進入元宇宙世界的入口
- 構建元宇宙內容的技術和生態體系
- 怎麼在(元宇宙)到來前,讓技術產生商業價值,讓創業者賺錢養活自己
01 元宇宙入口:VR 已至,AR 將來
就像先有電腦才有互聯網,在元宇宙到來之前,首先需要的是一個能夠讓用戶真正進入數字世界的硬件終端。
今天來看,以VR 頭顯(XR 頭顯)和AR 眼鏡為代表的近眼顯示終端(Near-eye displays,NEDs)最有可能成為元宇宙時代的第一個通用硬件終端。這兩個終端分別對應不同的用戶使用場景,其中VR 頭顯對應桌面級場景(今天主流設備是PC),AR 眼鏡則對應移動場景(今天主流設備是智能手機)。
儘管兩者都在2014 年前後起步,但VR 頭顯成熟更快,2021 年突破千萬級門檻後,業內普遍認為VR 已經出現第一個真正意義上的通用消費級終端(以Oculus Quest 為代表)。
相比之下,AR 設備雖然在2022 年有了較大的進展,出現了第一代真正面向C 端用戶的消費級AR 眼鏡。但受算力、功耗、顯示和光學技術等方面的製約,功能上只能滿足特定消費場景的需求,距離通用級終端出現的時間點,還有至少5-10 年。
二者技術上有很多相似之處,決定性的區別是產品體積帶來的製造難度。AR 眼鏡的承重主要在鼻樑,理想的產品重量需要控制在70g 以內(iPhone 的1/3)。而承重在整個頭部的VR 頭顯,今天500g 的重量(PICO 4 重596g、Quest 2 重503g)就已經有較好的用戶體驗。
AR 眼鏡:消費級元年
根據使用場景,AR 眼鏡可以分為ToB 的工業級和ToC 的消費級,消費級AR 眼鏡又可以細分為面向特定使用場景的非通用級和通用級AR 眼鏡。
三種產品的技術難度依次遞升,今天AR 行業的基本共識是:2022 年是消費級AR 眼鏡的元年,但距離真正有機會取代手機的通用消費級AR 眼鏡出現則需要至少5-10 年。
過去:「失敗」的生產力工具
Google Glass 是近代AR 眼鏡的開端,對於這個售價1500 美元的產品,谷歌最初的定位是消費級但不論是硬件技術還是內容應用,當時的條件遠未成熟。2015 年,Google 宣布放棄Google Glass 項目。
Google 的失敗啟發了後來者,比如微軟於2015 年1 月推出的第一代HoloLens,就將目標用戶定位為企業用戶。然而從結果來看,過去6 年AR 眼鏡作為生產力工具並不算成功。
AR 眼鏡遇到的問題是:作為生產力工具,其在軍事、設計、維修、辦公協同等領域發揮出了一定的價值,但都算不上是革命性的提升。
現在:滿足特定場景的「功能機」
2022 年8-10 月,在一年中的消費電子產品發布旺季,僅中國市場就有超過10 款消費級AR 眼鏡發布。
這些AR 眼鏡可以歸成兩大類,一類是Nreal、雷鳥、Rokid 為代表的更偏娛樂應用的產品,更直接點就是「觀影神器」;還有一類是OPPO、亮亮視野、光粒科技、李未可等,產品定位是在翻譯、運動、導航等一些特定場景做工具。
目前給予光波導技術的發展,價格大幅降低、顯示效果大幅提升,AR 眼鏡開始邁入消費市場。但要注意的是,今天受到顯示技術、算力的限制,一名消費者能接受的重量的智能眼鏡,依然遠不足以滿足多個場景複合使用。對此主機廠的做法是:強化某幾個場景的功能,針對特定問題做特定解。今天比較典型的使用場景有聽障翻譯、戶外運動和地圖導航等。
未來:從手機「配件」,到「幹掉」手機
從ToB 到ToC,2022 年AR 完成了一個重要的里程碑。而下一個目標,則是成為一個通用級平台。
這件事情最大的難點,在於智能眼鏡的重量(80g)只有普通智能手機的1/2 甚至1/3,卻要裝進複雜程度堪比甚至超過最先進的iPhone 的屏幕、光學模組、芯片、傳感器等電子元器件。這裡的挑戰遠不止工業設計,屏幕技術、光學技術、芯片技術、電池技術等都需要全面升級。
今天,一部分AR 主機廠商選擇針對固定場景進行優化。另一種思路是手機+眼鏡的模式。
在這個過程中會有一個非常重要的機會:定義AR 眼鏡的交互範式,就像當年喬布斯在iPhone 上做的那樣。
誰能成為這個定義者?
VR 頭顯:跨過千萬門檻後,走向何方?
對於硬件和內容,經常有人類比經典的哲學問題「先有雞還是先有蛋」。但「先有硬件還是先有內容」是有答案的—— PC 和智能手機的發展歷程都能證明,硬件和交互範式先定下,才會有內容的爆發,才會進一步迎來生態的繁榮。
隨著2021 年Oculus Quest 成為第一個達到千萬級年銷量門檻的VR 硬件,大家相信,今天VR(XR)已經跨過普通消費者能接受的最低門檻,第一代真正意義上的通用級設備已經出現或者非常接近出現,這意味著人類前往元宇宙的第一個硬件入口已經出現雛形。
2019 年5 月Quest 橫空出世,大大降低了用戶的使用門檻,一方面是價格更便宜且用戶無需高配置電腦;另一方面,不需要在外部設置相機、插一堆線纜並反複調試。經過迭代,VR 頭顯進入第全新時代。
值得注意的是:業內也有觀點認為,Quest 的體積依然過大,算不上是真正的「iPhone1」。NOLO VR 創始人張道寧認為,「今天Quest 積累的用戶不是紮克伯格說的10 億(普通消費者)中的1000 萬,而是3000 萬(重度遊戲用戶)的1000 萬。」
對於VR 硬件,一個非常典型的誤區是:很多人認為做硬件就是做主機廠,現在這已經是Meta、PICO 和蘋果等幾家大廠的遊戲。
實際上真正決定產業走向的,不只是幾家大廠,而是整個產業鏈的技術發展,我們梳理出四個主要的技術趨勢:交互,顯示、計算和MR。
交互:基礎架構已定,等待殺手級應用
2022 年8 月,扎克伯格稱,VR 本質上要解決的是「臨場感(presence)」的問題,要做到不論實際上人在哪裡,都能在虛擬世界裡感覺就像和另一個人待在一起一樣。
解決這個問題,需要讓計算機理解用戶的動作,並給出足以欺騙身體各個感官的反饋信號,也就是人機交互。
首先,手是人類與自然世界交互的基礎。VR 中手的交互方式有兩種,第一是手勢識別(裸手交互),第二是用手柄交互。經過開發者和消費者幾年的自然選擇,今天手柄+鐳射點選取的方案已經成為Quest 的最主要交互方式。
接下來更多交互會加入VR 交互系統,提升臨場感。在2022 年發布的Quest Pro、PICO 4 等新一代VR 頭顯上,面部追踪(眼球追踪)和全身捕捉是新解鎖的兩大交互技術。
眼部追踪和麵部捕捉,2022 年已經開始集成到最前沿的VR 頭顯產品,包括PICO 4 Pro 和Quest Pro 等。根據國內眼球追踪技術供應商七鑫易維的數據,2022 年眼追在VR 硬件的滲透率不到5%,但預計未來2 年將會加速提升,達到主流產品的80% 以上。
眼追和麵追的引入,將帶來大量的應用機會。如:
- 面部表情實時映射。
- 注視點渲染。
- 輕交互。
- 虹膜識別。
此外,全身動作識別也是一個值得期待的交互技術。2022 年的新品,Meta 和PICO 均已展示了在增加少量可穿戴傳感器的情況下,實現全身動作捕捉的解決方案。
Meta 和PICO 都將健身和運動類內容視作全身捕捉一個重要的落地場景。低成本全身捕捉有機會進一步降低虛擬人門檻,會加快虛擬人應用在VR 直播、VR 辦公等場景下的落地。
VR 顯示:更輕薄,更清晰
佩戴體驗依然是今天VR 最核心的短板,對於VR 顯示技術的發展方向,PICO 總裁周宏偉曾經總結為兩個「qing」:更輕薄,更清晰。輕薄和清晰由VR 顯示系統決定,主要由光學模組和顯示面板兩部分組成。
光學模組的存在,是VR 的顯示系統與PC、智能手機的最大不同點。VR 顯示的原理簡單來說就是用放大鏡(光學模組)看電子屏幕,從而擴大視場角製造沉浸感。
VR 光學經歷了非球面透鏡、菲涅爾透鏡和Pancake 方案三個階段。目前採用的最佳方案是Pancake,其方案原理是將光線進行多次折疊,使其比採用菲涅爾透鏡時更加輕薄,縮減了VR 設備的體積與重量,
但Pancake 依然有痛點。一方面折疊光路帶來光損,意味著功耗更大,另一方面複雜工藝導致良率較低,成本較高。目前市面上普遍使用的2P 方案的供應成本為300-400 元,是工藝成熟的菲涅爾透鏡的20 倍以上。
顯示面板的升級也來到了第三階段。從2022 年開始,提升產品的顯示效果就成為重要任務,包括增強VR 顯示面板的分辨率、色彩飽和度、響應速度等。
算力:終端不夠,雲端來湊
2019 年底發布的高通驍龍XR2 依然是目前全球VR 一體機市場的主力芯片,包括Quest 2、PICO 4、奇遇Dream Pro 和YVR 2 等均使用驍龍XR2 芯片作為核心終端處理平台。
2022 年10 月,高通推出最新旗艦XR 平台——第一代驍龍XR2+ 平台(驍龍XR2+Gen1)。新平台優化了功耗和熱性能,這使得該平台能夠在不犧牲終端外形設計的情況下,更多地賦能全感官交互,比如在元宇宙中創建栩栩如生的表情。
Meta Quest Pro 是第一款使用驍龍XR2+Gen1 的產品,此外根據高通的消息,多家OEM 廠商已計劃推出搭載驍龍XR2+ 平台的商用終端。
中國廠商也在發力,全志科技、瑞芯微、聯發科等都在加速佈局XR 芯片的研發。
儘管芯片公司還在努力提升終端處理器的性能,但從趨勢上看,將更多計算處理放在雲端的端雲混合協同,可能是XR 頭顯更長期的技術架構。
這種基於5G 傳輸的端雲混合架構,可以讓XR 設備不再受限於傳統散熱、功率和外形等方面的限制,而是可以利用智能網聯邊緣的算力,面向大型負載場景打造不受線纜束縛的沉浸式體驗。
See Through:未來三年最重要的機會
在Quest Pro 上,Meta 確實做到了更多。低於10ms 時延的全彩立體視頻透視(Video See Through,簡稱VST),讓VST 不再只是VR 頭顯觀察外界的一個雞肋輔助功能,而是成為了一個真正意義上的MR 混合現實功能。
從Meta 的演示以及國內外媒體流出的體驗視頻來看,由於透視是完全3D 的,Quest Pro 的MR 模式下,虛擬物體能夠很好的和真實世界融合在一起。
當然目前這項技術仍處於早期,還有不少的問題,比如清晰度和續航,不過有高通底層的支持,業內普遍認為,未來1-2 年,全彩See Through 也就是MR,將成為XR 頭顯的標配功能。
這件事的挑戰在於:整個行業需要學會如何使用MR 技術,並做出殺手級的應用。Meta 給出的核心使用場景是辦公,以及VR 健身,但很顯然開發者和主機廠需要找到更多的應用場景。
02 實時3D 數字內容:元宇宙的主線任務
3D 內容的價值:展示、推演和實時交互
VR 硬件設備的發展,引發了對於沉浸式3D 內容的需求,這並非是當下獨有的敘事,甚至有點老調重彈了。
在20 世紀90 年代初期,VRML (Virtual Reality Modeling Language)創建出來了,它是一種虛擬現實建模語言,在當時甚至還被有些人視為HTML 的VR 版等價物,專門用於3D 網頁的製作和開發,從而為人們動態鏈接到互聯網上的虛擬3D 世界提供可能。
但是VRML 發展並不順利,人們對它的興趣很快就減弱了。原因有很多,除了技術本身還不夠成熟以外,很大程度上是因為:針對VR 甚至計算機3D 界面的殺手級應用,並沒有出現。
從90 年代到現在,3D 內容本身並沒有消亡,只是沒有成為互聯網內容形態的主流敘事而已,文字、圖片和視頻才是鎂光燈下被注視的「明星」。在一些「縫隙」中,3D 內容尋找著自己價值創造的空間。
由於3D 可以非常好地表達和展現事物的複雜結構,小到病毒的形態還原,大到城市的規劃設計,對此都有著比較強的需求。而用3D 這種方式展現房屋結構,進而實現VR 看房,目前已經是一個非常成功的商業落地方向了。
另外,3D 可以實現優秀的仿真模擬,這個價值無法被低估。美國密歇根大學教授邁克爾·格里夫斯在其著作《智能製造之虛擬完美模型》探討了「數字孿生」之所以能夠實現價值創造的本質:我們可以通過在計算機上進行仿真模擬,用信息來替代浪費的資源,實現預測和推演,從而獲得所期望的結果。
比如在工業設計領域,以數控機床自動加工為核心的工廠,需要高精度的3D 數據模型,它能夠實現較好的仿真效果,可以在產品生產之前做出「數字樣機」,去做很多前期數據的驗證和模擬,從而減少浪費,進一步提高效率。此外在影視遊戲產業中,對於擬真也有非常大的需求。
3D 內容在增量價值創造上,打開了時間空間的可能性,最終通向的是在虛擬世界打造一個大規模可實時交互的空間。
此外,和2D 相比,3D 在人機交互的可選方式和復雜度上升了一個數量級,這打開了更多商業的可能,比如各種3D 虛擬時尚。
雖然長期來看VR 和AR 將可能是元宇宙的最終硬件入口,但3D 內容本身的展示並不依賴於VR 和AR 設備。今天絕大多數的3D 內容的展示,依然依託於VR/AR 以外的終端進行。
3D 內容挑戰:大規模和低成本
目前,Roblox、Decentraland、The Sandbox、Horizon Worlds……這些已經擁有很強影響力的元宇宙平台,從內容的特點來看,都是低精度3D,相對較為粗獷,缺乏細節。
2022 年8 月,為了慶祝Meta 的元宇宙平台Horizon Worlds 在法國和西班牙推出,扎克伯格發出一張在VR 社交平台Horizon Worlds 的自拍照片,被嘲諷其精度與20 多年前的遊戲無異。而這正是當下元宇宙內容的瓶頸——如何才能生產出更大規模和低成本的高逼真3D 內容。
具體來說,3D 內容本身有兩個非常核心的環節:內容生成,以及交互呈現。二者在技術本身的成熟度和成本方面都有很大的挑戰。過去,除了仿真行業應用外,只有在遊戲和動畫影視領域等市場規模較大的高毛利行業能有較大規模的應用。
目前圍繞著3D 資產生成的不同技術路線中,
第一種是基於各種硬件設備進行掃描,而後進行三維重建。比如,Matterport 和眾趣科技都聚焦在將現實世界的空間轉換為虛擬空間,具體落地的應用包括VR 看房、工廠數字孿生等。目前成本依然較高。
第二種是3D 創作工具。可以分為兩大類:3D 軟件和3D 引擎,主要用於製作3D 內容以及各類應用,比如動畫和各種遊戲。值得一提的是,以前的遊戲引擎沉澱了大量的內容製作能力,目前在往VR、數字孿生城市以及智能座艙等方向延伸。但其問題在於,操作門檻極高,往往需要專門的教程。
第三種是生成式AI。從文本、圖像再到視頻生成,諸如GPT-3、DALL-E 和Stable Diffusion 等生成式AI 模型的出現,打開了更多內容創作的可能性。2022 年,成立僅兩年,Stable Diffusion 背後重要的支持公司Stability AI 宣布完成了1.01 億美金的種子輪融資,估值達10 億美金。AIGC(AI Generated Content,人工智能生成內容)成為了投資熱詞,2022 也被視為AIGC 元年。
AIGC 在圖片生成已經取得了非常驚豔的進步,但在3D 內容生成上,依舊挑戰重重。
此外,在3D 內容的呈現上,面臨著非常大的算力挑戰。虛擬場景如何動起來——比如超寫實的三維數字人如果是動態交互,也需要非常龐大的計算量。目前用雲端解決算力問題的方案發展非常快,但是依舊成本高,效果難以保證。
最後一個制約元宇宙發展的瓶頸,是3D 內容資產的互操作性問題。數量眾多的3D 內容創作工具在歷史發展中,形成了超過幾十多種不同的文件格式,互相割裂,想要試圖通過發展自己的格式,形成閉環生態圈。
這帶來了很大的問題: 3D 內容和應用的製作複雜,需要在不同工具之間來回導入、修改、編輯和導出,格式的複雜提升了內容創作的難度。顯然,這無法滿足元宇宙對於3D 內容規模化的需求。
工業元宇宙:數字孿生提效現實產業