大家都知道剛剛過去的2023年中AI被評為年度熱詞,其中OpenAI功不可沒,其推出的Chat-GPT一炮而紅,微軟的Copilot、谷歌的Bard、文心一言、通義千問等其他AI產品緊追在後,各家企業共同創造了AI的第一波浪潮。
今年剛開年,蘋果Vision Pro的發售為XR領域帶來了「空間運算」的概念。蘋果的熱度還未消退,OpenAI推出的Sora就帶來了AI的第二波浪潮,而在這波濤滾滾的AI浪潮中,我們似乎看到了蘋果與OpenAI「聯動」的未來雛形。
Sora掀起了AI的第二波浪潮
OpenAI在2023年推出了Chat-GPT,自此掀起了第一波AI熱潮,許多大廠也攜帶著自家AI產品紛至沓來。你方唱罷我登場的現象讓大模型加持的AI浪潮徹底成勢,而現在,OpenAI的Sora又成功掀起了AI的第二波浪潮。
Sora取自日文單字,意思是“天空”,引申意義還有“自由”。在Sora官網頁面,無數紙飛機在自由飛翔,行動自主,最後匯集成一片天空的背景色。
Sora的核心技術在於其先進的文字轉視訊轉換演算法與對現實物理世界的高理解。使其能夠精準理解輸入的文字描述,並自動產生與之相符的高品質影片。Sora讓「一句話(prompt)產生影片」成為可能。這種能力的震撼之處在於,當 Sora在模擬物理世界時,能夠更準確地反映出現實世界的複雜性和多樣性。在OpenAI發布的宣傳影片中,Sora展現了出色的圖像生成能力和流暢的影片編輯技巧,無論是細節刻畫還是整體風格把握,都展現出了極高的水準。
其實先前並非沒有類似的文生影片AI工具,曾經以「富二代、美女、高材生、創辦人」多種網紅標籤而爆火的Pika Labs也讓AI界震驚了一把。但不論是它還是Runway、Pika、SVD(Stable Video Diffusion)、谷歌和Meta等眾多同類產品,都只是小範圍的“驚艷”,直到OpenAI下場才成功掀起AI的第二波熱潮。
這場AI的浪潮滾滾而來,途中竟然與蘋果Vision Pro來了一次跨界「連結」。
AI浪潮助推Vision Pro生態
蘋果Vision pro發售後,一躍成為迄今最先進的虛擬實境和擴增實境眼鏡,蘋果公司稱之為「空間運算設備」。OpenAI的創辦人兼CEO山姆·奧特曼評價:蘋果Vision pro是自iPhone以後第二驚人的技術。
Vision pro出現讓空間運算這個詞以現實方式完美呈現,簡單地說是將周遭的現實物理世界和虛擬世界無縫整合,實現毫無違和感的沉浸式互動體驗。其中的空間視頻功能更是讓眾人深感震撼,在“蝴蝶落在指尖”的演示中Vision Pro能夠準確地為每個人確定他們的手指所在的位置,並使蝴蝶準確地落在他們的指尖上。一個評測者形容:「你甚至可以清楚地看到指尖上蝴蝶的觸手和絨毛,這讓我感覺有點起雞皮疙瘩」。
每個空間影片都帶給人們一種獨特的沉浸感,但可惜的是虛擬世界的搭建上和3D電影沉浸式影片照片體驗,現階段都是基於VisionPro頭顯專用串流資源(至今為止可以訪問僅150 深度的3D娛樂項目),且需要依賴強大的虛擬世界搭建引擎和海量可支援3D的視頻模型資源, 哪怕是內置的3D攝像頭可以拍攝照片或視頻,但也需要用戶自主去捕捉拍攝,才能實現進一步呈現。而這一切的資源限制,隨著openAI Sora近期發布,讓一切限制有了突破的可能性。
有位github網友AndrewMayne就將OpenAI 發布的案例影片轉化成了適用Vision Pro 的空間影片。AndrewMayne 創建了兩個視訊軌道,一個用於左眼,一個用於右眼,並根據視訊移動的方向稍微改變了軌道的時間。這會建立模擬立體3D 效果,並且僅適用於存在橫向運動的影片。為了將影片轉換為適用於Vision Pro 的Apple Spatial 影片格式,其使用了Mike Swansons 的空間影片轉換工具。
Spatial 是一款免費的macOS 命令列工具,用於處理MV-HEVC 影片檔案(目前由iPhone 15 Pro 和Apple Vision Pro 拍攝形成)。它將MV-HEVC 檔案匯出為常見立體格式(例如上/下、左右以及單獨的左眼和右眼影片),可與標準立體/3D 播放器和影片編輯器一起使用。它還可以製作相同立體格式的MV-HEVC 視頻,以便在Apple Vision Pro 和Meta Quest 等XR 硬體設備上播放。
最後經過轉換的Sora影片在蘋果Vision Pro上的實際表現也不差,雙眼視差能夠很好的營造立體感,讓人更加身臨其境。但終歸是網友突發奇想的操作,加上Sora目前尚不完善,所以相較於Vision Pro 或iPhone 15 Pro 直接拍攝的太空影片給人的「空間體驗」還是有著不小的差距。
單從空間視訊相關參數、以及實際觀影3D 深度、清晰度效果來看,作為原生工具的Vision Pro 顯然更勝一籌。而iPhone 15 Pro 的優勢則主要體現在其便攜性上,隨時隨地可以拍攝空間影片。實際在Vision Pro 上觀看的沉浸感效果與清晰度也相當不錯,遠大於在手機上直接觀看的形式,層次感也比較分明。而透過AirDrop 還能一鍵投送到Vision Pro 上,傳輸方式暴力簡單。
但其需要親自拍攝的特色也限制了影片的內容,身為普通人的我們顯然無法拍攝到一些宏大且酷炫的影片畫面,但AI卻存在著無限的可能性。不論是海邊優美的風景還是太空激戰的畫面,對AI來說都不算什麼難題,而我們也能夠在太空影片中自由的探索奇幻世界。
觀看美國著名成人科幻情境喜劇動畫《瑞克和莫蒂》的朋友們應該還記得,動畫中的天才科學家瑞克是一個害羞的如廁者,為了不被打擾和享受如廁,他特意建造了一個風景優美的星球,在這顆只屬於他一個人的星球進行如廁活動。而戴上Vision Pro後開啟虛擬場景後,一般人在如廁時也能看到極光環伺,山川幻景,在上水潺潺間,洗滌時間的污穢。
儘管目前利用Sora 等AI 大模型產生的影片、一般影片透過轉換後,缺乏一些層次與深度,在實際觀看中並不是很特別清晰與沉浸。但這些問題不會永遠存在,隨著Sora等AI工具的逐步完善,其量產化、客製化、低門檻的特性將會進一步被放大,從而有效填補XR裝置中空間影片的空白市場。
蘋果與AI的「連動」不只空間視頻
目前的蘋果Vision Pro算是一款純粹的MR類空間運算設備,應用生態中並無太多AI的融合,但在AI的浪潮的衝擊下,蘋果Vision Pro也將會積極擁抱AI,這並非盲目揣測,而是早已有跡可循。
2月4日,OpenAI透過X平台的官方貼文向世界宣告:用戶現可在vision OS暢享ChatGPT應用,體驗未來科技的魅力。這款應用程式在視覺展示上保持了與iPad版相似的清晰介面,儘管未專門為visionOS打造獨特風格,但在沉浸式頭顯中的表現仍然令人期待。值得一提的是,根據外媒VentureBeat報道,visionOS版的ChatGPT接入了OpenAI最新的GPT-4Turbo模型,這項升級不僅提升了對話體驗,還以更低的成本、更高的反應速率展現出超凡能力。
在蘋果Vision Pro的應用中加入ChatGPT只是對AI的初步擁抱,許多應用可以透過更好的方式與AI進行融合。在Vision Pro中,德國djay音樂軟體和蘋果音樂一起聯手打造了全新的djay版本,用戶可以在一組虛擬的3D轉盤上,透過移動唱針進行不同節拍的混音製作;還有iPadOS版的DAW錄音軟體,為專業音樂人士提供即時錄製和演奏。
這類應用可以與AI音樂生成工具Suno進行融合,例如,可以先利用Suno輸入相關提示詞生成AI歌曲,之後通過Vision Pro上的音樂軟體進行調整與進一步製作,最後使用Pika、PixVerse或者Sora生成視頻,就能創作出一種AI版的音樂MV。
這種AI與XR設備結合的發展方式似乎在最新一期的Power On中得到了證實,彭博社的馬克·古爾曼表示蘋果正在考慮是否要開發智能眼鏡,其中,所述設備可以作為蘋果實現長期夢想的墊腳石。
蘋果Vision Pro的領先是有目共睹的,身為亞洲最大蘋果產品集散地的華強北也在努力追逐蘋果的腳步,但在科技不斷飛躍式前進的當下,曾經山寨機的輝煌歲月似乎愈發的一去不復返了。
AI或將成為華強北XR設備的新出路
在電子消費產品近乎創新停滯、消費動力嚴重不足的背景下,Vision Pro的出現為電子消費市場注入了一劑“強心針”,對虛擬實境硬體和軟體的升級無疑將起到巨大的引導和刺激作用。而如此熱鬧的科技圈「盛會」自然少不了華強北的身影。
一家名為深圳億境虛擬的公司趕在Vision Pro正式發售的時候推出了高仿版Vision Pro,為其迅速帶來了熱度。該產品在外型明顯復刻Vison Pro,能提供的功能較為基礎,也較少,不過售價僅1000多元,還不到Vision Pro的零頭,這是其主打的優勢。
在推出「高仿版」Vision Pro前,華強北正逐漸失去其往日的喧囂,許多路過的行人或進去的消費者對此深有體會,空蕩蕩的過道,緊閉的捲簾門,安靜的市場,走在裡面,能看見不少旺鋪出租的標籤。而如今依靠「高仿版」Vision Pro的熱度,華強北似乎也變得熱鬧了起來,但是蘋果較高的技術壁壘讓華強北的廠商們很難復刻出較為出色的可替代產品。
但這本來就是華強北最大的弱勢,與其糾結如何彌補短板,不如發揮自身的優勢,也就是低價滲透作用。
當初的蘋果AirPods發佈時,過於激進的產品設計讓其一經發布就遭遇冷嘲熱諷,過高的定價更是讓消費者望而卻步。但華強北卻憑藉獨到的眼光找到了屬於自身的出路,50-200元的高仿版AirPods利用低價不斷滲透並改變著消費者的使用習慣,而這也為蘋果AirPods的成功起到了一些滲透性的作用,時至今日華強北的AirPods仍依舊有大批消費者。
作為電子消費市場的風向標,華強北一直是科技潮流的跟隨者。
2016年被虛擬實境概念點燃的VR眼鏡潮流中,在淘寶搜尋“VR眼鏡”,大多設備都是價格不到100元的“VR 3D虛擬實境眼鏡”,這些設備大概有一半來自華強北。當時深圳VR設備每個月的出貨量至少有500萬台,而這個數字比幾大頭部VR設備製造商的銷量總和還高。數據顯示,2016年年底,Oculus Rift的預估銷售量將達到35萬台,HTC Vive的銷售量為42萬台,GoogleDaydream設備銷售45萬台,索尼PlayStation VR的表現最好,累計銷售量將達到260萬台。
從上述數據可以看出,在國內,大部分消費者首次接觸虛擬實境技術,正是透過這些來自華強北的低價VR盒子。華強北借助這場風口的薄利多銷,不僅賺的盆滿缽滿還催生出了VR硬體設備的產業鏈,華強北之所以能迅速推出Vision Pro的山寨產品,與此脫不開關係。
儘管這次的高仿版Vision Pro並未複製2016年VR爆火的盛景,但AI的浪潮或許為華強北帶來了新的出路。不論是Chat-GPT這種AI大語言模型還是Sora、Pika這種文生視頻的AI產品,如果將其植入到設備中或許比起想方設法跨越蘋果的技術壁壘來說反而是一種「捷徑」。
學習國內XR廠商的打法,專注細分領域,利用自身的XR設備供應鏈,再植入AI工具,將產品打造成更適合消費者的入門式XR設備,反倒是一條更容易成功的新出路。既然要高仿,不如全都仿,像《幻獸帕魯》一樣,做個「究極縫合怪」。
寫在最後
從生成式人工智慧文字對話工具ChatGPT、影像產生器DALL-E,到影片生成的王炸Sora,OpenAI 正在重塑網路內容生產形式。
蘋果Vision Pro則帶來了針對XR領域的空間運算革命,將人們的現實體驗提升到了一個全新的層次。透過結合3D 空間場景與混合實境的內容展示形式,它不斷地挑戰和刷新人們對於視覺認知的界限。
從目前來看XR設備似乎更像是一張巨大但尚未拼好的拼圖,不論是ChatGPT和Sora掀起的AI熱,還是高通研發的XR晶片,抑或是蘋果Vision Pro的推出等等,都在各自的領域拼接著他們的那塊拼圖,而最終將組合成一起促成XR的藍圖,成就元宇宙的虛擬實境時刻。(元宇宙新聲)