在過去的十年裡,人工智慧(AI)技術已經從理論研究和小規模應用邁向全球性的技術革命,徹底改變了我們生活和工作的方式。無論是智慧型手機上的語音助手,還是複雜的數據分析和自動化生產線,AI 的影響無所不在,其帶來的效率提升和成本降低正推動著一場前所未有的生產力革命。
為了搶佔AI 生產力的先機,不少品牌都快馬加鞭拿出了自己的AI 硬體:有的手機品牌利用AI 技術消除拍攝照片時的運動拖影,有的用AI 去除圖片中不想要的元素,有的企業更是搶先一步發布所謂的「AI PC」標準。
這麼一對比,低調行事、默默耕耘的NVIDIA 似乎有些不合群。為了改變這一「酒香巷更深」的局面,NVIDIA 近年來也在努力增加自己在AI 領域的曝光機會,想辦法讓更多的用戶意識到NVIDIA 在遊戲顯示卡之外的領先技術—— 2024 年4 月24 日,NVIDIA 在深圳舉辦了名為RTX For AI 的線下交流會,讓大家能親身體會NVIDIA 是如何「撐起AI 半壁江山」的。
儘管NVIDIA 不是第一個提出AI 這一概念的企業,但從產品和技術的角度看,包括AI 在內的眾多計算機歷史性節點,背後都或多或少有著NVIDIA 的支持:2008 年,NVIDIA發布了GeForce 8800 GTX 顯示卡。
很明顯這張顯示卡的效能放在現在早已不值一提,但這張顯示卡上,NVIDIA 提出了「CUDA」(統一運算架構)這個概念。 CUDA 的出現讓GPU 不僅可以用來處理圖形運算,還可以用來執行、加速基於CUDA 的通用運算,讓電腦成為真正的「通用工具」。
除了CUDA 外,NVIDIA 在2018 年還進一步對GPU 的算力進行「細化」,引入了RT Core、Tensor Core 的概念,讓光線追蹤和專門的ML 計算成為可能——Tensor Core 透過高效執行大規模矩陣運算,顯著加快了AI 模型的訓練和執行速度。深受NVIDIA 用戶喜愛、可以顯著提高遊戲FPS 的DLSS,就基於Tensor Core 來實現,可以說是廣大遊戲玩家最早接觸到的「真AI」用例了。
在AI 時代出現之前, NVIDIA 就開始想辦法用Tensor Core 實現AI 功能,加速了AI 時代的到來;那麼和6 年前的自己相比,現在的NVIDIA 在AI 領域又實現了怎樣的技術飛躍呢?
根據NVIDIA 的介紹,現階段RTX AI 已經對10 種不同的AI 場景實現覆蓋,分別為:AI 繪畫、AI 平面設計、AI 視訊編輯、AI 3D 創作、AI 視訊體驗、AI 會議、AI 文件助理、AI應用開發、AI 遊戲和AI 遊戲開發。
儘管這十大場景各有不同,但他們對電腦有著共同的需求:算力。而出色的算力,正是RTX 硬體的最廣為人知的特性。
毫無疑問,和6 年前剛發布RTX 顯示卡、引入Tensor Core 時相比,效能是NVIDIA 在AI 領域最容易看到的提升。以最常見的文生圖(T2I)用例為例,有試過在自己電腦上部署StableDiffusion 等模型的朋友應該知道,當前絕大多數模型或多或少存在“命中率低”的問題,導致用戶需要用同一組關鍵字反覆產生影像,用類似手遊「抽卡」的方式來產生自己想要的圖片。
針對這種「抽卡」的場景,NVIDIA就在分享會上展示了其旗艦消費級顯示卡RTX 4090D 的強大性能:基於TensorRT 的加速功能,RTX 4090D 最快可實現120fps 的StableDiffusion 影像生成。
不知道大家有沒有發現一個細節,在剛剛提到的十大場景中,NVIDIA 把AI 繪畫和AI 平面設計區分開了。這並不是NVIDIA 想用更多的用例撐起場面,而是因為AI 繪畫與AI 平面設計其實標誌著AI 技術的兩個不同的階段:
以文生圖為代表的AI 繪畫,由於命中率較低,使用者需要不斷產生大量圖片來「抽卡」,才有可能得到自己想要的成品。而這種「不可控性」意味著這些AIGC 作品的用途非常有限:要麼用於娛樂,要麼用來給設計師找靈感,或者充當訓練AI 的物料。
但真正用於「生產力」的AIGC 卻容不得這種「不確定性」,畢竟誰也不想用AIGC 向客戶展示時裝上身效果時,AI 在衣服上生成三隻手;或者設計師用AI 向客戶講解室內裝潢風格時AI 把屋頂複式豪宅畫成地下室。
換句話說,能否實現對AIGC 的精細控制,會是區分「娛樂AI」與「生產力AI」的最大差異。
我們知道,「娛樂AI」主要用於提升使用者體驗和互動性。例如,在電玩遊戲、社群媒體和線上娛樂等領域,AI 被用來推薦內容、生成音樂、模擬對話等。這類AI 的核心目標是增強娛樂性和參與度,而不那麼專注於輸出的嚴格性和可預測性。這類AI 生成的藝術作品或音樂不需要符合嚴格的商業應用標準,其創造性和新穎性更為重要。
相較之下,「生產力AI」則應用在較嚴格且要求高的商業及工業環境中,如製造業、醫療、金融分析等。在這些領域中,AI 的任務是提高效率、減少成本和錯誤率,以及提供可靠的決策支援。例如利用AI 在醫療診斷中用於分析影像和識別疾病模式,這要求極高的準確性和可靠性。在這些應用中,精細控制不僅關乎AI 系統的效能,更關乎其決策品質對人類生活的直接影響。
在分享會上,NVIDIA 也示範了一個「生產力AI」應有的樣子-即致AI。作為一款面向建築設計領域的AI 應用,即致AI 提供了多種適用於不同建築風格、場景的預訓練AI 模型,同時基於RTX 硬體的強大性能,即致AI 能以近乎零時延的速度將設計師的導入草圖或繪製的線條進行AI 生成,以近乎即時的方式為客戶講解建築外部設計內部裝修風格。
當然了,剛剛提到的用例只不過是NVIDIA RTX 在AI 領域應用的一小部分。從偏向娛樂性質的文生圖、DLSS 3.5,到改變遊戲互動方式的NVIDIA ACE、聲音克隆,再到改變創作模式的AI 影片剪輯、改變工作模式的Chat with RTX,無論是遊戲還是工作,AI 技術早已滲透到我們生活的各個層面。
在分享影片創作過程中AIGC 的具體應用時,著名影片特效團隊「特效小哥Studio」也提到了一個非常有趣的觀點——用AI 來解決AI 遇到的問題。據他們分享,在重建AIGC 圖片的景深時,他們沒有選擇用傳統的人工標記深度圖,而是直接把圖片丟給AI,讓AI 繪製AIGC 的深度圖,並將結果輸出給另一個AI 模型。
這個「用魔法打敗魔法」的解決方案,在我看來不僅僅是AIGC 行業化,正規化的標誌,同時也是未來AI 的發展方向之一。
首先,AI 模型的訓練需要大量的計算資源,由於高品質數據的獲取往往成本高昂且不易實現,使用合成數據生成技術如生成對抗網絡(GANs)可以創造大量逼真的訓練數據,這對於提升AI 系統的訓練效率和效果非常有幫助。此技術不僅可用於生成影像數據,也能擴展到文字、音訊甚至是虛擬環境的生成,大大豐富了資料來源,為AI訓練提供了更多可能。
其次,AI 模型的解釋性也是一個重要的技術挑戰,因為許多高效的模型如深度神經網路往往像黑盒子一樣,難以理解其內部的決策邏輯。透過發展解釋性AI 技術,可以使模型的決策過程更加透明,增加使用者的信任,同時也方便開發者找到並改善模型的不足。
從長遠的角度來看,解決這些技術性挑戰不僅需要更先進的演算法和模型設計,還需要在資料處理、模型訓練和實際應用之間找到一個平衡點,這將是推動AI 技術未來發展的關鍵。我們期待AI 能帶來更多便捷,同時也期待它能幫助我們以全新的方式解決舊問題。
而當AI 真正徹底解放人類生產力後,擁有無盡想像力的創作者與AI,一定能讓更多天馬行空的創意成為現實。(智慧Pro)