關注AI大模型的三大應用場景

2024/05/06

•

過去，人工智慧往往局限於特定領域，而大模型憑藉其強大的規模擴展性和多任務適應性，打破了這些壁壘，推動人工智慧進入新的發展範式。大模型技術引領的新範式，正在推動人工智慧走向“通才”，並加速其與各個行業的深度融合，催生眾多創新應用場景，推動眾多傳統行業走向人工智慧+。

4月27日，中國信通院人工智慧研究所副所長魏凱在「算力中關村」技術成果對接交流專場活動上發表《人工智慧+的廣闊前景與落地之路》的主題演講。他指出，近年來，以Transformer為代表的大模型技術在語言、視覺等領域加速突破,推動人工智慧進入了一個新的發展範式。魏凱表示，人工智慧進入新的範式有幾個特點，第一個特點是規模可擴展性強，第二是多任務適應性很強，第三是持續學習。

大模型在各行業的突破，不僅在語言模型上，在其他領域的突破，更值得大家去重視，大模型與行業知識深度融合,將催生眾多創新應用場景,形成新的增長點。

魏凱表示，人工智慧和產業融合的前景，也就是我們國家提出的人工智慧+的場景，是非常豐富的。

兩個方向來看，一個是TO C的，一個是TO B的。在消費端大模型應用中，辦公室、圖片產生和對話類產品佔比合計達60%，提升工作效率成為首要目標。 TO B方向主要面向企業價值鏈的各個環節，包括研發、生產製造、經營管理、行銷服務和智慧產品等，大模型在這些領域都擁有龐大的應用空間，可以提升效率、降低成本，並推動產業升級。軟體工程是To B 領域應用的典型案例，大模型技術正在深刻改變軟體產業，顯著提升軟體開發和測試的效率。

但大模型應用規模化落地仍存在諸多挑戰，他強調，推動人工智慧深度應用，應全面加強平台建置、資料治理、營運管理、風險管控四大支柱建置。

關於大模型和其他領域的融合，會上，魏凱具體指出了三個方向。

其一是AI大模型在自動駕駛領域的應用。特斯拉在美國開放了自動駕駛的第12版FSDV12，免費給大眾使用一個月，這個技術是在去年的8月份就研發完成了，它的底層用的是Transformer，和ChatGPT是一個技術，不僅是特斯拉在做，上海人工智慧實驗室在文章上也證明了在端到端上來做Transformer也是可行的，這條路在深刻改變自動駕駛的技術路線。

數位開物查詢公開資訊獲悉，上海人工智慧實驗室、武漢大學、商湯科技團隊共同發表的論文《Planning-oriented Autonomous Driving》（以路徑規劃為導向的自動駕駛）首次提出感知決策整合的自動駕駛通用大模型UniAD。

UniAD自動駕駛模型透過其統一的架構設計，有效地整合了全端自動駕駛的關鍵任務，利用Transformer模組和查詢向量建模技術，實現了高效的物件互動和路徑規劃，尤其是預測和規劃效果遠超其他模型。 UniAD在感知決策一體化、多目標追蹤準確率、複雜場景下的表現以及三維目標檢測等方面展現出了明顯的優勢，更是表明基於Transformer 的端到端自動駕駛技術路線具備可行性，為自動駕駛領域的研究和發展提供了重要的指引和設計想法。

其二是AI大模型在氣象科學領域的應用。Google和華為近期分別在Nature 和Science 雜誌上發表文章，證明氣象預報除了傳統的數值計算和超級電腦方法外，還可以利用基於數據驅動的大模型進行預測，該模型只需輸入歷史數據，無需氣象科學家的干預，即可快速、低成本地預測未來天氣狀況。

今年國內一些科研機構也報告稱，大模型在氣象預報方面取得了突破性進展，空間分辨率達到了9 公里，這是歷史上從未有過的精度。這項突破性的進展令人矚目，為氣象預報領域帶來了新的可能性。

數位開物了解到，在氣象科學領域，2023 年7 月，Google發布了GraphCast，這是一個基於圖神經網路的氣象預報大模型。 GraphCast 將地球表面劃分為不同的節點，並根據地理位置和大氣動力學關係建立圖結構，並使用圖神經網路(GNN) 對圖結構進行學習，提取節點之間的關係特徵和大氣動力學特徵，根據學習到的特徵，預測未來不同時間地點的氣像要素，例如溫度、降水、風速等。 GraphCast具備高精準度、快速預測、可解釋性強的優勢，適用於複雜地形及局部地區預報。

同時期國內，華為雲研發團隊也推出的基於AI 的氣象預報模式－盤古氣像大模型。盤古氣像大模型採用3D 深度學習網絡，能夠更好地捕捉大氣三維結構和動力過程，並利用數據同化技術將觀測數據（如衛星遙感數據、地面氣象站數據）與模型預測結果進行融合，提高預測結果的可靠性。盤古氣像大模型在短期和中期天氣預報方面展現出超越傳統數值預報模型的精度，能夠更精確地預測降水、溫度、風速等氣像要素，除此之外還可以用於極端天氣事件預測以及氣象變化研究。

AI 技術在氣象領域的重大突破，為氣象科學研究和應用帶來了新的可能性，在天氣預報、極端氣象預警、氣候變遷研究等方面具有廣泛的應用前景。

其三是AI大模型在機器人領域的應用，幾個典型案例：美國一家機器人公司Figure和OpenAI 合作，將GPT-4 整合到機器人中，實現大模型對機器人行動和人機互動的控制。在GPT出現的不長時間，Google就開源了名為RT-2 的機器人Transformer 模型，該模型是RT 的第二個版本，它將機器人的控制指令分解為不同的子任務，並利用語言模型進行處理。特斯拉的擎天柱機器人也採用了Transformer 架構。

數位開物了解到，RT-2 (Robotic Transformer 2) 是GoogleAI 團隊於2023 年3 月開源的一種基於Transformer 架構的機器人控制模型。 RT-2 可以處理多種模態的輸入，包括影像、文字和機器人狀態訊息，並且能夠將自然語言指令轉換為機器人動作，實現更靈活、更聰明的機器人控制。 RT-2 可以在多種機器人應用場景中發揮作用，例如家用機器人、工業機器人、醫用機器人等。

特斯拉於2023 年9 月發布的第二代人形機器人Optimus Gen2，整合了更先進的AI 技術，包括基於Transformer 的模型，使其能夠更好地理解環境、執行任務並與人類互動。美國機器人公司Figure的Figure 01機器人基於OpenAI的大模型，可以做到描述其視覺體驗、規劃未來的行動、反思自己的記憶、口頭解釋推理過程。

去年以來，AI 大模型技術在多個領域取得突破性進展，人工智慧進入新發展階段。同時，AI 與經濟社會的融合程度與速度也顯著提升，展現出巨大的發展潛力，引領產業變革，為產業升級注入強大動能。(數位開物)