騰訊發布:影響2024年的十大科技應用趨勢

過去一年,我們見證了數位科技的加速度。每個人都身處變革巨浪之中,既對大模型的突破進展無比興奮,也對未來充滿了無限憧憬。

新年伊始,眺望未來2-3年的科技趨勢。我們正駛向一個由連結衍生互動、由運算催生智慧的時代。



高效能運算、量子運算、雲端運算和邊緣運算這"四大運算「融匯貫通,正催生全新的運算範式。

通用人工智慧漸行漸近,大模型走向多模態,AI智能體可能成為下一代平台, "AI科學家"有望加速問世。全球已達共識,AI治理將引領我們踏上更智慧、更安全的未來。

機器人演進加速,靈巧手讓人形機器人更敏捷、更像人。AI與生命科學的交融,將幫助我們洞察更多的生命奧秘。

我們會進入一個3D、全真在場的新世界。腦機介面不僅在醫療實現突破,正拓展至更多的互動場景。或許不久的將來,我們將親自見證意識上載從科幻成為現實。

手機衛星電話、垂直起降飛機將改變我們的緊急方式和出行模式。交通網、資訊網、能源網的整合,將推動智慧、綠色的能源變革。

未來已來,一個充滿韌性和重塑的全新時代即將揭開序幕。讓我們擁抱變革,共同譜寫人類與科技和諧共生的新篇章!


專家推薦:

在這個日新月異的變革時代,我們有幸見證並參與了數位科技的創新突破。特別是近年來,以大模型為代表的AI技術,讓我們看到了通用人工智慧的曙光,並有望大幅加速技術演進的步伐。


騰訊的2024數位科技趨勢,從連結、互動、運算和智慧四個維度,對100多項未來技術和重點方向給出了趨勢性判斷。從星地直連的衛星互聯網,到垂直起降飛機的未來交通網,再到能源、資訊和交通的多網協同,未來網路連接的廣度和深度都迎來無限可能。互動方式正在發生變革,數位互動引擎不僅讓虛擬世界更真實,也讓真實世界更豐富,未來全新的3D視界呼之欲出,腦機介面的新進展也帶來了更大的想像空間。計算無疑是各類智慧的底層基礎支撐,也成為當前競爭的焦點領域。而智能的升級,不僅會為機器人注入具身智能,也為微觀世界的基因運算帶來新突破。預測未來的最好方式,就是創造未來。相信在產業各界的共同努力下,這些前瞻洞見會更快到來,從趨勢變成現實。

——丁漢

中國科學院院士


去年以來,以生成式AI為代表的人工智慧技術發展激盪人心,正引發智慧的元革命。可以遇見的未來,智力將會成為一種基礎設施服務,新的IaaS呼之欲出。類比摩爾定律,未來可能會出現新的智慧定律,對資訊世界、物理世界和生命世界帶來全方位的影響。

未來十年,AI會無所不在。首先,現有的各類應用可以用AI重新做一遍,新的互動變革、體驗創新將會帶來更新的智慧硬體、更多的智慧服務,孕育出比歷次工業革命都龐大的產業機會。其次,AI會成為各領域的底層操作系統,AI+機器人的具身智能,AI+生命科學的基因計算,AI+未來出行的自動駕駛汽車和垂直起降飛機,甚至AI+腦機接口的矽基和碳基結合的新生命體,都會一步步成為現實。最後,AI能力的提升也伴隨著風險的擴大,我們要充分發揮技術發明的智慧與掌握應用方向的智慧,讓AI科技更善良、更有創意,朝著強化人、成就人的方向可持續發展。

——張亞勤

中國工程院院士、清華大學智慧產業研究院(AIR)院長



01 重塑計算

趨勢一:高效能運算的“四算聚變”

算力,是數位時代的核心生產力。高效能運算,是先進算力的代表,它既包含了以高效能運算叢集為代表的傳統運算體系,也包含了像量子運算一樣的未來運算硬體和軟體。高效能運算在氣象預測、地質探勘、新藥研發、新材料研發、人工智慧等眾多應用領域發揮至關重要的價值,高效能運算技術的演進,引領整個電腦科學技術的未來走向,甚至可能引發劃時代的科技飛躍,值得產業和社會持續關注。

今年,全球迎來高效能運算設施的大規模新建潮和升級潮,以CPU 為運算核心的高效能運算1.0時代正在快速遠去,以CPU+GPU 為運算核心的高效能運算2.0已全面到來。

未來幾年,高效能運算技術將呈現四個面向的發展趨勢:系統架構方面,高算叢集、量子運算、雲端運算和邊緣運算的「四算融合」也將成為高效能運算3.0 演進的新方向;關鍵硬體方面,計算晶片將迎來多元化發展;軟體應用方面,雲端原生技術將帶來高算服務的普及,同時科學計算模擬應用將大量增加;可持續計算方面,業界將更多的關注運算的效能,並加速高能效運算技術的研發與探索。


一、高算集群、量子運算、雲端運算和邊緣運算「四算」融合,衍生新技術路徑

雲超同化。一方面,Web 服務、容器化等雲端原生技術正快速應用於傳統高效能運算集群,讓算力服務更易觸達:芬蘭LUMI 集群已開始引入容器技術提高算力調度和應用搭建效率,並對外提供算力服務;IBM 也在年初發布了其首台雲端原生高算叢集Vela;另一方面,不僅更多雲端服務商推出了高效能運算雲端服務,以Google為代表的頭部企業更進一步利用雲端計算天然的分散式運算優勢,推出「算力多切片訓練」方案,打造超越常規算力集群效能的超大規模AI 訓練案例。

量超融合。高效能運算叢集與量子電腦的融合已經成為產業共識,量子運算單元(QPU)正逐漸成為新的專用運算加速模組。要全面實現以CPU+GPU+QPU為運算核心的高效能運算3.0 ,大致要經歷三個階段:第一階段,高算叢集與量子運算的網路互聯;第二階段,互聯的高算叢集與量子電腦可以透過專用的作業系統實現算力協同調度;第三階段,高算集群和量子計算之間實現從底層硬體到上層應用的深度系統集成,並能充分發揮各自的算力優勢,共同完成複雜的計算任務。如IBM 、芬蘭VTT 技術研究中心、本源量子等國內外的相關機構和企業已經開始相關研發工作並陸續發布了進展,並對外提供訪問服務。

量子集群出現、雲端服務普及。量子運算領導企業IBM於2023 年12 月公佈全球首個可擴展量子運算系統Quantum System Two,引進模組化架構與電腦叢集設計,可讓系統容納10,000 個量子位元。模組化量子運算集群的出現,預示著可複製性更強、擴展性更好的量子電腦發展新路徑;同時,全球已有超過20 家機構推出量子運算雲端服務,從整機公司如IBM,發展到雲端服務商如亞馬遜雲,再到科研院所如北京量子院。

高效能運算走向雲端協同。目前高效能邊緣運算(HPEC)還在成長中,其單點算力已可達千萬億次每秒,自動駕駛和機器人是典型應用場景。除傳統運算平台外,神經形態晶片、光電運算晶片等新技術的成熟也不斷提升邊緣算力與能源效率。而為獲得即時決策以及更高的資訊安全環境,將部分資料處理、模型訓練以及推理等工作,從資料中心/雲端平台遷移到雲端協同架構下,是必要的技術路徑。


二、高性能晶片多元發展,QPU 發展由數量轉向質量

晶片技術多元化發展加劇。首先包括微軟、 Meta 在內的科技企業紛紛推出自研高效能CPU 和AI 加速晶片,其次,除了傳統的x86 架構以外,其他晶片架構的晶片也加入到高效能運算領域,並由落地應用:位於葡萄牙的集群Deucalion 將採用與日本富嶽集群相同的ARM 架構高性能晶片A64FX;算能科技日前向山東大學交付國內首台RISC-V伺服器集群,該集群擁有48顆RISC-V高性能晶片SG042。

存算一體,突破「內存牆」。傳統晶片均採用馮諾依曼運算架構,改架構的「記憶體牆」問題隨著算力的不斷提升而越發明顯,逐漸成為晶片效能進一步突破的瓶頸。業界紛紛採用存算一體技術思路,提升現有晶片效能的同時,研發神經形態運算晶片,探索「破牆」之路。Intel 、 AMD 和英偉達紛紛在各自最新的晶片產品中引入HBM 和LPDDR 等近存計算(Near-Memory Computing)技術;而神經形態計算(Neuromophic Computing)被認為是“後馮諾依曼時代”突破“記憶體牆”的重要計算技術路徑。受人類大腦原理的啟發,神經形態運算晶片透過存內運算(Compute in Memory)方式,實現高算力的同時實現超低功耗。

量子比特製備路徑之爭將更加激烈。量子比特的製備,是量子電腦研發的起點。今年,超導量子、光量子、離子阱、冷原子等多條量子位元製備路徑都有不錯的進展,「誰是未來量子計算最終的技術路線」之爭將更加激烈。

QPU 發展數量與品質兼顧。雖然IBM 發布1000+量子位元QPU, Atom Computing 宣稱創造1000 +原子陣列,但IBM 最新發布的晶片互聯技術,以及哈佛大學和QuEra等聯合發布的邏輯量子位元製備和糾錯研究成果等,說明了QPU的發展,仍然處於追求比特數量和,以及關注諸如糾錯能力、可擴展性等更符合實用需求的技術。


三、雲端原生技術將釋放高效能算力潛能,科學運算模擬應用大量增加

雲端原生技術加快普及。從國內外雲服務商發布的進展來看,雲端平台容器服務將加快對高效能運算服務的支持,並進一步相容於CUDA、 ROCm 、 oneAPI 等平行運算軟體平台,為使用者提供高度自動化的高效能運算工作環境,大幅提升研發和實驗效率。高效能運算算力潛能將進一步被釋放。

科學計算模擬應用和成就將迎來大爆發。一方面,全球高效能運算叢集的大規模新建和升級、以及雲端原生技術應用,使算力服務更充足並更易觸達;另一方面,科學運算模擬的需求將更加強烈,未來幾年將會有更多的科學運算模擬是基於高效能運算服務開展:從微觀粒子模擬、到血流和癌細胞模擬、再到核融合模擬、以及氣象和地理空間模擬等等。進一步,科學計算與人工智慧技術的結合,將比預計的要快,許多傳統模擬數值演算法經AI 優化後,性能獲得大幅提升,科學家和科研團隊的生產力將迅速提高,科學研究將迎來快速進步的新形勢。

更多高效能運算集群嘗試人工智慧大模型研發。傳統高算叢集透過加裝GPU 叢集、結合雲端平台高效能運算服務升級後,將具備更強的AI 加速運算能力,進而可以支援人工智慧大語言模式的訓練。例如:智譜AI 的ChatGLM3支援在神威高算上運作;美國阿貢國家實驗室開始基於Aurora群集創建ScienceGPT,預計參數數量達到1 兆,將為廣泛的科學研究提供協助。

四、業界將加大永續高效能運算的實踐力度

高效能運算的能耗是驚人的。以TOP500 排名第一的Frontier 高算集群為例,其算力可達1.6EFlop/s,功率可達20 兆瓦,相當於近1萬戶家庭用電水準。根據統計,資料中心的耗電量約佔全球耗電量的1%,我國2020 年佔2.7%。雖然目前尚無準確的資料中心能耗預測,但急劇增加的人工智慧大模型訓練等高耗能運算應用,勢必會讓這個數字繼續增加。

永續運算,是數位經濟和雙碳目標背景下,高效能運算技術演進歷程中的路標和燈塔。擁有可持續高效能運算的技術,也將成為重要的競爭力。世界經濟論壇與今年發布的《2023 十大新興技術》報告,「永續計算」名列其中。Intel、IBM、英偉達等先進運算企業也在不遺餘力的實踐和推動永續運算。

永續計算通常指在設計、建造和使用電腦技術(包括硬體、系統、軟體)的過程中,力求實現最大的能源效率和對環境影響的最小化。未來,運算能源效率將成為評估高效能運算技術先進性的重要指標,而提高運算能源效率的途徑主要有三:更高能源效率的運算軟硬體、更先進的冷卻技術、以及更合理的運算供需搭配。

高能效的運算軟硬體方面,存算一體將是硬體層面主要的技術發展路徑,而機器學習等人工智慧技術與傳統科學運算的結合,將大大提升運算效率與精確度,並從軟體層面大幅節省計算資源。

冷卻技術方面,液冷技術,特別是浸沒式液冷技術將可加速普及,並帶來30%以上的耗能節約。

在合理的算力供需匹配方面,計算能效將成為高性能算力更重要的技術參數,而「量子效能」也將成為未來量子電腦研發和應用的重要評估指標。



02 智慧升維

趨勢二:多模態智能體加速AGI進程

剛過去的一年,注定是人工智慧發展史上具有里程碑意義的大年。生成式人工智慧的驚人進步,讓我們深切感受到未來AGI的巨大潛力與無限前景。

大模型從理解到生成,從感知到決策,能力不斷升。加上多模態、Agent、以及具身智慧等方向的探索,AI可望完成「感知—決策—行動」的閉環。


一、多模態解析世界的本來面貌,並實現“三生萬物”

多模態是人類世界的本來樣貌,AGI的發展趨勢一定是朝向多模態。技術將從文字、圖像、視訊(2D和3D),再到聲音、光、電,甚至分子、原子等各類模態,而且具備跨模態遷移的特性。未來理想的框架是「多模態的對齊和融合+ 統一的編碼器和解碼器」。12月6日微軟發布的Copilot中,將GPT-4V的視覺能力與Bing搜尋結合,為使用者提供更好的影像理解與生成體驗。7日,Google發布Gemini,主打原生大模型,無縫跨文字、圖像、視訊、音訊和程式碼。谷歌稱,Gemini是第一個在MMLU(大規模多任務語言理解)方面優於人類專家的模型,準確率達90%(人類專家為89.8%)。


二、從大腦到Agent,大模型從CoPilot副駕,走向主駕駛

比爾蓋茲近日撰文:AI Agent將是下一個平台,人工智慧即將徹底改變人們使用電腦的方式並顛覆軟體產業。在不久的將來,任何上網的人都將能夠擁有由人工智慧驅動的個人助手,遠遠超過今天的技術水平。智能體由四個主要部分組成,包括多模態大模型(LMM)、長期記憶(Memory)、規劃(Planning)和工具使用(Tool Use)。業界AI智能體愈來愈多,如微軟AutoGen,發表短短兩週內,星標量就從390增加到10K,並在Discord上吸引了5000多名成員。它允許多個智能體扮演各種角色,如程式設計師、設計師,或是各種角色的組合,僅透過對話就可以完成程式設計任務。


三、端側大模型加速部署,或將成為未來互動新入口

大模型正在向端側轉移,AI推理將在手機、PC、耳機、音箱、XR、汽車,以及其它可穿戴式新型終端上運行。端側大模型具有一些獨特優勢,如,本地資料處理效率更高,節省雲端伺服器頻寬和算力成本,對使用者資料更好的隱私保護,開啟更多互動新方式、新體驗等。

目前,一些手機已經在利用本地AI支援如暗光拍攝、降噪和人臉解鎖等功能。未來借助端側大模型,並結合向量化後的各類個人數據,使用者可以跟手機進行更流暢的交互,實現各種原生操作與功能。如,Humane 正式推出AI Pin,搭載GPT4,可實現語音交互,也可以投影在手掌上交互。高通推出驍龍8 Gen3 ,支援終端側運行100億參數的模型。蘋果最新的M3晶片支援端側推理,並計劃推出更智慧的Siri,為端側大模型生態做積極準備。

端側大模型應用具備三種可能性,首先是端側原生整合AI模型,類似siri,幫助使用者呼叫其他軟體,從而可能成為硬體新入口。其次,將大模型作為獨立app,例如MIT一位教授將開源模型整合在手機端做一個獨立app;第三,將大模型接入即時通訊軟體作為chatbot,例如What's App已經整合了Meta AI。


四、AI助力科研探索,貫穿科研全過程

在AI技術的加持下,科學研究的效率大增。透過理論探索、設計實驗、分析數據等方向為科學發現提供動力。AI與各個科學領域結合後,正在發生一場充滿潛力和挑戰的科技革命。

在理論探索階段,以ChatPDF為代表的LLM應用可以對既有文獻的梳理,加快科學研究資訊檢索的效率,在此基礎上提出新的研究問題,對現象和資料觀察提出某種猜想,幫助科學家發現新問題。

在數據分析階段,AI可以透過大量數據和複雜的數據分析,幫助提取有用資訊和填補數據缺失,從而提高數據品質和利用效率。降低對數據的依賴。在處理高度複雜和多變量的科學問題時,大模型能提供高效率的運算能力和深入的洞見。

在科學研究領域,生成式AI被用來預測基因序列、發現新的藥物標靶以及設計新型的生物材料。使用深度學習技術,研究人員能夠預測DNA和RNA結合蛋白的序列特異性。這是應用卷積神經網路(CNN)於基因體學的先驅性工作之一。如,麻省理工學院(MIT)的研究人員開發出一種擴散模型—FrameDiff,該模型能夠產生自然界中不存在的新型蛋白質結構。此模型可產生多達500 個胺基酸序列的蛋白質主鏈,且無需依賴預訓練蛋白質結構預測網絡。Nature雜誌近日報道,一個由AI 指導機器人製造新材料的實驗室A-Lab,只花了17 天就獨自創造了41 種新材料,展現了AI科學家的未來潛能。


五、負責任AI走向深入,價值對齊助力大模型穩健發展

隨著AI模型的能力日益更加強大,如何讓其行為和目的跟人類的價值、偏好、倫理原則、真實意圖之間實現協調一致,這個被稱為人機價值對齊的問題變得越來越重要。價值對齊對於確保人類與人工智慧協作過程中的信任與安全至關重要,已成為AI治理領域的關鍵任務,是大模型實現穩健發展和提升競爭力的必經之路。業界和研究界積極探索實現大模型價值對齊的多種措施,包括人類回饋強化學習、可擴展監督方法、訓練資料介入、可解釋AI方法、對抗測試、治理措施等等。

TIME雜誌將美國AI公司anthropic開發的AI價值對齊技術「原則型AI」(constitutional AI)評選為2023年三大AI創新之一(另外兩個分別為多模態AI、文生視頻技術),這足以顯示價值對齊已然成為AI領域的核心方向,其重要性正越來越被認識。實際上,在大模型加速發展引發關於有效加速(e/acc)還是有效對齊(e/a)的AI技術發展理念之爭的背景下,人們需要更加負責任地發展應用人工智慧技術,而關於價值對齊的技術和治理探索將推動負責任AI走向深入,確保人類與人工智慧和諧共生、有效協作的美好未來。


趨勢三:AI加速人形機器人「手、腦」進化

2023年10月20日,工信部印發《人形機器人創新發展指導意見》,提出人形機器人整合人工智慧、高階製造、新材料等先進技術,可望成為繼電腦、智慧型手機、新能源汽車後的顛覆性產品,將改變人類生產生活方式,重塑全球產業發展格局。特別是在關鍵技術突破方面,打造人形機器人「大腦」與「小腦」、突破「肢體」關鍵技術、健全技術創新體系。

《意見》也提出,2025年,人形機器人創新體系初步建立,「大腦、小腦、肢體」等一批關鍵技術取得突破,確保核心部組件安全有效供給。整機產品達到國際先進水平,並實現大量生產,在特種、製造、民生服務等場景中得到示範應用,探索形成有效的治理機制和手段。

目前,人形機器人技術加速演進,已成為科技競爭的新高地、未來產業的新賽道、經濟發展的新引擎,發展潛力大、應用前景廣。特別是在2023年以來,基於視覺-語言的大模型嵌入機器人本體,又為加速思考(「感知腦」)和執行(「靈巧手」)突破,推動機器人邁向智能化帶來新的可能。

2023年是人形機器人的“高光之年”,這一領域發生了一系列大事。7月,李飛飛團隊發布最新成果VoxPoser具身智慧技術,可以使機器人直接聽懂人類的自然語言指令並完成複雜任務,無需額外的資料和訓練。人形機器人Optimus快速迭代,商業化進程持續推進。特斯拉擎天柱的力控能力、抓取複雜物體的能力、利用FSD技術的視覺感知與處理能力。OpenAI投資了人形機器人公司1X,英偉達CEO黃仁勳也公開唱多「具身智慧」。微軟基於ChatGPT 自然語言理解與推理能力,產生控制機器人的相關程式碼。

根據Markets and Markets的預測,人形機器人市場規模可望從2023年的18億美元成長到2028年的138億美元,其複合年增長率可達50.2%。而高盛預測在最理想的情境下(產品設計、用例、技術、可負擔性和公共接受度等障礙被克服),2035年人形機器人市場或將達到1540億美元。

在人形機器人領域,有三個值得關注的趨勢:1.在思考能力層面,大模型的嵌入極大提升機器人感知環境、分解任務、規劃流程以及與環境互動的能力;2.在訓練平台方面,雲邊結合的分散式運算平台發展,強化了機器人的訓練和分析決策速率;3.在執行層面,以「靈巧手」為代表的關鍵技術,進一步強化了人形機器人末端執行應用能力,尤其是微操作、近操作等能力。

一、大模型在文字、自然語言和視覺領域取得重要突破,提升機器人的理解能力。

在ITF World 2023大會上,英偉達創始人黃仁勳公開表示,人工智慧的下一次浪潮將是具身智能,即能理解、推理以及與真實物理世界互動的智能係統。

在Chatgpt出現之前,大模型與具身智能領域的結合更多出現在感知層面,在海量數據集上預訓練的視覺模型,只是作為一種更好的表徵提取器來提升機器人在場景中的感知能力,而具體的規劃與動作執行,依然需要大量的具身場景資料來訓練。AI大模型,以及後續的多模態,可以從語音、視覺感知、決策、控制等多方面為機器人更好地進行學習訓練和進化。

過往機器人的控制模式是預設軌跡,導致機器人的控制與行動比較受限。李飛飛團隊在2023年發布的VoxPoser系統,實現將LLM(大語言模型)和VLM(視覺語言模型)連接到機器人,前者用來理解人類指令並生成交互代碼,實現與後者的交互,而VLM進行規劃路徑,產生操作指示地圖3D Value Map。兩者能力結合從而實現透過自然語言指令與機器人交互,可將複雜指令轉化為具體行動規劃,而無需預設資料和提前訓練,同時,系統也具備很強的抗干擾能力,可以在遇到干擾因素時快速重新規劃。除此之外,VoxPoser也產生了四方面的湧現能力,即評估物理特性、行為常識推理、精確度矯正、基於視覺的多步驟操作。

PaLM-E和RT-2有兩個代表性的模型。前者是年初谷歌公司與柏林工業大學人工智慧研究小組合作推出的多模態具像化視覺語言模式(VLM)。模型參數規模達5620億,整合用於控制機器人的視覺與語言,特徵是無需重新訓練即可執行各種任務。收到指令後,PaLM-E可以自動給機器人產生行動計劃,然後自行執行。這是透過分析來自機器人攝影機的數據來實現整個過程,不需要對場景進行預處理,也不允許提前對數據進行人工註釋,機器人的控制更加自主。

Robotics Transformer 2(RT-2)是由Google DeepMind突出的一個用於控制機器人的視覺-語言-動作(VLA)的AI模型。RT-2使用經過精調的LLM來輸出運動控制指令,可攜性訓練資料中未明確包含的任務,並在新出現技能評估中將基線模型的表現提升了3倍。

二、雲邊結合的分散式算力平台發展強化了機器人的訓練速率,降低產業化門檻。

機器人是AI、算力、IoT、底層硬體等各種技術的集大成者。從關鍵場景垂直應用,朝向規模化應用發展。透過雲端-邊-端融合的機器人系統和架構,例如雲端運行超大模型Nvidia A100 GPU,邊緣運行小型模型。讓機器人達到數百萬千萬級水平,從而降低價格成本,實現大規模商用。

雲端服務機器人是指將機器人的核心運算和智慧部分部署在雲端伺服器,借助雲端運算技術提供更大的運算能力和資源,以實現更強大、更有效率的資料處理和應用。「雲端大腦+本地機體」或「雲端服務」機器人將成為規模化推廣與應用的重要模式之一。

Google 專門開發協議,將模型部署在多TPU 雲端服務實現即時推理。實驗結果表明,基於現成的VLM 模型PaLM-E 和PaLI-X,RT-2 取得了良好的泛化和湧現性能。相較於獨立的機器人本體,連接雲端大腦後的機器人擁有以下四個核心優勢:資訊與知識共享,平衡運算負載,協同合作,獨立於本體持續升級。邊緣運算的引入將解決終端能力受限和雲端運算的即時回應的問題,增強機器人雲端大腦的即時回應能力。在共享運算、儲存、通訊資源基礎上,智慧演算法持續從(雲端)大數據和(本地端)個人化資料中抽取知識,逐步從特定場景適應到通用場景,最終實現機器人即服務(Robot As A Service)的長期願景。

特斯拉計劃利用Dojo對海量的視訊資料進行無監督學習,以加速特斯拉的Autopilot和完全自動駕駛(FSD)系統的迭代,同時為特斯拉的人形機器人Optimus提供算力支援。Dojo將加速人形機器人的開發,其能夠為機器人的神經網路訓練提供算力支持,更快速地處理大量數據,並有望推動機器人加速落地。

騰訊Robotics X機器人實驗室透過引入預訓練模型和強化學習技術,可以讓機器狗分階段進行學習,有效的將不同階段的技能、知識積累並儲存下來,讓機器人在解決新的複雜任務時,不必重新學習,而是可以重複使用已經學會的姿態、環境感知、策略規劃多個層面的知識,並「舉一反三」。

三、多感知、多自由度功能融合的靈巧手強化了人形機器人的微操作、近操作能力。

靈巧手是人形機器人執行動作的最終零件,十分重要且複雜,對馬達性能要求較高。靈巧手作為機器人實現操作的終端工具十分重要。空心杯馬達、觸覺感知感測器的發展,提升了人形機器人末端執行器的靈敏度和穩健性。

特斯拉人形機器人擎天柱靈巧手有6個致動器,可實現11個自由度,其中空心杯馬達為核心零件。人形機器人的手指空間狹小,因而人形機器人手指關節需配備較多小型化且能輸出較大力的馬達。屬於直流永磁伺服電動機的空心杯馬達完美契合人形機器人對應手指關節輕量化、高精度等需求。空心杯馬達具有功率密度高、能量轉換效率高、反應快,運轉平穩等特點,與靈巧手的需求高度適配。

騰訊Robotics X實驗室發表最新機器人研究進展,首次展示在靈巧操作領域的成果,推出自研機器人靈巧手TRX-Hand和機械手臂TRX-Arm。其中,靈巧手TRX-Hand擁有像人手一樣靈活的操作能力,可適應不同場景,靈活規劃動作,自主完成「操作」。而機械臂TRX-Arm針對人居環境自主研發,擁有七自由度與擬人的特性,具有運動靈巧、爆發力強、觸控一體以及柔順安全等特性。


趨勢四:AI+基因計算解讀生命密碼

基因是生命的最基本元素。基因計算是指使用計算方法來分析和理解基因資訊的過程。近年來,人工智慧(AI)在基因運算中的應用日益深入,市場研究公司Global Market Insights Inc.發布報告預測,到2032年,基因組學產業中的人工智慧市場規模將達到125億美元,複合年成長率為39.2%。AI與基因運算融合開始進入加速階段,可望在生物育種、醫療健康、生物醫藥等領域開拓廣大的技術創新與產業應用前景。

AI已成為基因組學創新的關鍵驅動力。前基因組時代(1958-1980s),生物資訊學作為生物學、電腦科學、數學和統計學交叉學科出現,人類專家初步探索將AI技術應用於基因數據分析,例如使用模式識別來預測蛋白質結構和功能、使用統計學習方法來理解基因表現數據。基因組時代(1990s-2010s),人類專家能夠系統分析和比較整個物種的遺傳信息,並利用AI進行基因組數據解析,輔助基因序列比對、變異檢測、功能註釋和複雜疾病的遺傳關聯分析,顯著提高了數據分析的效率和準確性;後基因組時代(2010s-),研究重點轉向基因功能的綜合分析、基因表現調控、個體遺傳差異分析等,深度學習、AI大模型成為關鍵驅動技術,用於處理複雜海量多模態數據,實現單細胞定序,優化基因編輯策略,促進智慧化生物育種、藥物發現以及個人化健康預測、基因療法發展。

利用大模型破解複雜生物問題成為佈局熱點。2023年8月,清華大學智慧產業研究院與水木分子發布多模態生物醫學百億參數大模型BioMedGPT,在資料層面整合了基因、分子、細胞、蛋白質、文獻、專利、知識庫等多源異構的數據。9月,《上海市加速合成生物創新策源打造高端生物製造產業集群行動方案(2023—2025年)》中提出支持建構AI蛋白質多模態生成大模型等乾濕結合AI生物大模型。谷歌旗下深度思維公司(Google DeepMind)也於9月宣布開發出新的AI大模型AlphaMissense,在人類蛋白質中成功預測了7,100萬個可能的錯義突變(基因突變的一類),並將89%的突變分類為可能致病或可能良性;11月,深度思考再次宣布,AlphaFold預測範圍從蛋白質結構擴展至DNA、RNA等生物分子。

AI+生物技術正加速育種4.0時代到來。2023年中央一號文件要求「全面實施生物育種重大項目,加速玉米大豆生物育種產業化步伐」。中國科學院錢前院士指出,全球種業發展正迎來生物科技與資訊科技融合的「生物科技+人工智慧+大數據」智慧化時代(即育種4.0時代, 1.0為農家育種時代、2.0為雜交育種時代、3.0為分子育種時代)。基因編輯方面,透過AI對於大量基因組數據的預測和分析,可以幫助提升特定基因位置添加、刪除或替換DNA序列的操作精準度,增強作物抗病性、耐逆性、營養價值或產量,並減少傳統基因改造技術(將一個物種的基因轉移到另一個物種)所帶來的基因表現不穩定或不可預測風險。2023年4月,農業農村部發布《2023年農業用基因編輯生物安全證書(生產應用)批准清單》,舜豐生物獲得首個植物基因編輯安全證書;此外,中國科學院遺傳與發育生物學研究所將AI與基因編輯結合,開發的PrimeRoot系統在水稻和玉米中實現了長達11.1Kb的大片段DNA高效精準定點插入。表觀合成方面,中國農業科學院生物技術研究所透過整合多組學數據,建構智慧模型,預測並優化人工設計的合成表觀迴路,大幅提升表觀合成的精準度,並提出設計與創制智能作物(SMART Crop)的途徑和路線圖,為透過基因編輯以外的技術來培育聚合多種理想性狀的作物新種質提供了新思路。

AI+基因計算將協助實現個人化健康預測。人類專家結合基因組資訊和AI演算法,建構高度精準的疾病預測模型,可以預測個體在未來發生特定健康問題的風險,進而實現早期介入。基因定序是理解遺傳訊息、研究基因功能、診斷遺傳疾病、發展新治療方法的基礎,其目標是確定DNA分子中四種核苷酸(腺嘌呤A、胸腺嘧啶T、胞嘧啶C、鳥嘌呤G )確切順序的過程。過去基因定序技術主要是對整個組織進行定序,包含成千上萬個細胞。近年來,基因定序技術有了突破性進展,從多細胞/組織層級開始演化到單細胞層級。騰訊AI Lab研究提出單細胞註釋模型scBERT,在單細胞定序領域首次引入大型語言模型BERT範式,將細胞中基因的表達信息轉化成可被計算機理解、學習的“語言”,並對細胞進行精準標註,實現了高解釋性、高泛化性、高穩定性的單細胞類型註釋技術,能給細胞中的每個基因都印上專屬“身份證”,可用於臨床單細胞測序數據,並輔助醫生描述準確的腫瘤微環境、檢測出微量癌細胞,從而實現個人化治療方案或癌症早篩。同時,對疾病致病機制分析、抗藥性、藥物標靶發現、預後分析、免疫療法設計等領域都具有極為重要的作用。

AI+基因工程促進分子藥物設計與研發規則創新。AI技術在藥物研發中,正逐漸用於海量文獻資訊分析整合、發掘藥物標靶、化合物高通量虛擬篩選、全新分子設計/優化、分子ADMET成藥性預測、分子逆合成分析、抗藥性預測等多個場景。在發掘藥物標靶方面, AI演算法能夠分析大量基因數據,快速辨識疾病相關的生物標記和潛在藥物標靶,提高藥物研發的針對性和成功率。2023年7月,美國丹娜-法伯癌症研究所基於人體基因表現資料集,預先訓練了一個基於遷移學習的AI模型-Geneformer,透過AI繪製基因互作網絡,有助於加速疾病治療靶點發現,對於罕見疾病,預計在未來僅需少量的數據就能推測出這些罕見疾病的病理機制。在生物合成基因簇挖掘方面,透過深度學習和模式識別技術,AI能夠分析複雜的微生物基因組數據,有效地識別和預測可能編碼天然產物的基因簇。騰訊量子實驗室開發了一套從微生物基因組中分析和預測生物合成基因簇的深度學習方法,可對基因組數據進行分析,發現、篩選並鑑定出潛在的、具有新穎結構的活性化合物相關生物合成基因簇,大幅提升新型生物活性分子的挖掘效率,協助新藥研發創新。

AI+基因計算為促進生命科學和生物經濟發展提供了新方法、新途徑、新機遇,但同時,在監管機制、隱私保護、資料安全、技術控制、基因編輯等方面可能會出現更多的治理和倫理挑戰,我們也需要重視和審慎應對,從而透過國際和國內產學研用各界共同努力,讓科技的發展朝著造福人類、促進公共利益的方向邁進。


03 數實交互

趨勢五:數位互動引擎激發超級數位場景

數位互動引擎是在文化創意場景下產生、伴隨數位文化產業升級而不斷實現技術迭代的一類工具集,整合了物理模擬、3D建模、即時渲染等多種前沿技術,是文化科技融合的典型產物。數位互動引擎主要由圖形模組、模擬模組、即時渲染等模組構成,它以軟體程式碼包形式創造虛擬場景,動態呈現其外觀變化,支援其與物理世界進行即時互動。

在發展前期,數位互動引擎主要應用於遊戲場景,在產業場景下稱為「遊戲引擎」;在服務遊戲產業高效建構虛擬世界、與現實世界高品質互動的過程中,不斷實現技術迭代、提升跨平台通用能力,逐步成為跨產業、跨場景應用的數位互動引擎。目前,數位互動引擎已應用於文旅、汽車、工業等多元領域,成為建構即時虛擬世界、實現虛實互動的關鍵工具集。


一、數位互動引擎與AIGC互相驅動,打造建構超級數位場景的高效工具集

隨著以數位互動引擎為代表的遊戲科技進入遊戲之外的更多領域,遊戲將迎來新的產業擴容,成為不斷創造新價值與新可能的「超級數位場景」。遊戲作為前沿科技的“試煉場”,在深度跨界、產業擴容的過程中,必然將推動數位互動引擎進一步與多種前沿技術形成廣泛連接,其中,數位互動引擎與AIGC的加速融合、互相驅動將成為重要趨勢。

首先,數位互動引擎為AIGC爆發提供了重要推動力,並有望助力AIGC邁過「深水區」。遊戲為AI提供了測試與訓練的重要環境,促進AI決策更加智慧;同時,AIGC目前在3D內容側的能力仍存障礙,遊戲產業的PCG(程式化內容產生)技術已大量應用於3D內容製作,兩者的結合可助力AIGC提升3D側能力。未來,數位互動引擎及其創建的大量3D數位資產也將為AI大模型訓練提供重要支援。

其次,AIGC技術融入數位互動引擎,將加速數位文化產業的工業化進程。目前,AIGC已滲透進數位文化製作的多個環節,包括動畫、語音、美術、3D資產及場景等領域,簡化內容開發流程。未來數位互動引擎將進一步整合多種AIGC能力,提升影視、遊戲、廣告等產業的智慧化、工業化水準。

此外,數位互動引擎與AIGC的結合,將輻射多元社會場景,打造建構超級數位場景的高效工具集。例如,英偉達的Omniverse平台整合了數位互動引擎、AI等多種技術能力,不僅能夠支援高效開發場景逼真、實體精確的遊戲,也能廣泛協助工業製造、自動駕駛等領域的虛擬模擬與協作。未來,數位互動引擎與AIGC結合,將加速打造更多的超級數位場景,在感知與認知的雙重維度上,實現人類生產與生活模式的全面升級。


二、大眾應用方面,數位互動引擎或走向UGC形態內容工具

隨著數位互動引擎與AIGC的融合加深、工具門檻進一步降低,數位互動引擎可望走向UGC工具形態,以更低的使用門檻為大眾提供3D內容的生產力。正如短影片改變了現今的社會訊息傳播方式,未來,數位互動引擎也有望作為大眾化的3D內容生產與互動工具,支持人們創造自身在虛擬空間中的形象及資產等,在數實相生世界中實現生產與生活。

目前,面向大眾的遊戲創作工具已經初現雛形,但數位互動引擎要真正走向大眾化,還需要從科技、生態、商業模式等維度累積資源、建構能力,實現高品質的畫面效果及即時算力支撐,培育豐富的開發者與多元內容體系,建構可持續的商業模式以推動創作者變現,進一步聚集內容開發者,真正推動「互動式內容」的大眾化時代到來。


三、產業應用方面,數位互動引擎推動各產業數位孿生走向即時性

目前,數位互動引擎的應用正在從社會消費端向生產端延伸:不僅作為文化數位化的重要技術支撐,助力文化業態打破時空局限、實現多維升級;也走向製造業領域的“新型工業軟體”,支持即時、智慧、高度視覺化的數位場景,幫助企業生產提質增效。

數位互動引擎憑藉其在資料視覺化、即時渲染、友善互動等方面的能力,已成為工業數位孿生重要的建置及運作平台,並支撐各行各業的數位孿生在應用層面提升即時性,使數位孿生技術在即時互動、靈活部署方面更進一步。數位互動引擎與數位孿生技術的結合,不僅可在數位空間中將實體實體建構成可視化、智慧化的“副本”,還能支援資料的即時感知存取、視覺化展現,實現3D模型的即時渲染和展示,支援使用者對孿生體的快速檢視、調用和修改,為汽車、民航等工業製造領域提供即時監控管理、演練測試的數位場景。

未來,隨著數位互動引擎整合更加成熟的AI能力,也將進一步提升數位孿生建構的效率與智慧化水準。例如,自動駕駛的模擬測試,可透過擷取真實數據,在數位互動引擎中重建數位場景,然後進行編輯、產生更多場景。採用AIGC 技術可以讓這項工作效率大幅成長,並且可以創造出更多的合成數據,填補真實數據中的缺口,提升訓練和測試樣本的多樣性、完備性和均衡性。AI與數位互動引擎的結合,將協助數位孿生技術以更智慧化的形式服務於各行各業,促進各領域提高研發生產效率、降低產業創新風險。


趨勢六:沉浸式媒體催生3D在場

在資訊爆炸的時代,新媒體已經成為我們生活中不可或缺的一部分。影片作為當今網路時代重要的資訊載體之一,在網路資料中具有非常高的佔比。根據Sandvine的報告,2022年視訊服務佔網路流量的65.93%。同時,截至2022年12月,我國網路影片(含短片)用戶規模達10.31億,較2021年12月成長5,586萬,佔網友整體的96.5%。在這個背景下,如何更有效地傳遞訊息,提供更好的使用者體驗,成為了新媒體領域亟待解決的問題。

多媒體技術經歷了電視、PC串流、行動互聯等階段,其中標準、設備、互動方式均發生了對應的變化。技術也不斷發展。未來,多媒體技術將聚焦四大方面,一是如何提高qoe和qos,進一步降低時延、提高壓縮比。二是更有效率的內容生成與呈現,如AIGC、HDR技術。第三是更多樣的內容、互動內容、新媒體,以及沉浸式互動和體驗。四是更深入產業,協助產業互聯網。


一、沉浸式體驗與互動:從平面到沉浸式體驗的升級

隨著虛擬實境(VR)、擴增實境(AR)以及混合實境(MR)等技術的發展,沉浸式體驗和互動逐漸成為新媒體的發展方向。3DoF (自由度)影片已在視訊號、快手等平台實現商用,裸眼3D產品也逐漸走進大眾視野。這些技術的應用為用戶提供了更真實、身臨其境的感官體驗,使用戶在享受內容的同時,更加沉浸其中。未來,隨著硬體的進一步成熟和6DoF技術的演進,更多的UGC (用戶生成內容) 3D沉浸式內容將會出現。此外,模型檔案將成為多媒體的重要載體。例如,3D模型可以用於遊戲、電影、廣告等多個領域,為使用者帶來更豐富的視覺體驗。同時,隨著5G等新一代通訊技術的普及,沉浸式體驗的傳輸速度與品質也將顯著提升。


二、高效內容生成與呈現:AI技術的加持

伴隨著人工智慧技術的不斷進步,AIGC技術在多媒體的文字、圖片生成等方面已經實現商用。未來,AIGC技術將持續聚焦產生更穩定的影片和3D內容。同時,在垂直領域如數位人、超分、老片修復等方向,AI技術將持續強化多媒體的能力,為使用者提供更高品質的內容。此外,深度學習技術將進一步提升影片編解碼的壓縮效率。隨著更多樣化的區塊劃分方法和編碼模式的不斷湧現,以及更複雜的預測和變換技術的引入,傳統視訊編碼演算法的複雜度不斷提高。深度學習技術為影像/視訊編碼框架定義了全新的結構範式,實現了影像和視訊編碼性能的顯著提升,這為影像/視訊編碼領域帶來了新的研究思路和方向。


三、從消費性互聯網到產業互聯網:根據場景進行優化

隨著網路科技的不斷發展,產業互聯網逐漸崛起,為各行各業帶來了新的機會。在這個過程中,多媒體技術在產業互聯網中的應用將根據不同場景進行最佳化,從而更好地滿足產業互聯網的需求。在產業互聯網中,網路協定需要根據場景需求進行最佳化以提高傳輸效率。傳統的直播傳輸-播放模型存在許多問題,如快取固定、傳輸可靠性過高、無法區分視訊幀優先權等。

針對這些問題,在消費互聯網中的WebRTC通訊模型基礎上,進行最佳化,在網路延遲、QoE和可靠性等進行最佳化,對場景需求進行最適匹配。例如在2B2C的場景中,透過(1)訊號改造,利用miniSDP和0-RTT的結合,大幅減少訊號耗時、提升訊號互動成功,進而降低首格耗時和提升開播成功率。(2)影音改造,讓WebRTC支援AAC,H.265,附加前向糾錯,抗50%以上丟包。也引入了B幀,增強了畫質,同時大幅減少了碼率。(3)傳輸改造,取樣柔性分級丟幀的傳輸策略來漸進式降低碼率,以適應弱網情況。支援P2P分送網絡,能夠將看同一視訊串流的用戶群就近地組織成網絡,相互分享傳輸。實現延時可降低到800ms以內,並同時兼顧延時、卡頓和首幀耗時,綜合QoS遠超傳統直播。可以廣泛應用在電商直播、體育賽事直播等領域另外一些場景,例如遠端作業等2B場景,透過(1)訊號改造:提升訊號連結對網路異常抵抗能力,減少網路異常恢復時間,提升視訊應用穩定性。(2)影音改造,優化相機擷取、視訊渲染和視訊編解碼耗時,從音訊視訊處理層面減少端到端畫面延遲。(3)傳輸改造,以減少視訊傳輸延遲為目標,適當平衡抗丟包和抗網路波動能力,減少視訊延遲;並引入多網傳輸策略,減少單一網路依賴,提升傳輸穩定性。實現了畫面延遲可降低到100ms以內,兼顧抗弱網能力,在工業遠距作業、醫療等領域應用前景廣泛。


趨勢七:腦機介面從醫療突破邁向互動革命

腦機介面(BCI,brain-computer interface),是在人類或動物腦與外部設備間建立的直接連接通路,實現大腦與外部設備的直接互動。依感測器或電極植入部位不同,主要分為非侵入式(Non-invasive)和侵入式(Invasive)兩大類。

如果從1924年德國醫生漢斯·伯格開發腦電圖(EEG)算起,腦機介面經過百年的近現代技術發展,已形成一系列基本的技術研究和應用範式。然而,由於對人腦原理研究認識進展的緩慢和局限性,目前腦機介面整體仍處於發展早期。

近年來在數位科技尤其AI不斷突破的祝福下,加上生物相容性電極、小型化設計與整合、微創植入、多模式感測器等關鍵技術進展,腦機介面呈現加速發展的趨勢。預計醫療、軍事、教育、混合實境互動、類腦智慧等領域將發揮重點帶動作用,全球商用市場將以17%的年平均成長率到2030年突破60億美元。從長遠看,腦機介面的意義更為重大,是人類應對人工智慧威脅、減弱老化社會衝擊、探索人類本質等重大議題,建構人機和諧社會的重要路徑之一。


一、腦機介面加速腦科學研究,協助醫療領域神經系統疾病監測及診療突破

醫療領域是腦機介面未來發展的首要牽引,佔約60%市場份額,預計未來十年保持領先。腦機介面與醫療的結合應用展現出廣闊的前景,能幫助開發更好的診療和復健手段,並加速神經科學和臨床神經醫學研究。重點應用方向包括:

神經調節:神經發育障礙和退化性導致的困難疾病,腦機介面可實現精準監測、分析和介入。如腦深部刺激技術,正加速應用於癲癇和巴金森氏症治療。對於學習障礙和自閉症等,基於腦電回饋的及時介入有顯著應用潛能,如集中註意力、提升閱讀效率。

運動恢復:透過捕捉大腦的運動意圖並轉換為控制訊號,腦機介面可以幫助肢體受損或癱瘓人員恢復部分自主運動能力。如瑞士洛桑聯邦理工大學成功讓脊髓受損患者恢復行走能力,Neuralink以頸脊髓損傷等患者為臨床試驗重點對象。

感官補償:腦機介面還能針對感官缺陷或傷害患者,解碼大腦訊息並實現感官補償。目前助聽方面已發揮重要作用,並向語音、視覺等拓展。如鎖定綜合症和漸凍症會導致失語,患者藉助腦機介面能控制遊標、文字生成、語音合成等,與外界重建溝通。如加州大學成功將大腦訊號轉換成合成語音,幫助中風失語女性以高達80字/分鐘的速度再「說話」。

未來,腦機介面可望向神經系統相關的疾病治療、人體增強等多樣化的場景深化應用。研發重點和困難之一涉及大腦記憶和意識的疾病,如阿茲海默症,利用腦機介面即時監測和介入可能加速病理研究和診療手段開發,並支持對人類大腦原理的研究。


二、腦機介面與混合實境深化融合,將推動新一代人機互動模式變革

新一代XR設備的興起,激發人機互動模式的演進需求,驅動腦機介面的融合發展。腦機介面可以實現更直接的腦電交互,結合XR等的視覺、手勢、語音等交互,能夠提供更豐富、自然的交互方式。近期突出的市場創新進展有:

肌電交互: Meta正在研發一款具有革命性的交互腕帶,基於EMG(肌電圖)讀取用戶手臂神經信號,可以在手指運動發生前就定位跟踪,甚至能感知極微小的手勢,能用於隔空操控滑鼠、打字、玩遊戲等。

眼動互動:蘋果正式發表頭顯Vision Pro,提出空間運算並展現出驚豔的虛實互動體驗。其中暗藏了眼動互動功能,例如透過監控瞳孔變化預測使用者行為從而即時重建UI,使得個人化互動更便捷、流暢。

腦電+XR多重互動: OpenBCI與Varjo合作開發Galea BCI設備,成功把包含多種感測器的非侵入式腦機介面系統和混合實境系統整合一體,創造出能進行多重體驗互動的新型軟硬體平台,如讓殘障人士能更精準腦控無人機。

未來在商業及生活服務方面,腦機介面與XR等結合適用領域將十分廣泛,如娛樂、社交、識別、疲勞介入、個人化學習等。這類腦機技術多採用非植入式,更安全便利、更易被大眾接受,更可能形成消費性應用從而加速腦機介面普及。


三、腦機介面與人工智慧相輔相成,成為促進人機和諧共生的重要路徑之一

生成式AI爆發帶來潛在威脅,提高了腦機介面發展的必要性。腦機介面可望架設人腦與數位體、機器等的高速連接,增強人腦能力避免被直接取代,同時促進更安全、高效的AI發展。類腦智能成為重點發展方向之一,主要有兩面:

提升大腦解讀能力: AI大模型等技術的加速突破,能支援更有效率處理腦機介面擷取的大量腦訊號,提升對大腦文字、影像等資訊解碼與重建效率,促進大腦資訊處理機制等的基礎研究。如大阪大學研究團隊基於擴散模型,成功重建透過功能性近紅外光光譜(fMRI)所獲得的人腦活動影像。

促進類腦運算發展:腦機介面促進腦資料擷取與腦科學研究,能反過來支援類腦運算的架構、演算法、晶片等技術創新,跳脫馮-諾伊曼運算結構限制,推動更低功耗、高效率、可信可控的AI發展。如IBM推出類腦晶片原型NorthPole,相比傳統CPU大幅提升能源效率25倍。

未來隨著腦機介面和AI結合的進一步深入,長期可望促成新的類腦運算結構體系、賽博格(人機融合體)、腦聯網等的發展突破,降低AI風險、促進人機和諧共生。



04 未來連結

趨勢八:星地直連通訊推動泛在網路覆蓋

1月3日,美國太空探索技術公司使用獵鷹9號火箭,成功發射21顆「星鏈」衛星,其中6顆衛星具備「直連手機」功能。衛星上新增一個面積為25m²的中頻PCS 頻譜天線,補充衛星Ku 和Ka 頻段天線,同時配備先進的eNodeB 調製解調器,提供天基手機漫遊接入服務,由於具有星間激光鏈路功能,Starlink 具備提供全球任何地區任何時段普通手機接入的能力。1月11日,榮耀Magic6 系列旗艦新品,號稱實現了體積最小、訊號最穩、最省電的手機衛星通訊體驗。開年發生的星側和端側兩個標誌性事件,標誌著2024年也許成為星地直連泛在網路全面普及的元年。

資訊通信技術作為第三次科技革命的核心力量,自誕生起就以「Anytime,Anywhere,Anyone,Anything」為終極目標。如今的地球上,地面蜂巢網路已經覆蓋了70%的人口,但覆蓋的地表面積實際上只有20%。當發生摧毀通訊設施的自然災害或身處無網路地區的人為事故時,「失聯」的悲劇仍然難以避免,這也為攻克「緊急狀態通訊」這一難關提出了迫切需求。星地直連通訊技術就是在這樣的背景下發展而來,迄今已取得很大進步。2022年底,蘋果公司、華為公司相繼發布了支援短報文(類似手機簡訊功能)緊急通訊服務的新手機。2023年,華為又推出了Mate 60Pro手機,依托天通衛星實現了星地直連語音通訊。這一系列技術突破和產品創新,預示著星地直連通訊已步入實用化的快車道。根據美國市場分析公司ABI Research預測,隨著NTN (非地面網路)技術不斷發展,預計到2030年,全球將有1.7億台NTN行動終端設備,產生的收入將達163億美元,從2022年至2030年的複合年均成長率將達76% (過去10年為22%),基於手機直連衛星的泛在網路覆蓋的時代即將到來。

星地直連通訊的突破主要得益於兩個因素。一方面,衛星和火箭技術加速創新。可回收火箭技術日臻成熟,衛星發射成本顯著降低。美國SpaceX公司的Starlink (星鏈系統)正以每年數千顆的速度積極部署近地軌道。目前,Starlink 2.0 Mini衛星已經發射,相較於1.0版本,其體積擴大了4倍,重量增加了3倍,通訊能力提高了4倍。未來,完整的Starlink 2.0衛星將重達1.5噸。同時,美國衛星通訊公司AST Mobile已開始部署基於低軌道的64平米超大陣列天線。衛星重量的增加、天線面積的擴大、部署密度的成長,都降低了對地面設備天線大小和功率強度的需求。儘管Starlink目前仍需要較大的地面設備,但正在向手機直接與衛星進行寬頻通訊的目標挺近。衛星與火箭技術突破,促使天地網路的體驗越來越接近,並可實現二者之間順滑切換,這成為普及衛星通訊技術的核心動力。

另一方面,民用手機逐步實現星地網路相容。近年來,華為公司與北斗系統開展的合作、蘋果公司與美國衛星通訊系統「全球星」的合作,都是透過在手機中整合專用衛星通訊晶片,以實現寬窄帶結合的直連衛星功能。眼下,星地通信仍會以窄帶為主,主要透過簡訊和語音通信,這種方式在應急、野外、高空、遠洋等場景,有著廣泛應用前景。同時,我國晶片廠商已推出星地一體化通訊模組。未來隨著設備加速普及,該模組的價格將快速下降,趨向與傳統手機通訊模組持平,這將為星地網路相容的民用手機的大規模普及,打下堅實基礎。

歷次通訊科技變革都會帶來資訊通訊與網路領域的產業新機會。星地直連、6G網路的時代,將是一個低成本泛在(含地面、海洋、空中、太空等)接取的時代,必然催生大量的軟硬體需求。其中一個重點趨勢是對於寬窄帶結合的即時通訊和緊急通訊產品的新需求,由此帶來對語音和視訊壓縮技術的新需求。這些技術在即時通訊工具、線上會議等網路產品的普及中,曾發揮了決定性作用,在衛星通訊時代也會成為爆款應用的關鍵。另外一個重點趨勢是泛在物聯網的爆發。在各種野外生態或工程監測領域,如對抗自然災害、動植物保護、工程建設等,窄頻衛星通訊與邊緣運算、再生能源等結合,將帶來應用情境上的全新可能性。例如,我國的國家電網公司已經在野外電力設備監測場景下使用窄頻衛星通訊技術。

必須看到,商業航太、衛星製造、通訊設備等領域,均處於大國競爭前沿。例如,太空軌道、通訊頻譜都是有限資源,全球遵循「先到先得、先佔永得」原則。這方面,儘管我國星網集團已公佈上萬顆衛星的發射計劃,但仍遠低於Starlink等美國同行的進度。可見,發揮國家統籌力量、依賴龐大市場容量、系統化扶持龍頭企業、建立產業生態和技術壁壘等,都是一個國家能否在新的通訊革命中取得領先的要素。


趨勢九:eVTOL加速空中出行奔赴新時代

隨著城市化加速,交通擁擠和環境污染問題日益突出,人類社會對綠色高效的交通方式的需求日益迫切。因此,開發低空空域、實現低空出行、發展低空經濟已成為解決這些問題的重要選擇之一。由電動垂直起降飛行器(electric vertical take-off and landing,eVTOL)驅動的空中交通被視為推動低空經濟發展的核心引擎。eVTOL採用以新能源電池作為動力的分散式電力推進系統,能有效降低飛行噪音和提升操作系統的安全性,同時實現垂直起降、無需跑道,是一種理想的綠色智慧交通工具。

從未來產業發展來看,eVTOL應用場景廣闊。現階段最主要的是替代直升機,在測繪、消防救援、電力巡線、警用巡查、醫療救護、搜救、海上石油鑽井、農業植保、農業飛防等領域廣泛應用。而業界普遍期望,eVTOL能廣泛應用於以城市和區域出行為主的空中載人客運。在不同應用情境中,載人客運是必然的核心發展方向,因為人的時間價值遠高於貨物。預計eVTOL率先在載貨物流、城市服務、消防救災等場景開始商業化運營,隨著技術發展和市場成熟,載客eVTOL將邁入大規模商業化時代。電池續航里程提升,使得eVTOL主機廠在機型研發上更傾向於城際和區域出行類型的機型,主要是由以下因素驅動:城際和區域出行的單位經濟效益高、為客戶節省的時間多、所需的飛行頻率和機隊密度較低和公眾接受度高。目前載人客運的展示與試辦推廣日趨火熱,2024年奧運及2025年世博會的試營運計畫或開啟「eVTOL元年」。未來十年,在政府、產業巨頭和民間資本的助推下的eVTOL低空交通領域,產業發展與投資局面很可能發生劇變。

面對多元化應用場景需求,eVTOL在關鍵核心技術,特別是飛行器構型設計方面,仍處於驗證比較、市場選擇到大規模應用的“前夜”,但數位技術加速和賦能已成共識,並在實踐中落地。綜合國內外情況來看,eVTOL在科技創新方面呈現「電動化、長續航力、智慧化」三大技術趨勢:


第一,純電推進的eVTOL成為主流,細分技術路線的優勢需在場景中反映出來。

eVTOL普遍採用電力推進系統作為動力裝置,是一種航空領域的顛覆性技術。電力推進系統利用電力驅動多個推進器作為動力裝置,能有效提升飛行器氣動效率、載運能力、環保性和穩健性等。傳統直升機使用內燃機或渦輪發動機作為動力裝置,噪音、污染嚴重、能源效率低。

eVTOL在商業化的過程中形成了不同構型或技術路線,其中多旋翼構型實現技術路線簡單,但有效載荷和航程相對有限;向量推進構型(傾轉旋翼、涵道)和復合翼構型eVTOL在航程、巡航速度和載重比方面優勢明顯,具有較好的有效載荷、最大起飛重量和運營經濟性,更適合在城際運輸等空中交通商業場景中應用推廣。隨著電池技術發展,複合翼及向量推進構型相對於多旋翼的優勢會越來越明顯。全球900多個eVTOL設計研發項目的統計顯示,約320個項目選擇向量推進構型,約260個選擇多旋翼構型,約150個選擇複合翼構型,其他項目選擇懸停自行車和個人飛行器、電動旋翼機設計。


第二,高能量密度鋰電池的技術突破,進一步提升eVTOL續航里程。

電池技術突破輔助eVTOL實現中長距離城際飛行。鋰電池因其高能量密度和安全性成為大多數eVTOL主機廠的首選動力來源,尤其在目標航程約200-300公里的範圍內,其能源效率和成本優勢明顯。頭部企業認為電池能量密度在300Wh/kg以上,eVTOL性能已經展現出比較好的商業化能力。目前,業界最領先的航空級電池的能量密度可望達到500Wh/kg,將會大大提升eVTOL續航里程,有潛力支持現有廠商的機型飛行400-500公里。整體而言,eVTOL電池的下一步研發目標是在確保航空安全的前提下,提高電池能量密度並以業界可接受的成本實現量產。

氫能應用潛力大但受限於總成本高且技術成熟度低,導致氫能源飛機的商業化進展緩慢。長期來看,氫燃料電池的能量密度最高可達鋰電池的數百倍,並具有廣闊的應用前景。短期內,由於成本、重量、儲運和潛在安全風險等因素的限制,氫能電池的應用空間仍然有限。德國新創公司H2FLY近年來推出了一款液態氫飛機HY4,該飛機為雙體式、四座位、單發設計,主要用於技術驗證和演示;空中巴士等公司則計劃在2035年前推出氫能飛機。


第三,「軟體定義飛行器」和空中交通管理智慧化共同加速無人駕駛願景。

由於採用智慧駕駛技術發展與政策支援等有利因素,eVTOL飛行器正逐步從傳統的有人駕駛模式過渡到更有效率的無人駕駛模式,呈現出「軟體定義飛行器」的趨勢。未來eVTOL在空中交通競爭中的關鍵既包括飛行器設計和性能,也包括以AI為核心的軟體技術,同時還需要配備高效的數位化空中交通管理系統來支援大量無人駕駛eVTOL運作。

在早期推廣階段,為了使eVTOL符合適航安全要求以及更容易被乘客接受,主機廠可能會為早期機型配備飛行員或安全員、推遲無人駕駛eVTOL研發計劃,或同時研發無人駕駛和有人駕駛eVTOL。然而,從長遠來看,實現自主飛行、取消飛行員是降低營運成本、提高經濟效益的必然選擇。億航、峰飛和波音公司旗下的Wisk專注研發無人駕駛飛行器,億航已獲得我國頒發的適航證,峰飛計劃在配備安全員的前提下進行商業試運營,而Wisk計劃在2028年洛杉磯奧運期間才會開始試運行無飛行員、全自主飛行的飛行器。

此外,低空基礎設施建設將協助高效安全空中交通管理,加速低空空域開放和利用進程。eVTOL在低空運轉、服務民眾,流量大於現有通航直升機。儘管eVTOL航空器數量遠低於城市內叫車,但其運行環境為三維,受天氣等因素影響,複雜性和不確定性較高。數位技術可透過以下途徑協助空中交通管理智慧化:(1)低成本、高精度、高可靠性的通訊、導航、監視系統,即時取得航空器信息,降低航空器間隔,提高空域流量和安全性;( 2)基於傳統氣象雷達以及光達等新一代感測器收集的氣象數據,結合AI大模型等技術,為低空飛行帶來更精準、網格化的氣象服務;(3)基於雲端運算、邊緣運算、深度學習和人工智慧的管控和調度系統,為eVTOL飛行提供決策支持,如實時航路規劃、起降場選擇;(4)集成多種技術的空域數位化平台為空域管理部門進行空域設計、航道規劃、類比測試提供數位化工具。

展望未來,我們期待在eVTOL技術、新能源技術和數位技術的發展和共同引領下,以eVTOL為代表的空中出行方式能夠加速實現,改變以地面交通為主導的出行模式推動全球加速奔赴空中出行新時代。


趨勢十:多能流即時協同重塑虛擬電廠

隨著新能源技術和資訊技術的不斷發展與成熟,在雙碳目標背景下,虛擬電廠逐漸顯現出其在能源結構轉型中的關鍵作用,成為實現能源優化配置的重要解決策略。在未來電網的組成中,源端、負載端和儲能端三個關鍵部分正在經歷顯著變革。具體而言,源端將見證波動性清潔能源以大規模、高比例的方式連接電網;在負載端,越來越多的用戶正逐漸轉變為發電、儲能及電網響應的參與者;而在儲能端,電化學儲能技術的發展及氫儲能技術的研究,正大幅降低能量儲存與運輸的成本。

過去,虛擬電廠的應用範圍相對有限,但現在我們需要擴展其應用於城市乃至城市間的更廣泛層面。城市運作中的三大核心調節性負荷—工業、算力和交通—隨著工業創新、大規模模型算力以及新能源汽車等領域的發展,其電力需求持續成長。這既是挑戰,也是機會。數位化整合的虛擬電廠能夠透過承擔多網耦合和協同工作,將上述幾類主要用電部門轉變為可調式資源。這項轉變將有效應對能源結構轉型帶來的電網壓力,確保在新能源背景下,新型電力系統的平穩轉型。

再生能源消納以及電力電子化是實現碳中和的關鍵,穩定電力供應是實打實的剛性需求。隨著近年來新能源產業發展,電力電子資源的不斷增加,國家需要有更有效率的數位化控製手段。近期在新能源及電力電子化領域發生的幾項重要事件:

1.蔚來參與全國規模最大的V2G需求反應計畫:2023年8月23日,車網互動驗證中心(e-Park)的V2G充放電系統需求反應試驗在無錫正式啟動。這個系統是目前國內規模最大的V2G充放電系統,為新型電力系統建設提供了堅固的支撐。

2.山東電力交易出現「負電價」現象:「五一」期間,山東電力現貨市場的即時交易電價經歷劇烈波動,區間從1047.51元/兆瓦時降至-80元/兆瓦時(約1.05元/度至-0.085元/度),期間多次出現負電價,此現像在電力市場中特別罕見。

3.中廣核新能源深圳虛擬電廠的重大成就:到2023年中,中廣核新能源深圳虛擬電廠成為首批滿足併網接入要求的標準化虛擬電廠,並成功參與首輪精準響應。在虛擬電廠營運商中,其響應容量和響應精度均位居前列。

這些事件不僅標誌著產業的重大進步,也展現了數位化控制在能源變革中的重要角色。工業、算力、交通等將是近幾年的重點應用趨勢:


一、規模龐大、可調性強的工業可調式負荷可提供規模彈性:

騰訊以鋼鐵製程可調節負載為初步虛擬電廠試點,並逐步囊括多種可調節資源;初步盤查,可透過調整電爐的生產節奏和功率以獲得負載靈活性;可根據不同優化目標對當日生產計劃進行調整:

1.容量調節:典型的短流程電爐煉鋼生產線能夠提供5-20MW的彈性。這涉及到在保證生產不受影響的情況下對設備產出的調節,同時也需要平衡設備運作和人力資源的排產。在電網交互控制方面,電網需以不同時間尺度向負載方發出通知並進行控制。

2.方法優化:為了獲得負載彈性,可以調整電爐的生產節奏和功率。這可能包括在響應時段降低電爐功率,延長電爐運轉時間,或實施設備錯峰使用。這樣做的目標是在不損失總產量的前提下降低整體用電費用,並透過降低負載獲得補助。

3.策略制定:可以根據不同的最佳化目標對當日的生產計畫進行調整。這包括設定不同的生產目標,例如最快生產時間、最快生產時間加上模鑄、最低電價、最大化峰谷錯開、以及在最低電價下的需求側響應等。這些目標策略將指導未來的回應方式。


二、數位基礎設施的能耗優化,資料中心任務移動可改變負荷:

根據與其他資料中心是否互聯,資料中心有兩類:獨立的資料中心(如傳統的機房);互聯網資料中心(IDC):多個IDCs透過光纖可以進行資料負載傳輸,並與其之間傳輸資料的光纖網路共同構成算力網路。

1.負荷轉移:在雲端運算場景下,尤其是在AI海量運算的時代,IDC負荷透過算力網路轉移資料負荷,進而實現電力的轉移。考慮到東西電力資源的巨大差異,這種負載轉移在電力管理中尤其重要。

2.策略實施:資料中心騰訊本身做了應用場景需求響應特性測試。這包括在不影響任務效能的情況下,調節伺服器功率,並專注於回應速度、回應深度、回應時長和回應精度。

3.時效性考量:探索資料中心伺服器的負載彈性策略,並進行靈活調節。這涉及到對即時性不敏感的計算任務進行擴縮容和“斷點續算”,以快速改變負載分佈。這類任務包括科學計算、視訊渲染以及其他獨立或耦合平行任務。


三、與C端互動平移伸縮電動車充電狀態,聚合為「大電池」:

電動車(EV)將電力網絡與交通網絡這兩個複雜的人造系統緊密耦合;EV的充放電與出行由駕乘用戶決定, 形成以EV為核心的信息-物理-社區系統(Cyber​​-Physical -Social System),帶來新的問題與調控潛力。

1.時空協同:在電力-交通網絡耦合的定義中,透過交通網絡轉移充電負荷,從而改變電網的潮流分佈,這在新能源車時代尤其關鍵。

2.實施方案:透過電力控制中心,結合交通擁堵資訊發布以及各充電站的可用容量,制定即時策略,引導電動車到達對交通系統和電力系統都最佳的位置進行充電,以實現EV充電服務的效益最大化。

3.試辦實驗:以價格調控為基礎的電動營運車輛調度是接下來一個重要的嘗試方向。這包括利用旅遊價格調控車流密度和供需關係,以及利用充電價格調控充電需求的時空分佈。目標是解決出行需求與充電負載的供需不平衡,透過各類價格對營運車輛進行適當引導。(騰訊研究院)