萬字長文，當機器人擁抱大模型

2023/07/01

•

經過半個多世紀的發展，今天的機器人產業也許正迎來仰望星空的那一刻。

前言

機器人行業的挑戰

研發能學習了解這個世界並能操控其中物體與世界進行交互的機器人，一直是機器人領域最重要且至今尚未完成的挑戰。

過去數年裡，機器人產業曾被無數掛著AI旗號的公司“賦能”過，但傳統AI並沒有那麼智能，訓練成本高，泛化能力弱，除了在機器人視覺（Robot Vision）領域（嚴格意義上應該是CV領域而非機器人領域）有較多應用之外，在機器人這樣動作連續且複雜、有較多物理交互和操作因果性的領域落地情況並不樂觀。

大模型在自然語言連續對話、通識理解、少樣本/零樣本學習等能力方向的突破，使得機器人在軟件層面終於看到了變革的曙光。

當前機器人的局限

雖然被冠以機器人之名，但是現在的機器人跟科幻電影裡無所不能的機器人還差距甚遠，更客觀的來講，現在的機器人更偏向是一種可編程的專用設備。

機器人在人類社會的滲透率仍然很低，以使用最廣泛、滲透率最高的工業機器人為例，2022年中國一共銷售約30萬台機器人，總體保有量在150萬到200萬台之間。而中國的製造業產業工人約有一億人，通常情況下一台機器人代替0.5~2個人，取平均數1的話，工業機器人的總體滲透率在2%左右，這意味著絕大部分工廠裡的生產工作仍然由人工完成。

在商用和服務領域，機器人的滲透率更是低到可以忽略不計。

為什麼機器人這麼火，但是落地的應用卻那麼少呢？為什麼機器人的銷量總是上不去？

機器人沒有獲得更大規模的應用的原因分析

拋開價格因素，目前機器人應用少、可用性差的瓶頸主要在於軟件系統，即現有的機器人應用軟件還不能充分發揮機器人現有機能。雖然目前機器人硬件性能距離“終結者”仍然有巨大的差距，但是整體硬件機能已經達到了很不錯的可用水平。

機器人是典型的機電軟一體化產品，軟件與硬件是相互限制又相互促進的矛盾體。

機器人機能提升可以帶來更好的性能，更好的性能支持更強大的軟件，更強大的軟件支持更多應用，更多應用擴大市場促使機器人廠商研發機能更強大的機器人，由此機器人產業才會步入良性的發展循環。

產業發展的正向循環

大模型的出現，補全了讓機器人產業從1%到10%躍升的技術基礎，這也是業內為何看中機器人+大模型的主要原因。

大模型能做什麼

本節是對當前大模型在各領域能力的一個概述，熟悉該內容的讀者可以直接跳到下一節。

之前被問起AI在機器人領域的潛力時，一直表達的觀點是AGI短時間內還很難實現，AI只能用在一些特定垂直的機器人領域上，未曾想會被如此迅速的打臉。

ChatGPT給出的大模型定義是：

A large model refers to a machine learning model with a significant number of parameters and high computational resource requirements, capable of handling complex tasks and achieving superior performance.

即具有大量參數和較高計算資源需求，用於處理複雜任務並取得優異性能的機器學習模型。GPT、BERT都屬於大模型的範疇，具體到多少參數才是大模型沒有明確定義，通常考慮具備1B（十億）以上參數時可以稱之為大模型。

大模型在多個領域展現出來令人印象深刻的能力，譬如：

在自然語言處理領域，引爆全球關注熱點的ChatGPT可以跟人流暢的聊天、撰寫各類專業文章、理解輸入的段落並給出各種分析，編程各類程序代碼、輔助查找bug、制定會議議程，甚至你還可以跟它探討人生的意義。此外，ChatGPT正在支持越來越多的插件，輸出內容也不再局限於文字格式，合理使用插件可以大幅提升ChatGPT的輸出效率。在網上有大量關於ChatGPT的介紹資料和教程，在此不再贅述。

六種ChatGPT可以做的事情

在辦公領域，微軟的Copilot，支持Excel、Word、PPT、Outlook、Teams、OneNote，可以極大提高工作效率。譬如在word中，你可以讓Copilot根據主題要求自動生成文章，並根據反饋做進一步的潤色。在PowerPoint中，可以根據給定的主題自動生成演示文稿的初稿，包括主題、佈局、圖片等，並可以針對每一頁文稿進行直觀的自然語言交流和修改，整個過程自動化程度非常高。在Excel中，Copilot可以自動生成特定要求的數據透視表，可以回答諸如“分析數據並列出三個關鍵趨勢”這樣的問題，可以分析某一類數據變化背後的原因。總之，Copilot的加入使得計算機可以自動完成很多基礎文檔工作，極大提高Office辦公套件的工作效率。

在圖像生成領域，以Midjourney、DALL-E為代表的文生圖大模型，可以根據輸入的文字創建插圖、設計產品以及產生新的業務創意圖，使用合適的指令和參數組合，可以生成各種高質量的圖片。

*上圖威爾史密斯掌摑庫里斯洛克新聞實拍照片，下面三張是MidJourney生成的GoPro視角圖片，咒語自尋*

在教育領域，大模型會對以傳授知識和技能為主的教育模式帶來巨大衝擊，因為未來每個人都會擁有一個存儲了大量知識的智能助理，人們不再需要去記憶大量現存的知識內容，教育模式會向著培養更具創新、溝通、推理能力的方向發展。在具體落地層面，大模型可以化身成一對一的助教，因材施教在成本和效果層面終於具備了可行性。它可以根據學生的歷史數據自動生成適合該學生的教學內容、題庫等，並完成作業批改；可以閱讀一本書並與學生探討書中的思想與含義；可以作為外語老師跟學生對話並指出學生存在的語法或者發音錯誤。

【TED演講】ChatGPT——面向學生和教師的驚人AI 超級導師： https://www.bilibili.com/video/BV1AP411m77K/

從大練模型到練大模型

《On the Opportunities and Risks of Foundation Models》一文中給出了大模型時代使用AI解決任務的一般範式，即從基礎模型通過精調生成任務/行業大模型。

*使用多種模態數據訓練出基礎/基座模型，然後再微調應用到各種細分行業應用中去，變成行業大模型*

大模型之前的AI模型多是面向特定領域單獨訓練的，新場景通常需要走一遍“數據收集--標註--訓練（調參優化迭代）--部署--應用”等一系列流程，即使經驗豐富的AI工程師也需要幾天甚至幾週的時間來完成，而訓練得到的模型A適合於A領域，模型B更適合B領域，通用性並不高，快速部署能力很弱，在很多對時效要求高的場合（譬如需要頻繁換產的工業現場、動態變化的商用/服務場景）就很難應用。

大模型的出現，讓高成本（財務&時間）手工煉丹模式的垂直領域AI開發，變成“預訓練大模型+特定任務微調”的形式，這種方式可以大幅提高模型的泛化能力，提高開發速度，在面向各種“精度”要求不高的場合時可以認為具備了一定意義上的通用智能。

“你是想告訴我們，一種沒有記憶遺傳，相互間用聲波進行信息交流，並且是以令人難以置信的每秒1至10比特的速率進行交流的物種，能創造出5B級文明？！而且這種文明是在沒有任何外部高級文明培植的情況下自行進化的？！”
------銀河系碳基艦隊統帥，劉慈欣《鄉村教師》

在信息儲存和傳遞速度上，矽基的計算機遠超碳基的人類。

基礎模型帶來了“記憶遺傳”，再加上矽基帶來的交流速率的史詩級提升，使得這次由大模型帶來的AI產業的進步將是革命性的。

當機器人擁抱大模型

AI是大腦，機器人運動控制器是小腦，機器人就是軀幹，三者在一起才組成完整的機器人系統。

大模型給機器人帶來了什麼

進展最大也最有可能跟機器人深度結合的大語言模型LLM（Large Language Model），其主要特點和優勢包括：

具備多個領域的基礎知識
對自然語言具備較好的理解能力
基本可用的連續對話與持續交互能力
強大的零樣本/小樣本學習能力

把以上能力映射到機器人領域，大模型適用的機器人任務就包括：

任務描述
任務分解
程序生成
任務交互

以上能力合併在一起，就構成了機器人開發人員夢寐以求的願望，即任務級編程/交互。

只需要告訴機器人它要做的任務是什麼，機器人就會理解需要做的事情，拆分任務動作，生成應用層控制指令，並根據任務過程反饋修正動作，最終完成人類交給的任務。整個過程基本不需要或者僅需少量人類的介入和確認，基本實現了機器人自主化運行，無需掌握機器人專業操作知識的機器人應用工程師介入。

機器人的任務級編程

任務級編程或者任務級交互落地之後，以下場景將有可能變為現實：

要理解任務級編程在機器人領域的重要性，我們首先需要知道，當一個機器人從收到指令到實際運動起來，中間需要經過哪些環節，如何控制機器人完成任務所需的動作。

當前，機器人控制框架一般採用層級控制（Hierarchical Structure）方法，不同的文獻會把機器人編程和控制層級劃分為多個層級，譬如任務級、動作級、關節級，或者在《Robotics Modelling, Planning and Control 》裡，分為任務級，動作級，初始級，伺服級等。

在層級控制的方法中，高層級負責任務定義和動作規劃，低層級負責實時運動控制，如下圖所示：

具備工業/商用/服務領域通用性的機器人控制軟件（機器人大腦）有了實現的可能

機器人的未來將繼續考驗行業內外許多人的智慧與能力，但是在歷史洪流的發展進程中，新的拐點或者機遇終將如期而至。

任務定義與描述（去接一杯水）；
把任務分解為動作（把從拿杯子到打開水龍頭到接水的過程拆分成一個一個的細小動作）；
機器人工程師根據分解動作對機器人進行編程，生成代碼（可以是C++、Python，也可以是自定義的機器人編程語言）；
控制-執行-反饋（傳統意義上機器人控制的主要功能）；

在大模型之前，一般只有第四步的控制和反饋環節是由計算機自動完成，前面的任務定義、拆解和機器人運動代碼生成主要是機器人工程師完成。眾多的機器人應用工程師的主要工作就是理解任務，並把任務拆解成合適的動作，使用機器人編程語言完成機器人應用程序的編寫、調優和部署。

大模型並不適合做底層精確的控制，更適合做相對模糊的任務級規劃。通過大模型直接生成機器人應用級代碼是目前看來技術儲備最多，最有可能快速落地的方向。

例如，如果要求機器人去廚房接一杯水過來，那麼僅僅是打開水龍頭這一個子任務對機器人來講就有很多挑戰，水龍頭的樣式是多種多樣，開啟方式也不盡相同，機器人首先要能理解面對的是一個什麼樣的水龍頭，該如何開啟，開啟到什麼程度能兼顧接水速度和避免潑濺和溢出。這個對於人類來講很簡單的事情，在之前都是需要機器人應用工程師通過代碼一行一行寫出來的。而預訓練大模型的通識理解能力和強大的零樣本學習能力，非常適合生成動作級代碼，指揮機器人的動作來完成任務。

當然，靠AI完全自主生成的機器人代碼可能存在不完備、不安全的問題，這時候就需要人類介入（RLHF）進行確認、修改、調優等工作，通過AI與人類的配合，來實現機器人的低門檻使用與快速部署。

定義任務級API--設計Prompt讓模型理解API--大模型生成程序↔人工修正--人工確認ok後執行

有關機器人任務級編程的更多介紹，這裡還有一篇非常詳盡的文章可以參考。

鏈接：

https://www.zhihu.com/question/58830644/answer/159511581

從工程師到用戶

當大模型帶來的任務級編程/交互在各個應用領域陸續落地的時候，機器人的使用者從工程師變成了一般用戶。

大模型的few-shot和zero-shot能力，讓機器人在面向各種各樣新應用時，可以快速給出一個方向正確&基本可用的整體方案，而且不需要用戶具備之前需要的專業機器人知識。

使用門檻的降低，是一個產品或一個產業走向大規模快速爆發的起點。

機器人是AI與物理世界的錨點

AI系統生成的指令，凡是需要與外界環境進行物理交互的，都需要機器人來完成具體的動作，機器人是AI系統落地物理世界的最佳載體。

我們生活在三維的物理空間，裡面發生的幾乎一切事情都需要與周圍的事物進行各種形式的物理交互，而AI作為計算機軟件系統，要想與外界交互，必須藉助物理實體來完成。當年AlphaGo與李世石對戰時，仍然需要人類代為執行移動棋子的動作，其實完全可以換成一個機器人/機械臂來代替這個人。

李世石與AlphaGo對戰時，代表AlphaGo下棋的人可以換成機器人

任何一個系統對外界的影響程度取決於它的輸出能力。

計算機系統的輸出都是虛擬的，無法對現實世界產生物理的影響。

而機器人的輸出包含了虛擬（與計算機同等）和物理兩種能力。

機器人有更多類型的輸出能力

多輸入多輸出能力是通用機器人平台的基礎能力，也是機器人具備從事多種多樣任務能力的硬件基礎，也由此構成了機器人作為物理世界平台的基礎。通常，平台化的產品具備如下特徵：

基礎功能（設施）足夠完備
開放的架構和豐富接口（APIs）
完善的開發工具；

其中，基礎功能足夠完備是一個基礎特性或者使能（Enabling）特性。

例如，早期的計算機能力只是計算器水平，只能進行簡單的運算，即使有再開放的架構和豐富的接口也無法開發出視頻聊天APP。機器人如果只有簡單的抓取和移動能力，也無法完成更複雜的任務。

在多模態大模型之前，即使機器人已經具備了多模態的硬件能力，在軟件層面仍然很難使用一個模型涵蓋所有情況。比如對於傳統NLP模型來講，輸入輸出都是text範式，讓只使用NLP模型的機器人“理解”不同的輸入和輸出組合能做什麼不能做什麼是一個非常困難的事情。

現在有了多模態大模型，機器人終於可以開始理解如何合理使用它的多種輸出能力來更好的完成任務了。

因此，計算機是虛擬世界的通用平台，機器人是物理世界的通用平台。

當然語言大模型和圖像大模型以及其他多模態大模型之間的知識如何影射、如何鏈接仍然是一個未能很好解決的難題，但是至少我們具備了實現這個願景的技術基礎。

面臨的挑戰

不確定的安全性

這裡涉及的安全性包括兩個部分，操作安全性與數據安全性，其中操作安全性又可分為任務級安全性與操作級安全性。

任務生成的安全性

這裡的安全性，指的是大模型生成的任務動作是否能很好的適應新環境和新情境，不會對環境造成破壞或者引發安全性後果，本質上是模型產出的魯棒性問題；

在實際環境中使用機器人的一個難點在於，機器人的動作會改變環境本身，而環境的改變又會影響機器人的下一步動作，能否在新的環境裡更新任務並順利執行到底，對於機器人能否被應用到非結構化場景中至關重要。

例如，有一個機器人在給廚房幫忙用蒸箱蒸饅頭，蒸之前開蒸箱門往裡面放是不需要考慮太多因素的，只要別發生碰撞即可。但是蒸好之後需要打開蒸箱拿出來的時候就需要考慮旁邊是否有人，因為蒸箱打開的時候高溫蒸汽噴出會對旁邊的人造成燙傷，機器人是否能認識到這一點並在生成“打開剛剛使用過的蒸箱”任務動作時，考慮高溫蒸汽對人的影響（沒有人的話可以直接打開，有人走過來的話就要晚點開或者提醒人員離開一點）就是很基本的安全要求了。

“等人離遠點再打開蒸箱門”或者“播放語音提醒人員注意高溫蒸汽”這兩個動作對於機器人來講很簡單，但是能否在合適的時候生成這兩個動作指令，需要機器人具備生活的常識。

雖然大模型具備很強的通識能力，但是如何保證每一次生成的任務都符合彼時情境的安全規範，仍然是一個需要持續優化的問題。

操作動作的安全性

除了以上需要常識就能解決的任務生成問題，在很多需要專業技能的領域機器人還要關注細微工藝動作是否符合安全規範，譬如在機器人手術中，機器人生成的磨削骨頭或者切割軟組織的某個細微動作是否符合手術手法要求，是否會對病人造成額外傷害，也是需要慎重考慮的問題。

提高AI和機器人系統的安全性是一個長期過程，這有賴於從業者的不斷努力和探索。

但是從工程化落地角度來看，我們要正確看待安全性問題，安全不等於絕對的無風險。

安全的另一種解釋是“不存在無法承受的風險”。

想像一下，乘坐飛機出行安全嗎？在路上飛馳而過的汽車安全嗎？

如果過於強調安全問題，裹足不前，機器人就不可能獲得大規模推廣。

因此必須要設定一個合理的責任劃分尺度，由機器人的設計者和用戶共擔風險，從社會角度承認利益與風險共存是機器人大規模推廣的必備條件。

實際上這種形式在我們生活中隨處可見。

全球範圍內，人類司機每年因為交通事故殺死100萬人；由於工作相關的意外事故和職業疾病導致的死亡人數約為300萬人；因為醫療事故/錯誤的醫生診斷或導致超過250萬人死亡。

機器人+AI系統的引入會大幅降低各個行業的傷亡率，機器人並不需要完美，機器人只要做的比人好就行。

數據安全與信息安全

在訓練大模型以及使用大模型的時候，不可避免涉及到敏感數據的問題，譬如用於訓練的語料中存在敏感數據或者給到大模型的input中存在敏感數據。

數據與信息安全性是一個繞不開的話題，現在還沒有形成統一的標準，如何處理高質量數據全面性與信息安全之間的平衡，這個問題需要留給從業者慢慢去解決。

但是從機器人應用大模型的角度來看，如果我們把開發目標從通用機器人AI轉換為“具有通用性/強泛化能力的技能機器人AI”，事情就會變得簡單一些。

我們希望的是通過大模型來代替一部分機器人應用工程師的工作，或者說期望機器人應用大模型具備焊接工、裝配工、噴漆工、按摩師、外科醫生的通用知識與技能知識，而這些人完成自己的工作，其實是不需要掌握國家敏感數據，甚至也不需要知道企業的敏感數據。

他們需要的只是通識與技能數據，大模型同理。

當然並不是說數據安全問題在大模型應用的過程中不重要，未來一個國家可能只會存在少數幾個Foundation Model，從基礎設施角度來看，數據安全當然非常重要，也是需要從業者付出努力去解決的問題。

但是從某個具體應用角度來看，至少目前為止我們無須過度關注數據安全問題。

高質量訓練數據缺乏

機器人需要通過多種傳感器感知環境狀態，然後執行實際動作來完成任務，因此訓練用於機器人的大模型需要用到大量機器人在真實世界中與環境進行交互的數據集。

相比圖像和自然語言處理領域可以從網上大量獲取訓練數據或者通過人類標註快速低成本的獲取數據，可用於訓練機器人學會執行新任務新技能的高質量數據非常匱乏。主要原因有：

與CV和NLP相比，機器人執行任務通常需要花費更多時間，這導致收集數據的效率很低；
CV和NLP訓練過程中只需要處理虛擬信息，而機器人訓練過程中會對周圍環境造成影響，可能會破壞環境、損壞任務對象，最終造成財務損失，而且這種損失在訓練完成之前是不可避免的；
機器人保有量還太少，可用於收集訓練數據的機器人就更少，進一步加重了數據收集的難度。

此外，考慮到機器人執行任務時，面臨的環境和交互內容模態更多，更加複雜，因此需要的數據集規模也比CV和NLP領域要大，例如，最新的GPT-4剛剛能理解下圖中展示的內容（當拳擊手套掉落時，球會被彈起），業界已經開始用“恐怖”來形容GPT-4，但是這樣的理解程度對於需要執行各種複雜物理交互的機器人來講，只是基礎要求。

通過仿真的方式可以快速、低成本的獲得一些機器人訓練數據，但是一直以來受限於仿真模型的精細度、物理模型準確度、感知數據的準確性等原因，仿真數據與真實數據之間都存在巨大的差異，使得在仿真環境中只能訓練一些對精度要求不高或者弱接觸的場景。虛實遷移（Sim-to-Real）的研究者一直在試圖努力縮小虛實數據的差異，從而最終達到通過虛擬場景進行大規模的數據收集和訓練的目的。

另外一個可能的方向是利用視覺與自然語言處理方向的成果，使用LLM自動生成用於訓練機器人的數據集，從而顯著降低數據獲取的時間和財務成本。但是LLM自動生成的訓練數據可用性如何仍然是一個未解決的挑戰。

觀察學習（Observational Learning）也是一個可能的方向，通過讓模型觀看人類教學視頻的方式來學習和理解某些技能，但該項研究仍處於相對早期的階段。

總之，在欠缺優質數據的大背景下，仿真數據、真實機器人數據、教學視頻、自然語言數據都有可能對訓練機器人基礎大模型有至關重要的作用。

展望

對機器人行業的影響

與計算機、手機、汽車等行業相比，AI與機器人產業尚處於早期發展階段，大模型的能力與機器人的能力其實還沒有強關聯，是傳統意義上“完美機器人”的兩個獨立又關係密切的組成部分，類似於計算機的軟件和硬件。

因此，在可預見的未來，包含AI和機器人的泛機器人產業圈，會分化為兩類公司：

以機器人核心零部件、精密控制為核心的機器人公司，為行業提供機能強大、高度開放、成本可控的機器人標準產品；
以行業大模型應用技術解決某些細分場景/行業的機器人應用產品公司，基於大公司提供的基礎模型+其在行業的Know-how，提供行業的整體應用解決方案（包括軟件和硬件）；

在這個假設下，對於機器人產品的評價指標與定義即將發生變化。

就像汽車領域，一直以來汽車作為交通工具，其主要功能是把人從A點移動到B點，交通工具的主要關注點是操控性、通過性、底盤調教、質感。隨著汽車電動化、智能化的發展，現在汽車更多關注傳感器能力、自動駕駛水平、座艙智能化程度、甚至冰箱彩電等。車還是那個車，但是定義什麼是好車的參數和指標發生了變化。

機器人同理，之前機器人關注精度、速度、振動抑制等等，未來可能更關注感知能力（多少種傳感器）、安全性、操作簡易化水平、環境交互能力、接口開放程度等。

我們經常說，機器人是一個軟件產品，隨著AI大模型的發展，機器人的功能越來越多，機器人軟件化的定義將愈加明顯。如果機器人公司沒有強大的軟件能力和服務，將無法直接與客戶交流，無法獲得寶貴的用戶數據，最後變成一個組裝低毛利、低門檻機器人的打鐵公司。

以上言論可能顯得危言聳聽，但是有一點是確定的，即大模型會給機器人軟件系統帶來系統性的變革，不積極擁抱大模型的機器人廠家，就像當年沒有積極開發自己智駕系統的傳統汽車廠商一樣，逐步在新的競爭中失去活力。

可以預見的是，之前面向固定領域的工業機器人、協作機器人、移動機器人的產品形態將無法滿足未來更多樣任務的需求，多模態大模型必然需要多模態（感知、移動、操作等）機器人。

有用的機器人≠完美機器人

AI大模型的驚人表現預示著AI產業走出了這兩年由於高級自動駕駛、智能助手產業落地不順導致的相對低谷期，開始重新向上，但是機器人+大模型還處在快速發展路上。

雖然行業市場規律我們無法避免，但是保持合理預期，能幫助我們少走彎路，加快落地速度。

過去數十年的經驗表明，人們往往會高估機器人的能力上限，同時低估機器人下限能帶來的市場空間。

與之有關的一些典型的問題是：

“你的機器人不能百分之百替代這個人的工作，我為什麼要買它？”

“機器人的效率不如人工，從機器換人的角度來算賬算不過來啊”

實際上，機器人在某些環節效率不如人類時可以用增加機器人時長來平衡，例如清潔、夜間作業、低頻長時搬運等。很多化學、藥品實驗室正在落地複合機器人代替工程師進行自動化合成工作。具備高精度微操能力，二十四小時無休的機器人可以解放很多被困在此類重複操作場景中的高級工程技術人員。

在可靠譜預見的未來，絕大部分工作場景中機器人無法百分之百實現/復刻人的能力，但如果我們從少人化/提高人員工作質量的角度來看，只能實現部分替代人工的機器人仍然是個大市場。典型例子是酒店送貨（外賣）機器人，雖然距離合格的酒店工作人員（答疑、送物、指引、清潔）仍然有巨大的差距，當前只是解決了給客房送東西這一個高頻的簡單問題，但仍然給酒店帶來了成本節約和效率提升，使得這一類產品被幾乎所有主流的酒店採用。實際上，現在入住一家主流連鎖酒店，如果這家酒店沒有機器人反而會覺得有點奇怪。

機器人+大模型將使越來越多類似酒店配送機器人細分場景的落地成為可能，而且未來具備多種機能的複合機器人將會比現在簡單的移動機器人提供更多服務和可能性，機器人產業將迎來最大的一波發展浪潮。

對社會的影響

真正的進步來自於工作崗位的消滅。
-----曼昆《經濟學原理》

毫無疑問，機器人+AGI會代替一大批初/中級內容生產者和低技能要求的工作者。

雖然很多人在說，新技術在消滅一部分崗位的同時，通常會帶來更多新的工作崗位，但是這次可能真的不一樣。信息技術的進步會帶來更多的崗位類型，但是崗位絕對數量卻會下降。

從目前的信息來看，機器人+AGI很大程度上屬於勞動節約型技術，由於其本身的強大能力，與之有關的絕大部分工作都可以被其自身和機器人技術所消化（而不是像之前幾次工業革命會產生眾多的工作崗位需要人類去承擔），這次技術進步帶來的崗位數量將遠少於被其消滅的崗位數量。

從更宏觀的角度，可能會呈現更觸目驚心的事實。日本作家新井紀子在2019年出版的《當人工智能考上名校》一書中，介紹了一個專門為考上東京大學而開發的AI機器人，從2011年開始到2016年，這個叫東大機器人的AI系統已經可以達到日本70%以上大學的入學要求。書中還介紹了隨著AI的發展，有一半人將會失去工作。

但是，《當人工智能考上名校》一書出版於2019年，彼時的作者並沒有預料到大模型的湧現現象，整本書中對於AI的威脅的描述主要體現在知識儲備、搜索與匹配角度，而AI對於常識理解不夠這個事情則被當成了AI在短時間之內無法超越人類的最大缺點，常識理解也是人類最重要的優勢。

然而，就是這麼一個給人類僅存的希望，在書籍出版的三年後，很大程度上已經被大模型推翻了，也就是說，人類除了在死記硬背的知識方面pk不過AI，在之前自以為有優勢的常識、理解、推理層面，也出現了巨大裂痕。

馬斯克在最近CNBC的一次採訪中，被主持人問到：“當人工智能這項技術存在並且不斷改進的時候，我不知道該如何給與孩子職業發展的建議。我很好奇，當你考慮給你孩子的職業生涯提供建議時，你會告訴他們什麼是有價值的？”馬斯克沉默了大約20秒，給出了這樣的答案：

“Well, that's a tough question to answer. I guess I would just say to follow their heart in terms of what they find interesting to do or fulfilling to do. You know , try to be as useful as possible to the rest of society. ”

也許，這是用一種委婉的方式在表達，未來有99%的可能性你的孩子會被AI和機器人代替，但是我們無能為力。

大劉的短篇小說《朝聞道》裡有這樣一段對話：

“這個原始人仰望星空的時間超過了預誓閥值，已對宇宙表現出了充分的好奇。到此為止，已在不同的地點觀察到了十例這樣的超限事件，符合報警條件。”
。。。
。。。
排險者露出那毫無特點的微笑說：“這很難理解嗎？當生命意識到宇宙奧秘的存在時，距它最終解開這個奧秘只有一步之遙了。”看到人們仍不明白，他接著說，“比如地球生命，用了四十多億年時間才第一次意識到宇宙奧秘的存在，但那一時刻距你們建成愛因斯坦赤道只有不到四十萬年時間，而這一進程最關鍵的加速期只有不到五百年時間。如果說那個原始人對字宙的幾分鐘凝視是看到了一顆寶石，其後你們所謂的整個人類文明，不過是彎腰去拾它罷了。”
丁儀若有所悟地點點頭：“要說也是這樣，那個偉大的望星人！”

機器人的未來如何將繼續考驗行業內外許多人的智慧與能力，但是在歷史洪流的發展進程中，新的拐點或者機遇終將如期而至。

經過半個多世紀的發展，今天的機器人產業也許正迎來仰望星空的那一刻。

當“人類”抬頭仰望星空的那一刻，就注定了我們不凡的命運

~數字時氪