李開復:AI大模型是不能錯過的歷史機遇 AI2.0市場預計將是移動互聯網規模的10倍

“未來,我認為最具革命性的AI 2.0應用是AI-First。”創新工場董事長李開復在演講中說道。

什麼是AI-First應用?就是指那些離開大模型就無法存在的應用。

5月28日,創新工場董事長兼首席執行官、創新工場人工智能工程院院長李開復在2023中關村論壇上,發表了題為《AI1.0到AI2.0的新機遇》的演講。

他在演講中針對那些對大模型發展存疑的聲音,從大模型發展的商業價值、AI2.0對未來應用生態的影響以及中國大模型發展的展望等方面,給出了自己的見解。

他表示,即便是不完美的大模型,也存在幾十萬億美元的商業價值。未來的AI2.0市場預計將是移動互聯網規模的10倍,容納得下巨頭、中小企業、初創公司在三個層級的賽馬。期待能形成巨頭、中小微創新企業一起發展的“創新綜合體”。

AI 2.0市場預計將是移動互聯網規模的10倍,期待能形成巨頭、中小微創新企業一起發展的“創新綜合體”。



李開復演講的精彩觀點如下:

1. AI 1.0時代每個應用都是一個孤島,但有了大模型之後,一次性用海量的數據去訓練一個基礎大模型,再用這個模型去調適所需的應用,這樣成本就降低了很多。

2. 即便一個非完美的大模型,它還是有相當大的商業價值,甚至是幾十萬億規模的商業價值。這就看人類如何與它協作,也就是所謂的Human in the loop。

3. 我們完全可以想像今天的Word、PowerPoint、Excel、Photoshop等應用通通都會用AI大模型重寫一次,而且重寫之後它的用戶體驗會變,甚至商業模式也會變。

4. 當年如果要選擇在移動互聯網創業或者投資,那一定要選那些非有移動不可的APP,那麼今天要在人工智能領域創業,就一定要做非有人工智能不可的APP。

5. 模型大小並非大模型發展的唯一決定因素,數據質量更重要。

6. AI 2.0市場預計將是移動互聯網規模的10倍,期待能形成巨頭、中小微創新企業一起發展的“創新綜合體”。


來源:視頻截圖



以下是李開復演講全文(有刪減)

很高興有這個機會從我們投資機構的角度來看最近的AI 2.0,我可能是投資機構裡最懂AI的,也可能是AI領域裡最懂投資的。這兩年看到整個AI 2.0和大模型的啟動,我感到很興奮,幾乎把過去5年的相關論文都讀了一遍。創新工場的投資、科技團隊也都在研究這個領域,為此還特地到美國去了解OpenAI、Google和微軟的一些最新動態。

今天我想介紹的不是創新工場投資的公司或者其他實際的業務,而是針對近期很多關於AI 2.0大模型方面的質疑,希望能夠做一個比較通俗的講解,對大家有所幫助。


01 大模型的商業價值

什麼叫AI 2.0?在我們創新工場看來,從投資產生經濟價值的角度,將AI的發展階段劃分為AI 1.0和 2.0。AI 1.0是AlphaGo之後發生的深度學習,以及這種深度學習進入各行各業並創造了價值。

AI 1.0從八九年前就開始發展了,但是這兩年碰到了一些瓶頸,而這些瓶頸正好都是大模型能夠解決的。AI 1.0遇到的瓶頸是什麼?當時還沒有大模型的時候,我們要做一個領域的AI應用,需要去該領域收集、清洗、標註數據,然後再拿去調整模型,整個過程的成本是非常昂貴的。

對於像抖音、阿里或者百度這樣的大公司來說,那是沒有問題的,他們收集的數據實在太多了,可以用來賺錢的機會也很多,但是如果你是一家銀行、保險公司或者工廠,那麼在AI應用的落地方面就存在巨大的問題,成本高得難以承受。

而大模型的特點就在於可以一次性訓練一個大模型,然後當你要應用的時候做一個遷移學習或者微調就可以。AI1.0時代每個應用都是一個孤島,但有了大模型之後,一次性用海量的數據去訓練一個基礎大模型,再用這個模型去調適所需的應用,這樣成本就降低了很多。比如類似“小愛同學”這樣的音箱產品,可能會碰到一旦跳出“小愛同學”懂的領域,它就懵了,你會發現智能音箱其實並沒那麼智能,它只能做一些放音樂、查天氣的簡單事情,還有很多事情都做不了。但是當你放了一個類似ChatGPT的東西進去,它的知識儲備就被激活了,只要你把它的對話模式調整好,就能成為一個非常好的對話機器人。

如果你還想這個機器人能夠訂機票、做銀行客服、處理客戶的抱怨或者客戶的一些問題,那麼我們就再把大模型進行微調,讓它進入到具體的應用場景裡。

過去做一個銀行的Chatbot客服,也許需要花幾千萬元,現在只要幾百萬元就可以做得比之前好很多。所以大模型的價值絕對不只是一個很聰明的AI搜索引擎,而是能帶來應用的爆發。

現在的大模型還存在一本正經胡說八道的問題,這個問題非常難解決,因為它的推理能力也來自同樣的理由,所以如果你把它的胡說八道降到了接近零,那它的推理能力幾乎也沒有了,所以那些讓它聰明的理由也是讓它胡說八道的理由。

即便一個非完美的大模型,它還是有相當大的商業價值,甚至是幾十萬億規模的商業價值。這就看人類如何與它協作,也就是所謂的Human in the loop。

記者用AI來幫助他寫作,或者律師用AI來幫他做訴訟,最後只要這個文章或者訴訟還是由人來把關和負責,AI只是做一個初步的撰寫,那就沒有問題。人知道AI會犯錯,所以只是讓它打一個草稿,並不會讓它直接服務用戶,確保用戶不會被它錯誤的信息傷害。

AI充分發揮其海量數據基礎的優勢,比如可以在看了1000篇文章的基礎上寫出新的總結,看完過去一萬個歷史訴訟的基礎上寫出總結,這些高質量的總結可以讓記者或者律師得到有用的信息,讓人來把關AI有沒有犯錯。

還有就是在某些領域裡,大家其實不在乎AI犯錯,比如在娛樂的應用裡,做個遊戲裡面的英雄,鬍子長一點短一點,都是無傷大雅的,或者它講錯了一句話也沒什麼關係,反正在遊戲裡都是杜撰的。其實很多應用領域是可以容忍這些不完美的大模型的,基於這個事實的分析,AI在生產力方面的應用有著巨大潛力。當然有些領域非常關鍵,是不能容忍犯錯的,比如新聞搜索、政府的網站或者是醫療教育相關,這些領域就很難做,未來需要解決大模型犯錯這個問題。


02 AI 2.0 改寫應用生態

我們完全可以想像今天的Word、PowerPoint、Excel、Photoshop等應用通通都會用AI大模型重寫一次,而且重寫之後它的用戶體驗會變,甚至商業模式也會變。還有一些領域,他可能犯錯的代價不是太大,比如用來做廣告的推送,一個廣告推錯了,也是無傷大雅的。今天我們本來就被錯誤地推送了很多廣告,我們打開電視和網站所接收到的廣告也不是有針對性的,但是AI可以讓廣告變得更有針對性,雖然偶爾它也會犯錯。

所以僅僅是上面這幾個領域,我覺得就是一個幾十萬億美元的機會了。當然我們還要繼續努力,降低它胡說八道的頻率,這裡有一整套的方法,從預訓練的數據到訓練的對齊,再到之後的處理,還有一些預警和臨時能夠快速修正的方法,這些結合在一起,我相信是可以做到的。

生產力是最大的機會。AI 2.0大概有三個生態,我們平常談到最底層的是基礎模型,剛才上面談到的是最上層的應用層,比如幫你們寫稿子、寫訴訟、畫圖、摳圖等。還有一個中間層,提供模型精調、推理遷移學習的各種工具,幫助大模型更高效地實踐。

中間層有兩個部分,第一種是從基礎模型層往外擴展,比如說模型做得這麼大,需要做推理的時候能不能把它縮小,針對某一個領域把一個大模型變成一個小模型,或者剛才講的去降低胡說八道頻率的問題。

另外一種是從應用層往下的調整,比如我們要重寫一個photoshop的時候,你可以講一句話圖就出來了,但是可能還要再進一步說我要把彩虹顏色變一變,或者裡面的觀眾男女比例調一下,這就需要大模型有一個智能的切割,對一些物體有理解才能做到。這些其實跟大模型本身沒有直接的關係,但是你沒有這些功能,就不可能把photoshop推送給一個想做圖的人。

中間層其實非常重要,中間層讓我們想到什麼?比如說windows、安卓、蘋果提供的中間層目的非常簡單——讓應用開發的成本降到最低。這樣才能讓應用的數量變多,打造一個用戶帶來更多應用的良性循環。

之前我也講過AI 2.0時代的來臨,是一個平台+應用的模式,當你有這個平台技術之後,它會改寫每一個領域。我們可以明顯地感覺到,比如說在製造遊戲的時候,你所有角色的產生,包括背景、道具、衣服甚至所有的代碼,最終都會用AI來寫,所以很可能以後一些小朋友在社區裡面把他想玩的遊戲寫出來,大家彼此用文字做一個遊戲的介紹,幾秒鐘以後就可以玩了。

剛才講的電商和廣告也是一個例子,我們可以針對每一個人,根據他的需求、認知、受教育程度以及購物習慣,為其量身定做廣告和圖片,這樣會最大程度地提高他的購買慾望。當然這裡會面臨監管的問題,如果你寫的是假的,或者傷害了用戶怎麼辦?這還是需要法律的監督,但希望這兩個例子大家可以理解,大模型真的不只是一個問答引擎,它改變了所有APP的生態,它會讓我們今天用的每一個生態系統都被改寫一次。


03 要做大模型時代的AI-First


大模型改革的不只是人工智能,還會帶來一些平台式的巨大差距。所有的應用裡面,AI-First將是最重要的應用,什麼是AI-First?就是這個應用沒有AI,它就不成立。比如我們現在用的一些Mobile-First應用,像美團、滴滴、抖音這類公司,它們開發的應用是基於移動手機全天候在人身上的前提下,離開手機,這些應用就沒辦法用。

這些公司是充分完整地利用了移動手機帶來的功能,開發出了適應移動手機的新應用,獲取了我們的地理位置,我們才能用它們完成打車、外賣這些活動。那麼其他公司,比如新浪、網易、豆瓣等,他們在移動互聯網時代也做得挺好,但它們只是把PC的應用平移了過來,所以並沒有得到同樣的爆發。當年如果要選擇在移動互聯網創業或者投資,那一定要選那些非有移動不可的APP,那麼今天要在人工智能領域創業,就一定要做非有人工智能不可的APP。

AI-First簡單來說,就是如果把大模型抽掉,應用就會完全癱瘓無用。這種應用是我們今天特別需要做,它將是這個時代未來的寵兒,它的整個用戶體驗可能更多的是用人類的語言來學著跟我們交流,而不是逼著我們去學計算機的語言。

當然我們都知道還有很多的挑戰,這裡包括虛假信息、隱私保護等問題。所以加強監管是必不可少的,但同時我們也需要更多技術來幫著解決這些問題。如果僅僅用監管或者技術肯定是不夠的,兩種方式應該結合起來做。

最近市場上出現了一些有爭議的聲音,比如“使用海外的開源大模型就可以做出中國版OpenAI”“不需要做大模型,小模型就足夠了”“大模型燒錢且耗人,只有巨頭才有入場券”“中國大模型創業公司過多”等。在我看來,開源是非常重要的,中國的技術未來肯定需要開源,因為高校還有創業者沒有開源,很難得到啟動的力量。

但是我們千萬不要相信一些網上說的我拿了一個開源模型,比如說GPT-4去訓練,突然發現模型跟GPT-4一樣好了,所以大模型沒有價值了,你們都不用做了,這個是絕對錯誤的。

因為第一,開源模型本身可能有局限性,當你做大模型訓練的時候,需要非常多的GPU,成本比較大。開源模型基本是把你這個模型的天花板定下來了,然後你再做裡面的對齊調整和學習的工作,這些工作帶給模型的提升是由你的天花板決定的。如果一開始你的天花板就是GPT-4,那肯定沒辦法做出超過它的大模型。第二,很多人用GPT-4來訓練它們的開源模型,但我們真的不能保證GPT-4未來會繼續開放使用。還有第三個問題是拿這些海外訓練出來的模型在國內來做微調,這是非常危險的。因為國內外的文化、習慣、法律法規都不一樣,拿一套美國訓練出來的模型來中國調試,你覺得那些框架能解決國內的問題嗎?

所以我還是相信大模型開源是有必要的,當然未來不可能有50家大模型公司存在,這個會收縮到一個比較小的數字,就像美國搜索引擎剛開始的時候也有10來家,後面通過併購,剩下來的五六家都發展得很好。像Google是最後起來的,反而發展成第一,所以我覺得其實具體會有幾家,是以大公司為主還是小公司為主,現在都還沒辦法太早下定論,大家都還有機會。

今天尤其在這個領域我們還在趕追的時候,還是應該鼓勵各種不同的發展模式,因為我們也很難知道誰能做成。

大模型演進有三步,第一步是中等規模的大模型,大多數中國參與者都在這一步,第二步是跨越“湧現”門檻,成為主流大模型,目前中國部分大模型公司已經達到600億的數據規模,大致處於第二個階段了,但是中國的數據質量還不夠高,想要邁入第三階段,數據質量和數據規模都很重要;第三步是成為領先的大模型公司。目前只有國外的兩家公司到了第三步,他們的模型數據規模和數據質量都很不錯,還有一個人類反饋的強化學習,它能鏈接到很多下游的應用。

我想講的一點是在模型方面,特別我覺得OpenAI的GPT-4裡面有一點大家都沒注意到,就是它的模型擴展(scale up)功能,這個功能號稱可以用千分之一或萬分之一的時間來預測一個模型的訓練是否會成功。

當我們訓練一次大模型要一個月的時候,如果犯錯了,那就浪費了幾千個GPU,那麼這一套scale up的功能一定程度上量化了訓練成功的可能性,可以減少浪費。不過我們現在並不知道OpenAI如何操作這個scale up的,只能從他們發出的一些論文裡去試著做這個事情。如果我們面臨GPU匱乏的情況,還是需要去了解如何將我們的GPU用到極致。

模型大小並非大模型發展的唯一決定因素,數據質量更重要。在AI1.0時代,我們訓練各種不同的語言模型的時候,數據是越多越好,有一點小錯也無傷大雅,但是大模型訓練我們得到的經驗是數據質量跟數量都重要,但是相比來說質量是不可犧牲的,這一塊我認為需要國家的力量來幫助和推動。

美國的互聯網數據比中國的質量要高,比如說我們家人健康上有任何的問題,我一定是去WebMD或者Cleveland Clinic上去找,但中國就沒有類似的網站。中國目前還沒有公益性的數據匯集平台,所以我們還是需要國家政府的力量去推動高質量數據的匯集,縮小與國外數據質量的差異,接下來中美的差距可能就體現在這個數據質量上面。


04 AI 2.0展望

未來,我認為最具革命性的AI 2.0應用應該是AI-First。最終能夠脫穎而出的是那些敢於全力投入新技術的先驅者。以前是人類需要學習計算機語言,那麼以後很可能就是計算機學習我們的語言,這會大大解放我們的時間。我們只要把想做的事情告訴AI它就會幫我們完成。比如我可以跟智能助手說,明天是我太太的生日,我需要鮮花、蛋糕、禮物,它就統統幫我搞定,這個就節省我巨大的時間。現在我們是招助手來幫我們做這些事情,節省時間,未來這些都可以用AI助手解決。

未來,我也相信大模型不會只是一個聊天工具,會慢慢超出用戶的期望,發展成一個智能生產力工具。最終這一天到達的時候,我們就會發現目前的商業模式將改變,App Store就不存在了。

比如當我跟AI說我老婆生日幫我買蛋糕、鮮花時,它就不用去電商網站了,可以直接跟倉庫下單,所以會顛覆現有的商業模式,帶來更多的經濟機會。現在我們看到的AI應用基本都是在虛擬世界,但是未來AI將走向實體。

我們有一個理念叫Embodied AI,就是說你將海量的視頻作為訓練數據,也有可能讓機器人了解你的需求。你跟它說來點薯片,它就知道需要打開抽屜,需要拿盤子,需要倒出來等等,當然未來三五年之內可能很難見到它們進入實際應用的場景,但學術和產業的結合讓這一切看起來並不是遙不可及的。

所以AI大模型是中國不能錯過的歷史機遇,這是有史以來最大的一個平台革命,它比windows、安卓帶來的變革要大10倍。它會改寫所有的應用,重構人類的工作,讓有創意的人能更好地聚焦於研究工作,將他們的聰明才智放大10倍或更多,同時很多重複性勞動會被取代。

中國目前的起步比美國晚了一些,但是中國有龐大的應用市場,中國經濟各方面的連接性也很強。中國政府在面對資源調配和工作安排上能比西方國家做得更好,能有效地讓更多中國人走向適合他們的崗位。

中國還有著巨大的人才優勢,中國的AI工程師、AI科學家數量都非常多,可能頂級的還是在美國,但中國很多年輕的科學家也都非常厲害。不過我們還有一個挑戰,就是過去的算力不如美國,在大模型上的經驗會比較少,但是我相信在政府、大企業和投資公司的共同努力之下,我們一定很快能夠克服這樣的問題。

美國著名的投資機構的安德里森·霍羅維茲對這個領域有一個預測:“這個市場的潛在規模難以把握——將介於所有軟件和所有人類的努力之間。” AI 2.0市場預計將是移動互聯網規模的10倍,期待能形成巨頭、中小微創新企業一起發展的“創新綜合體”。(中國企業家雜誌)