熱鬧了3天的上海外灘大會終於落下了帷幕,但餘音還在迴盪。作為金融科技頂會,上一屆的外灘大會時,金融科技中金融的“濃度”很高,而這一屆大會,科技成為了主旋律。人工智能,尤其是大模型,成了本屆大會的熱詞。
這也不奇怪,根據最新的統計,國內“百模大戰”的參戰方已經增加到了至少130家公司,其中做通用大模型的有78家。從投資的角度來看,今年上半年生成式人工智能領域的投資額,已經超過了去年全年,美國頭部的前25家AI公司總融資額超過了170億美元。
麥肯錫中國區主席、全球資深董事合夥人倪以理在外灘現場預測:“AI 對全球經濟的潛在收益將達到25 萬億美元,是當前所有企業最重要的賽道之一,但這個時代剛剛開始。”
大模型的魅力為什麼這麼大?螞蟻集團(以下簡稱“螞蟻”)董事長兼CEO井賢棟引用電影《奧本海默》的一句台詞:“this is not a new weapon. this is a new world.”在他看來,大模型是一項新技術,但又不只是新技術,而是足以引發世界級的變革。
自然而然地,螞蟻也發布了他們的金融大模型。據了解,這款大模型是基於螞蟻的自研基礎大模型,然後針對金融產業深度定制的。此外,螞蟻還發布了基於金融大模型能力的兩款產品:智能金融助理“支小寶2.0”,服務金融產業專家的智能業務助手“支小助”。
其中,“支小寶2.0”已內測近半年,將在完成相關備案工作後上線。“支小助”正在與螞蟻平台合作機構內測共建,為理財顧問、保險代理、投研、金融營銷、保險理賠等金融從業者打造全鏈條的AI業務助手。
可以說,在金融科技領域,以後大模型也是頂流了。
對到場的專家和學者們來說,他們又是怎麼看待大模型的呢?以及,大模型又該如何落地行業,真正改變世界呢?
01.大模型時代
人工智能70年的發展中,經歷了多次的高峰和低谷,但“讓機器掌握完成複雜任務的知識和能力”這一終極目標卻基本沒有改變。
當前,我們可以說已經進入了“大模型時代”,大模型的特點就是可以實現大規模無標註數據的深度學習,由於無標註數據廉價且易得,模型學習的範圍和水平都迎來了極大的提升,大模型的參數量也在不斷攀升,從1億左右增長到了現在GPT的31750億,可以說是科技領域的暴力美學。而且從ChatGPT的經驗來看,更多的數據、更大的模型還可以帶來更多的智能。(以下部分內容和圖片來自清華大學計算機科學與技術系副教授劉知遠的演講,文中不再另做說明)
可以說,大模型是邁向通用人工智能的技術。劉知遠總結了大模型在兩方面的優勢,首先,是通用框架,能有效降低開發成本。自上世紀五十年代以來,成千上萬個不同的神經網絡解決方案被提出過,但在2017年Transformer被提出來後,這些神經網絡架構日益混凝在Transformer架構下,2020年後大模型的發展,讓大語言模型架構更加統一。
其次是大模型的通用能力,能有效降低適配成本。以前深度學習模型總是用於專用的任務,標註專門的數據,訓練專用的模型,而沒有辦法拓展到其他任務。比如場景像客服、營銷、售前,行業像房地產、金融,最後結果是每一個行業的每一個場景都要做一個小模型,總的成本就很高,但通用大模型微調後可以完成不同的任務,在每一個任務都可以有非常好的表現。
也因為這兩方面的突出優勢,大模型有潛力成為智能時代基礎設施。劉知遠認為,邁向通用人工智能的路徑會是語言智能、多模態智能、工具智能、具身智能、群體智能,目前人類語言的智能已經基本被實現了,接下來會是其他智能相關探索。
以上是技術層面的分析,從商業的角度來看,大模型能掙到上一代AI掙不到的錢。小冰公司CEO李笛認為,以前行業靠粗放式的API調用和Traffic的模式,賺到的錢基本就是成本。比如為媒體生成稿件,撰稿人原來每篇是1500元,但API調用,一家媒體可能每月只支付幾百塊,最後整個市場不過大幾十萬。
還有最近很火的遊戲公司用生成式AI做美術資源,可以為遊戲公司節省幾百萬上千萬的成本,但他們願意為專門私有化部署的模型支付價格大概也就10萬人民幣左右。李笛甚至現身說法,目前在汽車智能座艙領域,小冰的市佔率很高,但按調用次數付費,卻連研發成本都收不回來。
而大模型的創造力,可能帶來AI商業模式上的改變,比如去年年底開始,小冰公司和網飛聯合打造了幫助動漫工作室端到端生成視頻作品的平台。如果按照傳統的商業模式,一次性技術開發的收費大概不到30萬人民幣,但一部《人和狗》的3分鐘短片,就為小冰公司獲得了15萬美元的回報。
目前大模型在移動互聯網領域,不斷有應用落地,在企業級應用,也有新的探索,未來在傳統產業呢?大模型還有近乎無限的應用可能,比如,科學家們認為,大模型已經類似於人腦,那如果我們給它外接上攝像頭,它是不是就有眼睛了?如果再加上手臂甚至翅膀呢?隨著深層次人工智能不斷落地和普及,新的改變還將會不斷發生。
02.螞蟻大模型
回到文章開頭,螞蟻投入到人工智能的研發差不多有10年的時間,本身就有非常豐富的AI業務場景,投入方向主要是降本增效和提升用戶體驗。目前,大模型應用的一個難題是喜歡“胡說八道”,因此,在應用到行業上時,尤其是金融這樣追求嚴謹的行業,廠商會格外慎重。
“通用大模型無法在專業嚴謹的領域直接商用,特別是金融服務對錯誤的容忍度很低,金融大模型要確保領域知識和專業邏輯的嚴謹性,才能真正落地帶來產業價值。知識力、專業力、語言力以及安全力,保障四大能力是前提條件,也是金融大模型要解的產業真命題。”螞蟻集團副總裁、金融大模型負責人王曉航在活動中介紹道。
不過,這並不意味著就忽視基礎大模型。螞蟻集團副總裁徐鵬在演講中介紹,螞蟻的大模型體系裡,最核心的依舊是基礎大模型,而且包括語言大模型和多模態大模型。螞蟻的基礎大語言模型也是基於Transformer架構,但採取了跟ChatGPT不一樣的Prefix模型結構。基礎多模態大模型主要的特色是大語言模型和圖文模型進行橋接,原生支持中文、融合文本圖像形態,對齊其語義信息,支持多媒體內容理解和搜索推介,對於圖像的編輯和生成等。
在此之上,再在不同的領域,包括安全、金融、服務等,建設行業模型,通過行業模型實現產品的落地。
螞蟻建設了模型數據體系,包括在互聯網上通過機器進行大量數據的採集加工,通過高效用工管理和內容標註平台產生高質量的數據,來給模型進行精調,進一步人工強化學習等。螞蟻自研了精調框架和強化學習框架,還有智能分佈式訓練引擎和高效分佈式的推理引擎,再之上有開放的研發範式,支持螞蟻內部各業務對於大模型的需求。
從長遠上來看,螞蟻希望推動大模型規模化的產業落地,為此,初步的目標是提升AIGC模型研發的效能和技術的先進性,建設一個可持續發展的AIGC模型的研發範式,一個開發共贏的應用生態,包括建設一流的基礎模型、行業模型,實現To C、To B的產品落地。
總結一下,就是從基礎大模型到行業大模型、再到產業應用的全棧佈局。
以金融大模型為例,螞蟻金融大模型就是基於螞蟻基礎大模型,針對金融產業深度定制。螞蟻基礎大模型平台具備萬卡異構集群,其中千卡規模訓練MFU可達到40%,集群有效訓練時長佔比90%以上,RLHF訓練在同等模型效果下訓練吞吐性能相較於業界方案提升3.59倍,推理性能相較於業界方案提升約2倍。
目前“大模型+知識+服務”的架構已經在螞蟻內部金融智能化場景上內測,理財側的專業服務包括理財選品、產品評測、行情解讀、資產配置等6大類服務,保險側的專業服務包括產品解讀、家庭配置、智能核保、智能理賠等10多個智能服務。基於金融大模型,還有更貼近個人用戶的“支小寶2.0”和“支小助1.0”,提供便捷且豐富的服務。
大模型的迅速崛起和繁榮,不僅是AI發展前沿熱點,也加速了人工智能與各行業深度融合,更強大、更通用、更開放的大模型,還有新算法、新應用、新場景不斷湧現,正成為產業增長的新引擎和投資創業的新風口。不過,大模型也遇到了一系列的問題和挑戰,比如算力能耗、中文公開數據集語料不足、大模型應用安全等,這條路不只是雪厚坡陡,也是道阻且長。(DoNews)