AI大模型群雄逐鹿

2023/04/12

•

科技公司對AI大模型的追逐戰正在愈演愈烈。

4月11日，在2023阿里雲峰會上，阿里巴巴集團董事會主席兼CEO、阿里雲智能集團CEO張勇正式宣布，阿里巴巴所有產品未來將接入“通義千問”大模型，進行全面升級。在他看來，面向AI大模型時代，所有的應用、軟件以及服務都值得“重做一遍”。

“通義千問”是阿里最新推出的超大規模語言模型，於4月7日開始邀請用戶測試體驗。根據21世紀經濟報導記者此前體驗，通義千問可以進行文案創作、多輪對話等功能。

事實上，近期入局AI大模型的科技公司不僅止於阿里。就在阿里官宣全系產品接入“通義千問”的前一天，4月10日，商湯科技“梭哈”大模型，宣布以“大模型+大算力”推進AGI（通用人工智能）為發展戰略。同日，遊戲起家的崑崙萬維同樣放出自家的大模型成果，預告“天工”3.5將於4月17日啟動邀請測試。

除了科技大廠之外，AI大模型創業大軍也在擴容。同樣是4月10日，搜狗創始人王小川宣布，他和前搜狗COO茹立雲聯合創辦了人工智能公司——百川智能，旨在打造中國版的OpenAI基礎大模型及顛覆性上層應用。這也是繼美團聯合創始人王慧文、創新工場創始人李開復之後的又一位AI大模型創業者。

“當前AI大模型仍是新興技術，未來的競爭格局在一定程度上取決於各廠商的舉措、戰略方向與資本投資方向，”在接受21世紀經濟報導記者採訪時，IDC中國助理研究總監盧言霞指出，目前AI大模型處於百花齊放的狀態，未來企業要想真正跑贏對手，需要包括數據、場景、軟硬一體算力等多重能力。

挖掘新故事

你方唱罷我登場。過去的這幾天，可謂中國AI大模型的一場狂歡。

從“通義千問”大模型正式開放邀測，到阿里巴巴官宣全系產品接入，阿里巴巴圍繞大模型的一系列舉措吸引了一眾目光。它意味著，繼微軟、谷歌、百度等企業之後，又一家科技巨頭更新了AI大模型的動態。

需要注意的是，雖然注定是巨頭的牌桌，但在大模型上重新挖掘市場信心，吸引著一眾玩家瘋狂跟進。

4月10日，作為上一代AI獨立創業公司翹楚的商湯科技“梭哈”大模型，宣布以“大模型+大算力”推進AGI（通用人工智能）為發展戰略，並公佈該戰略下的“日日新SenseNova”大模型體系，推出自然語言處理、內容生成、自動化數據標註、自定義模型訓練等多種大模型及能力。

活動上，商湯展示了“日日新SenseNova”大模型體系下的語言大模型“商量SenseChat”，現場演示寫廣告詞、寫邀請函、交替創作兒童故事、看長篇PDF文件并快速做閱讀理解、編寫代碼等多樣能力，能夠支持包括幫助開發者更高效地編寫和調試代碼、為用戶提供個性化的醫療建議、從復雜文檔中提取和概括信息在內的諸多創新應用。

同樣在4月10日，另一家遊戲起家的崑崙萬維也放出自家的大模型成果：“由崑崙萬維和奇點智源合作自研、中國第一個真正實現智能湧現的國產大語言模型——'天工'3.5發佈在即，並將於4月17日啟動邀請測試。”

崑崙萬維所提的“智能湧現”，即AI的思維能力並不是隨著“投餵”模型參數量的線性變化逐漸出現的，而是當參數規模超過某一閾值後，模型的思維能力突然湧現出來，即所謂大模型的“突現能力”（Emergent Abilities）。

4月9日，三六零正式宣布，基於360GPT大模型開發的人工智能產品矩陣“360智腦”率先落地搜索場景,將面向企業用戶開放內測。據了解，企業用戶在PC端360搜索首頁申請並獲得測試資格後，可通過企業安全雲體驗使用。未來，360智腦將與瀏覽器、數字助理、蘇打辦公、智能營銷等場景應用深度結合，全面提升用戶生產力和創造力。

京東集團副總裁何曉冬近日也公開表示，針對真實的產業需求，京東將在今年發布新一代產業大模型。科大訊飛副總裁、研究院執行院長劉聰亦透露，科大訊飛“1+N認知智能大模型”將在5月6日正式發布。

“各路廠家大模型的推出是倉促應戰ChatGPT，”在接受21世紀經濟報導記者採訪時，浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任、研究員盤和林表示，“當前國內AIGC存在空窗期，需求有了，產品沒有，此時各大廠家搶灘登陸AIGC是正確的策略。”

AI軍備競賽

短期來看，無論是OpenAI、微軟、谷歌，還是百度、阿里等廠商，短時間內都以其AI大模型佈局吸引眼球，AI產業的“iPhone時刻”似乎正在以令人目不暇接的面目奔襲而至。

不過，一切新故事的背後，實則是科技企業長期技術積累後的“軍備競賽”。在ChatGPT引爆熱潮之前，科技企業就已經在鑽研AI大模型。此前幾年大模型在學術界早就是熱門話題，2023年才徹底引燃大眾市場。

例如近日，隨著AI大模型潮湧，外界對華為盤古大模型頗為關注，不過實際上，華為對大模型的探索很早就開啟。“AI是華為雲的核心競爭力之一，我們持續在AI領域投入研發，大模型是AI的重要技術方向。”華為雲人工智能領域首席科學家、國際歐亞科學院院士、IEEE/CAAI Fellow田奇向21世紀經濟報導記者表示。

據記者了解，2019年至2020年，盤古大模型就已在華為雲內部立項，並且該模型也完成了與合作夥伴、高校的合作搭建。2021年4月，華為雲盤古大模型就正式對外發布。

彼時，田奇就表示：“預訓練大模型是解決AI應用開發定制化和碎片化的重要方法。華為雲盤古大模型可以實現一個AI大模型在眾多場景通用、泛化和規模化複製，減少對數據標註的依賴，並使用ModelArts平台，讓AI開發由作坊式轉變為工業化開發的新模式。”

百度同樣在大模型領域沉澱已久。2019 年，百度推出了文心大模型ERNIE 1.0。目前，ERNIE 3.0每天接受數十億用戶的搜索請求和其他百度移動生態app的訓練。在搜索方面，自2019年3月以來，文心大模型在改進搜索結果方面發揮了重要作用，帶來排名改進和多模態搜索能力。在雲方面，AI專業知識為傳統行業（如製造、能源和公用事業）提供特定AI解決方案和應用。

阿里巴巴亦自2019年起啟動AI大模型研發，2021年4月，發布語言大模型“PLUG”；2021年10月，訓練出多模態M6大模型，參數規模10萬億。2022年9月，阿里發布“通義”大模型，包括通義M6、Alice mine 以及視覺模型。

商湯則近日一連甩出基於“日日新SenseNova”大模型體系的4款生成式AI應用平台。目前，商湯已打造CV（計算機視覺）、NLP（自然語言處理）、AIGC（人工智能內容生成）多個AI大模型，其SenseCore AI大裝置擁有27000塊GPU，可輸出5000 PetaFlops算力，能夠以最大4000卡規模集群進行單任務訓練，並可做到7天以上不間斷的穩定訓練。

商湯表示，將基於AI大裝置，向客戶提供涵蓋自動化數據標註、大模型推理部署、大模型並行訓練、大模型增量訓練、開發者效率提升等多種大模型即服務（MaaS，Model-as-a-Service）。

“在開源社區已經發布的大模型之外，目前提供商用的大模型包括微軟Azure上整合的GPT大模型、百度智能雲以及百度飛槳支持的文心大模型、華為雲盤古大模型、阿里雲M6大模型。由本土廠商研發的大模型，大多支持本地化部署。”盧言霞向21世紀經濟報導記者分析稱，“過去幾年部署的AI應用，接下來幾年都有可能被基於大模型的AI所替代。升級迭代可能會從優先具備海量數據的場景開始。”

行業大模型路線

在中國各大科技公司佈局AI大模型之際，一個明顯的趨勢是，B端產業路線成為佈局的重要方向。

需要指出的是，注重B端市場的大模型和ChatGPT並非在一個賽場，它們屬於兩個概念。ChatGPT是GPT系列大模型的一個應用場景，可以直接面向C端用戶群體，而諸如盤古在內的大模型應用場景更多聚焦在B端的千行百業。

由此，行業大模型也隨之應運而生。

“（大模型）和行業的結合落地方面，我覺得行業大模型會是一個重要的關鍵性機制。”此前，在接受記者採訪時，百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜直言道。

事實上，百度也正在提速行業大模型的腳步。去年12月，百度聯合多家企業和機構發布5個行業大模型，包括深燃-百度·文心、吉利-百度·文心、泰康-百度·文心、TCL-百度·文心和辭海-百度·文心。至此，文心已累計發布11個行業大模型，涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、製造、社科等領域。

盤古大模型同樣積累了多個行業項目。據介紹，華為雲AI已經在各行業有超過1000個項目，迄今為止陸續推出了礦山、藥物分子、電力、氣象、海浪等大模型。中信建投研報指出，目前盤古預訓練大模型能力已經在包括能源、零售、金融、工業等領域得到驗證。

比如，在醫藥領域，華為雲聯合西安交通大學第一附屬醫院，基於華為雲盤古藥物分子大模型研發出全新的廣譜抗菌藥物，將先導藥的研發週期從數年縮短至一個月；在煤礦領域，華為雲實現一個盤古礦山大模型覆蓋礦山採、掘、機、運、通等主業務環節，大幅縮短模型開發時間，保障井下作業安全，2022年，盤古礦山大模型在山東能源集團正式商用。

劉聰同樣透露，科大訊飛"1+N 認知智能大模型中，"1" 是通用認知智能大模型算法研發及高效訓練底座平台，"N" 是應用於教育、醫療、人機交互、辦公、翻譯、工業等多個行業領域的專用大模型版本。

例如，在智慧教育領域，認知智能大模型可覆蓋" 教、學、考、評、管" 的全鏈路場景，在學習評測、學情分析、個性化推薦等方面助力精準教學；在當下火熱的AIGC 領域，通過在文本、圖像、音視頻的創作上不斷創新，認知智能大模型可以驅動AIGC 的質量不斷提升、成為未來內容生成的主力。

“未來三年，我們認為將會是大模型是風起雲湧的三年，AI將會和各行各業深度結合，AI for industries將是我們的主要方向。”田奇向記者指出。

“百花齊放”終局

AI大模型“百花齊放”的過程中，也免不了相互拉扯。

在官宣AI大模型進展之後，不太體面的是，崑崙萬維在其官方公眾號發文表示，“友商”模型的邏輯推理是靠定向優化來覆蓋特定題庫，不是靠大模型的智能湧現來解答較為複雜的問題，而靠人工打補丁、定向優化的方式是不能真正實現人工智能的——儘管崑崙萬維意在突出自家的大模型效果，但一切仍有待觀察。

拉扯與較勁背後，其實新的問題正在浮出水面：在AI大模型“百花齊放”的過程中，最終誰能夠“贏家通吃”？中腰部廠商是炒作還是真的存在機會空間？

“天工”3.5官宣當日，崑崙萬維披露年報，數據顯示2022年公司實現營業收入47.36億元，同比下降2.35%，歸母淨利潤11.53億元，同比下降25.49%。而截至2022年末，崑崙萬維手裡的貨幣資金為10億元，與此同時，崑崙萬維的現金及現金等價物淨增額為負的5.92億。

在公認中國能上大模型牌桌的廠商數單手可數的情況下，不論是資金實力，還是技術積累，崑崙萬維似乎都並沒有任何優勢，崑崙萬維也在公告提醒稱，“天工”3.5目前仍在測試階段，後續仍面臨技術研發進展不及預期、應用實踐不及預期、商業化落地不確定及行業政策變化等風險。此外，崑崙萬維提示稱，公司持續加大投入，預計還會對公司2023 年財務狀況產生負面影響。

不過，由於搭上AIGC的東風，今年以來，崑崙萬維股價已經從14元一路上漲至4月11日收盤的45元。類似的資本市場AI故事，今年的例子不勝枚舉。

“當前AI大模型仍屬於新興技術，未來的競爭格局在一定程度上取決於各廠商的舉措、戰略方向與資本投資方向，”盧言霞向21世紀經濟報導記者指出，從目前各家的佈局來看，暫時難以斷言未來的格局。

不過她也強調，手握AI大模型的科技企業要想真正跑出來，需要具備多項綜合能力。“（科技企業）得有能力聚集海量數據以及垂深數據，同時要具備面向場景、解決方案商業化的能力，以及具備提供軟硬一體算力的能力。”

誠然AI大模型競速愈演愈烈，但在AI大模型的熱潮下，也湧動著別樣的投資機會。“短期來看，一方面從AI應用本身，將帶動雲服務廠商的AI收入，這部分短期內收入規模略小，可能影響有限。”盧言霞判斷稱，“另一方面影響較大的是算力層，在AI大模型有優勢的廠商，將顯著提升其IaaS層收入，這部分的收入規模變化將轉變雲行業的市場格局。”（21Tech）