科技公司對AI大模型的追逐戰正在愈演愈烈。
4月11日,在2023阿里雲峰會上,阿里巴巴集團董事會主席兼CEO、阿里雲智能集團CEO張勇正式宣布,阿里巴巴所有產品未來將接入“通義千問”大模型,進行全面升級。在他看來,面向AI大模型時代,所有的應用、軟件以及服務都值得“重做一遍”。
“通義千問”是阿里最新推出的超大規模語言模型,於4月7日開始邀請用戶測試體驗。根據21世紀經濟報導記者此前體驗,通義千問可以進行文案創作、多輪對話等功能。
事實上,近期入局AI大模型的科技公司不僅止於阿里。就在阿里官宣全系產品接入“通義千問”的前一天,4月10日,商湯科技“梭哈”大模型,宣布以“大模型+大算力”推進AGI(通用人工智能)為發展戰略。同日,遊戲起家的崑崙萬維同樣放出自家的大模型成果,預告“天工”3.5將於4月17日啟動邀請測試。
除了科技大廠之外,AI大模型創業大軍也在擴容。同樣是4月10日,搜狗創始人王小川宣布,他和前搜狗COO茹立雲聯合創辦了人工智能公司——百川智能,旨在打造中國版的OpenAI基礎大模型及顛覆性上層應用。這也是繼美團聯合創始人王慧文、創新工場創始人李開復之後的又一位AI大模型創業者。
“當前AI大模型仍是新興技術,未來的競爭格局在一定程度上取決於各廠商的舉措、戰略方向與資本投資方向,”在接受21世紀經濟報導記者採訪時,IDC中國助理研究總監盧言霞指出,目前AI大模型處於百花齊放的狀態,未來企業要想真正跑贏對手,需要包括數據、場景、軟硬一體算力等多重能力。
挖掘新故事
你方唱罷我登場。過去的這幾天,可謂中國AI大模型的一場狂歡。
從“通義千問”大模型正式開放邀測,到阿里巴巴官宣全系產品接入,阿里巴巴圍繞大模型的一系列舉措吸引了一眾目光。它意味著,繼微軟、谷歌、百度等企業之後,又一家科技巨頭更新了AI大模型的動態。
需要注意的是,雖然注定是巨頭的牌桌,但在大模型上重新挖掘市場信心,吸引著一眾玩家瘋狂跟進。
4月10日,作為上一代AI獨立創業公司翹楚的商湯科技“梭哈”大模型,宣布以“大模型+大算力”推進AGI(通用人工智能)為發展戰略,並公佈該戰略下的“日日新SenseNova”大模型體系,推出自然語言處理、內容生成、自動化數據標註、自定義模型訓練等多種大模型及能力。
活動上,商湯展示了“日日新SenseNova”大模型體系下的語言大模型“商量SenseChat”,現場演示寫廣告詞、寫邀請函、交替創作兒童故事、看長篇PDF文件并快速做閱讀理解、編寫代碼等多樣能力,能夠支持包括幫助開發者更高效地編寫和調試代碼、為用戶提供個性化的醫療建議、從復雜文檔中提取和概括信息在內的諸多創新應用。
同樣在4月10日,另一家遊戲起家的崑崙萬維也放出自家的大模型成果:“由崑崙萬維和奇點智源合作自研、中國第一個真正實現智能湧現的國產大語言模型——'天工'3.5發佈在即,並將於4月17日啟動邀請測試。”
崑崙萬維所提的“智能湧現”,即AI的思維能力並不是隨著“投餵”模型參數量的線性變化逐漸出現的,而是當參數規模超過某一閾值後,模型的思維能力突然湧現出來,即所謂大模型的“突現能力”(Emergent Abilities)。
4月9日,三六零正式宣布,基於360GPT大模型開發的人工智能產品矩陣“360智腦”率先落地搜索場景,將面向企業用戶開放內測。據了解,企業用戶在PC端360搜索首頁申請並獲得測試資格後,可通過企業安全雲體驗使用。未來,360智腦將與瀏覽器、數字助理、蘇打辦公、智能營銷等場景應用深度結合,全面提升用戶生產力和創造力。
京東集團副總裁何曉冬近日也公開表示,針對真實的產業需求,京東將在今年發布新一代產業大模型。科大訊飛副總裁、研究院執行院長劉聰亦透露,科大訊飛“1+N認知智能大模型”將在5月6日正式發布。
“各路廠家大模型的推出是倉促應戰ChatGPT,”在接受21世紀經濟報導記者採訪時,浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任、研究員盤和林表示,“當前國內AIGC存在空窗期,需求有了,產品沒有,此時各大廠家搶灘登陸AIGC是正確的策略。”
AI軍備競賽
短期來看,無論是OpenAI、微軟、谷歌,還是百度、阿里等廠商,短時間內都以其AI大模型佈局吸引眼球,AI產業的“iPhone時刻”似乎正在以令人目不暇接的面目奔襲而至。
不過,一切新故事的背後,實則是科技企業長期技術積累後的“軍備競賽”。在ChatGPT引爆熱潮之前,科技企業就已經在鑽研AI大模型。此前幾年大模型在學術界早就是熱門話題,2023年才徹底引燃大眾市場。
例如近日,隨著AI大模型潮湧,外界對華為盤古大模型頗為關注,不過實際上,華為對大模型的探索很早就開啟。“AI是華為雲的核心競爭力之一,我們持續在AI領域投入研發,大模型是AI的重要技術方向。”華為雲人工智能領域首席科學家、國際歐亞科學院院士、IEEE/CAAI Fellow田奇向21世紀經濟報導記者表示。
據記者了解,2019年至2020年,盤古大模型就已在華為雲內部立項,並且該模型也完成了與合作夥伴、高校的合作搭建。2021年4月,華為雲盤古大模型就正式對外發布。
彼時,田奇就表示:“預訓練大模型是解決AI應用開發定制化和碎片化的重要方法。華為雲盤古大模型可以實現一個AI大模型在眾多場景通用、泛化和規模化複製,減少對數據標註的依賴,並使用ModelArts平台,讓AI開發由作坊式轉變為工業化開發的新模式。”
百度同樣在大模型領域沉澱已久。2019 年,百度推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受數十億用戶的搜索請求和其他百度移動生態app的訓練。在搜索方面,自2019年3月以來,文心大模型在改進搜索結果方面發揮了重要作用,帶來排名改進和多模態搜索能力。在雲方面,AI專業知識為傳統行業(如製造、能源和公用事業)提供特定AI解決方案和應用。
阿里巴巴亦自2019年起啟動AI大模型研發,2021年4月,發布語言大模型“PLUG”;2021年10月,訓練出多模態M6大模型,參數規模10萬億。2022年9月,阿里發布“通義”大模型,包括通義M6、Alice mine 以及視覺模型。
商湯則近日一連甩出基於“日日新SenseNova”大模型體系的4款生成式AI應用平台。目前,商湯已打造CV(計算機視覺)、NLP(自然語言處理)、AIGC(人工智能內容生成)多個AI大模型,其SenseCore AI大裝置擁有27000塊GPU,可輸出5000 PetaFlops算力,能夠以最大4000卡規模集群進行單任務訓練,並可做到7天以上不間斷的穩定訓練。
商湯表示,將基於AI大裝置,向客戶提供涵蓋自動化數據標註、大模型推理部署、大模型並行訓練、大模型增量訓練、開發者效率提升等多種大模型即服務(MaaS,Model-as-a-Service)。
“在開源社區已經發布的大模型之外,目前提供商用的大模型包括微軟Azure上整合的GPT大模型、百度智能雲以及百度飛槳支持的文心大模型、華為雲盤古大模型、阿里雲M6大模型。由本土廠商研發的大模型,大多支持本地化部署。”盧言霞向21世紀經濟報導記者分析稱,“過去幾年部署的AI應用,接下來幾年都有可能被基於大模型的AI所替代。升級迭代可能會從優先具備海量數據的場景開始。”
行業大模型路線
在中國各大科技公司佈局AI大模型之際,一個明顯的趨勢是,B端產業路線成為佈局的重要方向。
需要指出的是,注重B端市場的大模型和ChatGPT並非在一個賽場,它們屬於兩個概念。ChatGPT是GPT系列大模型的一個應用場景,可以直接面向C端用戶群體,而諸如盤古在內的大模型應用場景更多聚焦在B端的千行百業。
由此,行業大模型也隨之應運而生。
“(大模型)和行業的結合落地方面,我覺得行業大模型會是一個重要的關鍵性機制。”此前,在接受記者採訪時,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜直言道。
事實上,百度也正在提速行業大模型的腳步。去年12月,百度聯合多家企業和機構發布5個行業大模型,包括深燃-百度·文心、吉利-百度·文心、泰康-百度·文心、TCL-百度·文心和辭海-百度·文心。至此,文心已累計發布11個行業大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、製造、社科等領域。
盤古大模型同樣積累了多個行業項目。據介紹,華為雲AI已經在各行業有超過1000個項目,迄今為止陸續推出了礦山、藥物分子、電力、氣象、海浪等大模型。中信建投研報指出,目前盤古預訓練大模型能力已經在包括能源、零售、金融、工業等領域得到驗證。
比如,在醫藥領域,華為雲聯合西安交通大學第一附屬醫院,基於華為雲盤古藥物分子大模型研發出全新的廣譜抗菌藥物,將先導藥的研發週期從數年縮短至一個月;在煤礦領域,華為雲實現一個盤古礦山大模型覆蓋礦山採、掘、機、運、通等主業務環節,大幅縮短模型開發時間,保障井下作業安全,2022年,盤古礦山大模型在山東能源集團正式商用。
劉聰同樣透露,科大訊飛"1+N 認知智能大模型中,"1" 是通用認知智能大模型算法研發及高效訓練底座平台,"N" 是應用於教育、醫療、人機交互、辦公、翻譯、工業等多個行業領域的專用大模型版本。
例如,在智慧教育領域,認知智能大模型可覆蓋" 教、學、考、評、管" 的全鏈路場景,在學習評測、學情分析、個性化推薦等方面助力精準教學;在當下火熱的AIGC 領域,通過在文本、圖像、音視頻的創作上不斷創新,認知智能大模型可以驅動AIGC 的質量不斷提升、成為未來內容生成的主力。
“未來三年,我們認為將會是大模型是風起雲湧的三年,AI將會和各行各業深度結合,AI for industries將是我們的主要方向。”田奇向記者指出。
“百花齊放”終局
AI大模型“百花齊放”的過程中,也免不了相互拉扯。
在官宣AI大模型進展之後,不太體面的是,崑崙萬維在其官方公眾號發文表示,“友商”模型的邏輯推理是靠定向優化來覆蓋特定題庫,不是靠大模型的智能湧現來解答較為複雜的問題,而靠人工打補丁、定向優化的方式是不能真正實現人工智能的——儘管崑崙萬維意在突出自家的大模型效果,但一切仍有待觀察。
拉扯與較勁背後,其實新的問題正在浮出水面:在AI大模型“百花齊放”的過程中,最終誰能夠“贏家通吃”?中腰部廠商是炒作還是真的存在機會空間?
“天工”3.5官宣當日,崑崙萬維披露年報,數據顯示2022年公司實現營業收入47.36億元,同比下降2.35%,歸母淨利潤11.53億元,同比下降25.49%。而截至2022年末,崑崙萬維手裡的貨幣資金為10億元,與此同時,崑崙萬維的現金及現金等價物淨增額為負的5.92億。
在公認中國能上大模型牌桌的廠商數單手可數的情況下,不論是資金實力,還是技術積累,崑崙萬維似乎都並沒有任何優勢,崑崙萬維也在公告提醒稱,“天工”3.5目前仍在測試階段,後續仍面臨技術研發進展不及預期、應用實踐不及預期、商業化落地不確定及行業政策變化等風險。此外,崑崙萬維提示稱,公司持續加大投入,預計還會對公司2023 年財務狀況產生負面影響。
不過,由於搭上AIGC的東風,今年以來,崑崙萬維股價已經從14元一路上漲至4月11日收盤的45元。類似的資本市場AI故事,今年的例子不勝枚舉。
“當前AI大模型仍屬於新興技術,未來的競爭格局在一定程度上取決於各廠商的舉措、戰略方向與資本投資方向,”盧言霞向21世紀經濟報導記者指出,從目前各家的佈局來看,暫時難以斷言未來的格局。
不過她也強調,手握AI大模型的科技企業要想真正跑出來,需要具備多項綜合能力。“(科技企業)得有能力聚集海量數據以及垂深數據,同時要具備面向場景、解決方案商業化的能力,以及具備提供軟硬一體算力的能力。”
誠然AI大模型競速愈演愈烈,但在AI大模型的熱潮下,也湧動著別樣的投資機會。“短期來看,一方面從AI應用本身,將帶動雲服務廠商的AI收入,這部分短期內收入規模略小,可能影響有限。”盧言霞判斷稱,“另一方面影響較大的是算力層,在AI大模型有優勢的廠商,將顯著提升其IaaS層收入,這部分的收入規模變化將轉變雲行業的市場格局。”(21Tech)
