百度“文心一言”會帶來哪些新機會?

對於大部分創業者和企業來說,新的機會在於基於新的技術平台開發新應用服務。就像移動互聯網時代,最成功的商業產品不見得是安卓和iOS,而是基於安卓和iOS開發的微信、淘寶、抖音等各種超級應用


2023年3月16日,百度啟動生成式對話產品“文心一言”邀請測試。這是中國第一款對標ChatGPT的生成式對話產品。當天,百度創始人李彥宏說,大家對它的期望值是對標ChatGPT,甚至要對標GPT-4,這個門檻還是很高的。

3月16日,百度新聞發布會後,百度港股股價單日跌幅6.4%。3月17日,股價回彈,單日上漲13%。

李彥宏在現場接受採訪時表示,內測中“文心一言”並不完美,之所以現在目前這個節點發布邀請測試,主要兩大原因:一是去年開始全球人工智能技術發展從過去的判別式AI (數據庫比對)轉為生成式AI (生成新內容),百度加快研發腳步,近半年市場驗證了這個判斷;二是更多的機會出現在了生成式AI這些方面,無論是百度內部產品還是合作夥伴都有強烈需求。

全球最先在生成式對話領域掀起風浪的是微軟投資的美國創業公司OpenAI。該公司在去年12月推出的基於GPT-3.5大模型的ChatGPT火爆全球,3月15日OpenAI進一步推出新升級的GPT-4大模型,相比前一代有了不小的提升;3月17日,微軟在發布會上宣布,將GPT-4的能力融入Office系列產品。AI大模型的特點是能夠在更寬泛、更大規模的數據上進行訓練,效率更高,學習能力更強,但耗費資源更大。

ChatGPT火爆後,多家公司宣布也在研發類似產品,百度是目前中國頭部科技公司中第一個落地產品的。文心一言基於文心大模型技術。2019年,百度推出文心大模型ERNIE1.0,2022年11月,該模型進化成3.0版本。李彥宏稱,文心大模型每天接受數十億次用戶搜索請求,這也為文心一言提供了龐大的數據池。

生成式對話產品並非一個全新形態的產品。它的典型同類產品是對話式AI產品,包括各類語音助手、聊天工具等。第三方數據機構IDC數據顯示,2022年,對話式AI市場規模達到54.6億元,市場滲透率已經飽和。但此前的產品並未引入大模型,新一代產品的出現,將重新激活市場。

文心一言除了能夠生成文字內容,還能生成圖片、音頻和視頻內容,由於成本原因,文心一言的視頻生成內容暫未對外開放。

無論是ChatGPT和還是文心一言,目前都是比較初級的產品,且尚未找到清晰的商業模式,這也是目前行業裡最關心的話題。ChatGPT是面向C端用戶收費,但依然嚴重虧損,2022年全年預計虧損5.4億美元,且用戶量越大,虧損越嚴重。百度目前對文心一言的定位更偏向B端,李彥宏稱,文心一言的定位是一個通用的賦能平台,金融、能源、媒體、政務等千行百業,都可以基於這個平台來實現智能化變革,創造商業價值。

李彥宏的判斷是,生成式AI代表了一個新的技術範式,是一個每家企業都不可以錯過的巨大的機會。AI市場即將迎來爆發性的需求增長,其商業價值的釋放將是前所未有的、指數級的。

據百度官方數據,截至3月17日上午10點,申請文心一言API服務測試的企業已達7.6萬家。

某中國AI創業公司CEO向《財經十一人》評價,中國需要有自己的大模型產品,從算力、數據、人才儲備等方面,百度在中國市場優勢明顯,儘管目前和美國還有差距,但“必須要有勇氣走出第一步”。



有差距也有亮點


新聞發布會現場,李彥宏展示了文心一言的5個場景,分別是:文學創作、商業文案創作、數理推算、中文理解、多模態生成。

對比文心一言和GPT-4針對同一問題的回答,發現文心一言對於中文的理解,在某些時候是優於GPT-4的,例如當問題是病句或容易造成歧義的表述時,文心一言能夠理解提問者的意思,GPT-4的回答會有所偏離。同時,它們都存在“胡說八道”的情況,不過,新版Bing中的GPT-4會附上內容來源鏈接,便於用戶二次確認。

文心大模型訓練使用的數據以中文為主,因此文心一言能夠更好理解中文,甚至能生成不同方言的音頻。文心一言也支持英文互動,但效果相對較差,其他語種目前還不支持。

此外,文心一言會選擇性回答問題,若問題中涉及敏感詞,它會說“我無法回答這個問題”。李彥宏提到,整體而言,這類大語言模型還遠未到發展完善的階段,它們有時候會有很驚豔的表現,但不少場景下,細究起來還有明顯的問題,進步空間很大。

大模型訓練成本高昂,需要有大算力、大數據和大模型,每一次訓練任務都耗資巨大。百度擁有全棧式AI能力,從芯片(崑崙芯),到深度學習框架(飛槳),再到預訓練大模型(文心),到搜索、智能雲、自動駕駛、小度等應用,各個層面都有自研技術。

李彥宏表示,全棧式佈局可以大幅提升效率,顯著降低成本。另外,芯片、框架、大模型、和終端應用場景,可以形成一個高效的反饋閉環,幫助大模型不斷優化迭代。


新商業機會


馬斯克是OpenAI最早的創始人之一,後期退出。今年2月,他在社交平台上公開批評OpenAI“最初是作為一家開源的非營利性公司而創建的,這也是為什麼我把它命名為OpenAI,旨在抗衡谷歌,但現在它已經成一家閉源的營利性公司,並由微軟控制……這完全不是我的本意”。



由於OpenAI選擇了封閉,只對接微軟全系產品,外界將它類比為蘋果的iOS操作系統。百度的文心大模型走的是開源模式,類似於谷歌的安卓操作系統。

百度對文心一言的定位是“一個通用的賦能平台”,金融、能源、媒體、政務等行業,都可以基於這個平台來做智能化改造,實現效率提升。

除此之外,按照規劃,文心一言也將全面嵌入現有業務中,包括搜索、智能音箱、百度智能雲、智能駕駛等。

在搜索場景中,文心一言可以補充、升級搜索體驗,類似目前Bing中集成了GPT-4的體驗。搜索引擎能以此形成新的流量入口,獲得新的數據。在智能駕駛場景中,可以與百度阿波羅自動駕駛艙、車路協調做融合,提升無人駕駛的可靠性。

李彥宏提到,大模型時代將產生三大產業機會:

第一類是新型雲計算公司。之前企業選擇雲廠商更多看算力、存儲等基礎雲服務。未來,框架、模型的質量,以及模型、框架、芯片、應用這四層之間的協同能力,會變得更重要。微軟已經將ChatGPT的能力融入Azure雲服務,多位業內人士提到,這將有助於Azure提高市場份額,也是微軟投資OpenAI的商業回報之一。

在中國市場,目前百度雲的市場份額低於阿里雲、華為雲和騰訊雲。不過,智能雲是目前百度增速最快的業務,2022年營收同比增長23%,這一增速也高於另外三家云廠商。文心一言的出現,或許能夠幫助百度雲拿下更多市場份額。

第二類是通過調用大模型能力,為行業提供解決方案的公司。目前文心大模型已經在電力、金融、媒體等領域,發布了10多個行業大模型,在各行各業都可能創造機會。

第三類是基於大模型底座開發應用的公司,即應用服務提供商。李彥宏說,“今天,基於文本生成、圖像生成、音頻生成、視頻生成、數字人、3D等場景,已經湧現出很多創業明星公司,他們可能就是未來的新巨頭。”



中國AI大模型進展


基於大模型的生成式AI已經成為新一輪市場熱點。數據服務商Dealroom報告顯示,全球生成式AI企業估值已達480億美元,在過去2年裡翻了6倍。

中國投資人和創業者們也已經入局。前美團聯合創始人王慧文成立AI公司“光年之外”,多家知名投資機構立即跟進,天使輪估值已經達到2億美元。一家在幾年前就開始做大模型的AI創業公司,一度無人問津,近期該公司創始人表示,幾乎每天都有不少投資機構來詢問是否接受融資。

目前,中國初創公司中,能夠做出真正有影響力產品的還很少。多位投資人表示,短期內能夠看到實際應用效果的,可能是抖音、快手這類視頻平台。目前,字節跳動和快手均有佈局AI大模型和生產式AI。

其他頭部科技公司中,騰訊、阿里巴巴、華為也在行動。2022年4月,騰訊對外披露“混元”大模型,協同了騰訊預訓練研發力量,覆蓋NLP (自然語言處理)大模型、 CV (機器視覺)大模型、多模態大模型及多個領域任務模型。

2022年9月,阿里巴巴在世界人工智能大會上,發布 “通義”大模型系列,並宣布相關核心模型向全球開發者開源。華為雲團隊於2021年4月發布“盤古”大模型, 2022年11月,在華為全聯接大會2022中國站上,華為雲發布盤古大模型的新技術能力,擴展盤古大模型的服務範圍,發布盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項新服務。

ChatGPT火了之後,中國不少公司都在嘗試研發類似產品。但這件事成本極高。OpenAI每年的研發費用高達幾十億美元,GPT-3.5語言大模型包含1750億個參數,微軟為ChatGPT構建了超過1萬枚英偉達A100GPU芯片的AI計算集群。GPT-4的參數值在此基礎上又大幅提高。谷歌3月6日推出的多模態大模型PalM-E,參數值達到了5620億。

一位長期關注AI的投資人說,中國的創業公司從零去做類似產品,非常不划算,也很難追趕進度,應該將重心放在行業應用上。

另一位投資人提到,由於監管因素,文心一言為代表的國產替代產品未來才是主流。

文心一言的出現,或許能夠幫助中國公司更好地理清思路。李彥宏稱,對於大部分創業者和企業來說,新的機會在於基於通用大語言模型,搶先開發重要的應用服務。“就像移動互聯網時代,最成功的商業產品不見得是安卓和iOS,而是基於安卓和iOS開發的微信、淘寶、抖音等各種超級應用。”(財經十一人)