百度“文心一言”會帶來哪些新機會？

2023/03/18

•

對於大部分創業者和企業來說，新的機會在於基於新的技術平台開發新應用服務。就像移動互聯網時代，最成功的商業產品不見得是安卓和iOS，而是基於安卓和iOS開發的微信、淘寶、抖音等各種超級應用

2023年3月16日，百度啟動生成式對話產品“文心一言”邀請測試。這是中國第一款對標ChatGPT的生成式對話產品。當天，百度創始人李彥宏說，大家對它的期望值是對標ChatGPT，甚至要對標GPT-4，這個門檻還是很高的。

3月16日，百度新聞發布會後，百度港股股價單日跌幅6.4%。3月17日，股價回彈，單日上漲13%。

李彥宏在現場接受採訪時表示，內測中“文心一言”並不完美，之所以現在目前這個節點發布邀請測試，主要兩大原因：一是去年開始全球人工智能技術發展從過去的判別式AI （數據庫比對）轉為生成式AI （生成新內容），百度加快研發腳步，近半年市場驗證了這個判斷；二是更多的機會出現在了生成式AI這些方面，無論是百度內部產品還是合作夥伴都有強烈需求。

全球最先在生成式對話領域掀起風浪的是微軟投資的美國創業公司OpenAI。該公司在去年12月推出的基於GPT-3.5大模型的ChatGPT火爆全球，3月15日OpenAI進一步推出新升級的GPT-4大模型，相比前一代有了不小的提升；3月17日，微軟在發布會上宣布，將GPT-4的能力融入Office系列產品。AI大模型的特點是能夠在更寬泛、更大規模的數據上進行訓練，效率更高，學習能力更強，但耗費資源更大。

ChatGPT火爆後，多家公司宣布也在研發類似產品，百度是目前中國頭部科技公司中第一個落地產品的。文心一言基於文心大模型技術。2019年，百度推出文心大模型ERNIE1.0，2022年11月，該模型進化成3.0版本。李彥宏稱，文心大模型每天接受數十億次用戶搜索請求，這也為文心一言提供了龐大的數據池。

生成式對話產品並非一個全新形態的產品。它的典型同類產品是對話式AI產品，包括各類語音助手、聊天工具等。第三方數據機構IDC數據顯示，2022年，對話式AI市場規模達到54.6億元，市場滲透率已經飽和。但此前的產品並未引入大模型，新一代產品的出現，將重新激活市場。

文心一言除了能夠生成文字內容，還能生成圖片、音頻和視頻內容，由於成本原因，文心一言的視頻生成內容暫未對外開放。

無論是ChatGPT和還是文心一言，目前都是比較初級的產品，且尚未找到清晰的商業模式，這也是目前行業裡最關心的話題。ChatGPT是面向C端用戶收費，但依然嚴重虧損，2022年全年預計虧損5.4億美元，且用戶量越大，虧損越嚴重。百度目前對文心一言的定位更偏向B端，李彥宏稱，文心一言的定位是一個通用的賦能平台，金融、能源、媒體、政務等千行百業，都可以基於這個平台來實現智能化變革，創造商業價值。

李彥宏的判斷是，生成式AI代表了一個新的技術範式，是一個每家企業都不可以錯過的巨大的機會。AI市場即將迎來爆發性的需求增長，其商業價值的釋放將是前所未有的、指數級的。

據百度官方數據，截至3月17日上午10點，申請文心一言API服務測試的企業已達7.6萬家。

某中國AI創業公司CEO向《財經十一人》評價，中國需要有自己的大模型產品，從算力、數據、人才儲備等方面，百度在中國市場優勢明顯，儘管目前和美國還有差距，但“必須要有勇氣走出第一步”。

新聞發布會現場，李彥宏展示了文心一言的5個場景，分別是：文學創作、商業文案創作、數理推算、中文理解、多模態生成。

對比文心一言和GPT-4針對同一問題的回答，發現文心一言對於中文的理解，在某些時候是優於GPT-4的，例如當問題是病句或容易造成歧義的表述時，文心一言能夠理解提問者的意思，GPT-4的回答會有所偏離。同時，它們都存在“胡說八道”的情況，不過，新版Bing中的GPT-4會附上內容來源鏈接，便於用戶二次確認。

文心大模型訓練使用的數據以中文為主，因此文心一言能夠更好理解中文，甚至能生成不同方言的音頻。文心一言也支持英文互動，但效果相對較差，其他語種目前還不支持。

此外，文心一言會選擇性回答問題，若問題中涉及敏感詞，它會說“我無法回答這個問題”。李彥宏提到，整體而言，這類大語言模型還遠未到發展完善的階段，它們有時候會有很驚豔的表現，但不少場景下，細究起來還有明顯的問題，進步空間很大。

大模型訓練成本高昂，需要有大算力、大數據和大模型，每一次訓練任務都耗資巨大。百度擁有全棧式AI能力，從芯片（崑崙芯），到深度學習框架（飛槳），再到預訓練大模型（文心），到搜索、智能雲、自動駕駛、小度等應用，各個層面都有自研技術。

李彥宏表示，全棧式佈局可以大幅提升效率，顯著降低成本。另外，芯片、框架、大模型、和終端應用場景，可以形成一個高效的反饋閉環，幫助大模型不斷優化迭代。

馬斯克是OpenAI最早的創始人之一，後期退出。今年2月，他在社交平台上公開批評OpenAI“最初是作為一家開源的非營利性公司而創建的，這也是為什麼我把它命名為OpenAI，旨在抗衡谷歌，但現在它已經成一家閉源的營利性公司，並由微軟控制……這完全不是我的本意”。

由於OpenAI選擇了封閉，只對接微軟全系產品，外界將它類比為蘋果的iOS操作系統。百度的文心大模型走的是開源模式，類似於谷歌的安卓操作系統。

百度對文心一言的定位是“一個通用的賦能平台”，金融、能源、媒體、政務等行業，都可以基於這個平台來做智能化改造，實現效率提升。

除此之外，按照規劃，文心一言也將全面嵌入現有業務中，包括搜索、智能音箱、百度智能雲、智能駕駛等。

在搜索場景中，文心一言可以補充、升級搜索體驗，類似目前Bing中集成了GPT-4的體驗。搜索引擎能以此形成新的流量入口，獲得新的數據。在智能駕駛場景中，可以與百度阿波羅自動駕駛艙、車路協調做融合，提升無人駕駛的可靠性。

李彥宏提到，大模型時代將產生三大產業機會：

第一類是新型雲計算公司。之前企業選擇雲廠商更多看算力、存儲等基礎雲服務。未來，框架、模型的質量，以及模型、框架、芯片、應用這四層之間的協同能力，會變得更重要。微軟已經將ChatGPT的能力融入Azure雲服務，多位業內人士提到，這將有助於Azure提高市場份額，也是微軟投資OpenAI的商業回報之一。

在中國市場，目前百度雲的市場份額低於阿里雲、華為雲和騰訊雲。不過，智能雲是目前百度增速最快的業務，2022年營收同比增長23%，這一增速也高於另外三家云廠商。文心一言的出現，或許能夠幫助百度雲拿下更多市場份額。

第二類是通過調用大模型能力，為行業提供解決方案的公司。目前文心大模型已經在電力、金融、媒體等領域，發布了10多個行業大模型，在各行各業都可能創造機會。

第三類是基於大模型底座開發應用的公司，即應用服務提供商。李彥宏說，“今天，基於文本生成、圖像生成、音頻生成、視頻生成、數字人、3D等場景，已經湧現出很多創業明星公司，他們可能就是未來的新巨頭。”

基於大模型的生成式AI已經成為新一輪市場熱點。數據服務商Dealroom報告顯示，全球生成式AI企業估值已達480億美元，在過去2年裡翻了6倍。

中國投資人和創業者們也已經入局。前美團聯合創始人王慧文成立AI公司“光年之外”，多家知名投資機構立即跟進，天使輪估值已經達到2億美元。一家在幾年前就開始做大模型的AI創業公司，一度無人問津，近期該公司創始人表示，幾乎每天都有不少投資機構來詢問是否接受融資。

目前，中國初創公司中，能夠做出真正有影響力產品的還很少。多位投資人表示，短期內能夠看到實際應用效果的，可能是抖音、快手這類視頻平台。目前，字節跳動和快手均有佈局AI大模型和生產式AI。

其他頭部科技公司中，騰訊、阿里巴巴、華為也在行動。2022年4月，騰訊對外披露“混元”大模型，協同了騰訊預訓練研發力量，覆蓋NLP （自然語言處理）大模型、 CV （機器視覺）大模型、多模態大模型及多個領域任務模型。

2022年9月，阿里巴巴在世界人工智能大會上，發布 “通義”大模型系列，並宣布相關核心模型向全球開發者開源。華為雲團隊於2021年4月發布“盤古”大模型， 2022年11月，在華為全聯接大會2022中國站上，華為雲發布盤古大模型的新技術能力，擴展盤古大模型的服務範圍，發布盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項新服務。

ChatGPT火了之後，中國不少公司都在嘗試研發類似產品。但這件事成本極高。OpenAI每年的研發費用高達幾十億美元，GPT-3.5語言大模型包含1750億個參數，微軟為ChatGPT構建了超過1萬枚英偉達A100GPU芯片的AI計算集群。GPT-4的參數值在此基礎上又大幅提高。谷歌3月6日推出的多模態大模型PalM-E，參數值達到了5620億。

一位長期關注AI的投資人說，中國的創業公司從零去做類似產品，非常不划算，也很難追趕進度，應該將重心放在行業應用上。

另一位投資人提到，由於監管因素，文心一言為代表的國產替代產品未來才是主流。

文心一言的出現，或許能夠幫助中國公司更好地理清思路。李彥宏稱，對於大部分創業者和企業來說，新的機會在於基於通用大語言模型，搶先開發重要的應用服務。“就像移動互聯網時代，最成功的商業產品不見得是安卓和iOS，而是基於安卓和iOS開發的微信、淘寶、抖音等各種超級應用。”（財經十一人）