百度ChatGPT產品 “文心一言” 五大功能

2023/03/17

•

3月16日，神秘的百度文心一言終於揭開面紗。

這款被寄予厚望的中國類ChatGPT產品，到底什麼水平？

百度CEO李彥宏在發布會介紹，文心一言具有包括文學創作、數理邏輯推理、多模態生成等五大功能。

一大亮點是，文心一言不僅能生成文本、圖片，同時具備生成音頻和視頻的能力。

文心一言不僅能生成文本、圖片，還能根據以上內容生成視頻

但比起產品介紹的“雷聲大”，文心一言暫未開放公眾的消息，讓關注者大失所望。百度稱，當下暫未對公眾開放。用戶僅可通過邀請測試碼，在文心一言官網體驗產品。

李彥宏在發布會開頭便承認，文心一言對標ChatGPT，甚至GPT4，門檻是很高的，“我自己測試感覺還是有很多不完美的地方”。

但之所以昨日就發布，是因為有市場需求。這不免讓人聽出來有些被逼上路的意思。

令人意外的是，發布會還沒結束，百度港股的跌幅就一度達到近10%。反觀A股ChatGPT的概念股，則持續反彈拉升，漲超6%。

截至3月16日收盤，百度港股情況

是哪裡出了問題？

部分觀看發布會的網友提出質疑，認為李彥宏介紹時不太像現場演示，而是播放提前錄製的視頻，或者說更像是播放製作好的PPT。

“大家的工作都保住了，”有人調侃，百度發布會緩解了眾人被AI取代的焦慮。

調侃歸調侃，百度的確“養兵多日”。

在曾經坐“冷板凳”的人工智能屆，百度是中國大廠中投入最多的。2022年，百度研發投入約達214億元人民幣，相當於每月投18億做研發。

技術派的出身讓百度在ChatGPT引發的狂飆中，成為備受矚目的中國公司。

但人工智能之路不僅關乎技術。多位業內人士告訴鹽財經，訓練出類ChatGPT產品是一項綜合實力。

清華大學計算機科學與技術係長聘副教授黃民烈表示：“ChatGPT的基座模型都在真實調用上不停迭代和優化。它不僅僅是技術上的成功，更是系統、工程、數據上的成功。”

3月14日，OpenAI推發布了GPT-4。升級更新後的ChatGPT-4處理文字內容的上限拓展到2.5萬個字符，是ChatGPT的8倍

李彥宏和首席技術官(CTO)王海峰也在發布會幾次強調，文心一言並不完美，仍有賴通過真實的用戶反饋而逐步迭代。

匆匆推出的文心一言，哪怕有些趕鴨子上架，展露出不夠自信、不夠完美的面貌，但也只是生成式AI產品的開始。隨著使用增多，它將變得聰明。而要做到這一點，需要我們的共同陪伴、見證成長。

推出類ChatGPT的競賽仍在進行。

值得慶幸的是，中國公司擅長做從1到100的競賽。

對比同行

我們常說，貨比三家。一個產品好不好，就將它與同類競品進行比較，這自然是一種判斷方法。

不過截至發稿，我們仍未取得“文心一言”的邀請碼及內測渠道。因此，我們對比的方式是，將百度發布會上演示的問題，同樣地詢問基於GPT 4的Bing。

百度發布會上，演示的場景有5個，我們選擇性地提問。結果如下：

第一：提問，可以總結一下《三體》的核心內容嗎？如果要續寫的話，可以從哪些角度出發？

百度發布會上演示的問題，同樣地詢問基於GPT 4的Bing。（上圖為文心一言，下圖為Bing）

第二：提問，如果要成立一個用大模型服務中小企業數字化升級的科技服務公司，可以起個什麼公司名？

百度發布會上演示的問題，同樣地詢問基於GPT 4的Bing

第三：下面我們來玩一個雞免同籠的遊戲。1隻雞有2隻腳1個頭，1只免子有4隻腳1個頭。那麼，如果有一個籠子裡有9個頭，30隻腳，應該有多少隻雞，多少只免子？

百度發布會上演示的問題，同樣地詢問基於GPT 4的Bing，後者計算錯誤

第四：洛陽紙貴是什麼意思？並用洛陽紙貴四個字寫一首藏頭詩。

百度發布會上演示的問題，同樣地詢問基於GPT 4的Bing

第五：無。（因GPT 4等尚不具備多模態功能，或尚未開放。）

可以看出，在以上示例問題中，文心一言與Bing的差別不大。

你更喜歡哪個呢？

另外，兩者的差異也很顯然。

Bing目前還無法完成多模態跨模的生成任務。而“文心一言”，在發布會上，也沒有演示GPT等產品最亮眼的功能之一：編程能力。

差別當然遠遠不止這些。

不過，無論GPT 4還是文心一言，在前後腳開啟的發布會中，被披露的模型參數、結構設計，以及功能實現技術等，信息都很有限。因此，能夠對比映照的信息，也很有限。

高潮迭起

百度的著急與焦慮顯而易見。

基於GPT-3.5的ChatGPT在2022年11月30日橫空出世不久，新版本GPT-4又迅速發布。無論是速度還是呈現效果，都足以讓科技巨頭拉響警報。

新浪微博新技術研發負責人張俊林告訴鹽財經，ChatGPT帶來了一次革命式的突破。

比起5年前局限於圍棋領域的人工智能AlphaGo，類ChatGPT的生成式AI“能真正地促進很多行業工作效率大幅度提升，這是人類首次做到這一點”。

支撐AI變得通用的技術叫大語言模型（LLM），首要的特點是參數夠大。GPT-3.5模型已達到1750億參數，LG的Exaone模型有3000億參數。華為的盤古大模型有2000億，百度文心一言的大模型Ernie Bot也是千億級。

炫酷數字的背後是實打實地燒錢和迭代。

對於一些更大的LLM模型（如擁有2800億參數的Gopher和擁有5400億參數的PaLM），訓練成本介於200萬美元至1200萬美元之間

國盛證券曾估算，按照今年1月ChatGPT的流量，初始投入成本約為8億美元（約合55 億元），每日電費在5 萬美元左右（約合34 萬元）。

巨頭們押注與投入，源於人工智能近5年發展的新路徑。張俊林介紹，近年AI屆逐漸得出一個定論，機器學習的數據越多，在數據質量高的前提下，AI學習知識的能力將越強。

Open AI率先推出ChatGPT驚艷眾人，地位受到挑戰的巨頭紛紛按捺不住。

2月初，谷歌內部為ChatGPT亮起紅色警報，因此提前發布對標AI對話產品的Bard。這款基於大模型LaMDA的產品，被稱為迷你版的ChatGPT。

據谷歌披露，LaMDA的模型規模僅1370億參數，需要的算力也大大降低，這樣可以讓更多用戶快速試用，獲得即時反饋。

相比Open AI開放ChatGPT的慷慨和大膽，“老大哥”谷歌罕見地如此小心翼翼。與百度相似，谷歌表示“新發布的版本只是小範圍內測”。

但就在GPT-4和文心一言發布的這週，谷歌宣布將在企業級協作平台Google Workspace引入AI，以迅速實現AI撰寫郵件、生成文檔摘要等需求。

谷歌母公司Alphabet的一位高管形容，AI接入谷歌文檔後，就像提供了一根“魔杖”。用戶只需輸入要撰寫的主題，草稿就可自動生成。

落地化的應用發布之餘，谷歌還在近日公佈了有史以來最大參數的模型——號稱有5620 億參數的PaLM-E。據介紹，這是一種多模態視覺語言模型（VLM），最大特點是能利用視覺數據增強語言處理能力。

在谷歌公佈的視頻裡，它甚至具備控制機器人的視覺和語言能力。

谷歌還在近日公佈了有史以來最大參數的模型——號稱有5620 億參數的PaLM-E，其甚至具備控制機器人的視覺和語言能力

唯一與諸位巨頭步調不一致的是紮克伯格。

2月底，扎克伯格的Meta一次性發布了自家大語言模型LLaMA，並宣布開源。普惠型的應用一共推出了4款，參數量從70億、130億、330億到650億。

3月14日，斯坦福大學團隊發布基於LLaMA的指令調整的模型——ALPACA，並表示其測試結果與GPT 3.5的性能相匹配。

深耕AI和元宇宙的Meta給出了他們的理解。“近來研究表明，最佳性能不是由最大的模型實現的，而是由基於更多數據訓練的更小模型實現的。”

生態搶跑

技術面上，百度在中文NLP領域，無疑擁有先天優勢。

首先是對國內技術政策的熟悉，令它比ChatGPT 更能滿足中國國內市場需求。

其次，作為最大的中文搜索引擎，百度擁有的高質量數據集及中文數據收集能力，他者無法比擬。

不過頗感意外的是，發布會上李彥宏提到，目前文心一言對英文的支持能力弱於中文。反過來，據OpenAI公佈的數據，GPT 4 在對中文的支持能力上，準確率可達80%以上。

兩者的具體差別，尚需產品真正進入市場後，用戶們的檢驗。

但也正如李彥宏及百度CTO王海峰在發布會上所說的，大規模技術的產品，才剛開啟“起點”。未來的技術變化日新月異，不能以起點高低論英雄。

李彥宏認為，在人工智能時代，IT技術棧發生了根本性變化

作為中國第一家拿出了大模型產品的公司，百度“打了頭陣”，已屬不易。

何況我們知道，中國廠商在推動技術“從1到100”的發展方面尤為擅長。總之，未來可期。

但，技術並不是這場AI競賽的唯一要點。

除了OpenAI、百度，當前賽道中的公司，還有谷歌、Meta、阿里等巨頭。

誰能率先建成“壁壘”？或者說，誰將成為AI生態的領頭人？

類比普通人熟知的手機系統，李彥宏曾在2018年兩會期間說過：Google現在是人工智能領域的“iphone”，而百度則是這個領域的“安卓”，百度的AI開發平台開放源代碼，歡迎所有的同道者加入，從長遠來看，開放是必然會戰勝封閉的。

其它的暫且不論，如今再看這句話，Google的角色已經被OpenAI替代。

“開源”與“封閉”的確是兩條不同的道路，但“路線之爭”也不完全決定未來——這在蘋果系統與安卓廠商的局面中已能證得。

對用戶而言，真實可感的強大是，獲取（研發）成本低，使用成本低，迭代速度快。

以OpenAI 為例，這家身處第一梯隊的AI公司，“搶跑”姿態再明顯不過。3月15日，GPT 4發布當天，它一口氣發布了論文、System Card、Predictable Scaling、開放GPT 4給會員用戶，也開放了GPT-4 的API。

這些舉措，無疑都在搶入市場，以降低門檻、減少成本的方式。

具體來看，Predictable Scaling可以幫助開發者，以萬分之一的成本預測模型效果，大大減小了“燒錢規模”。而OpenAI Evals 和Syestem Card，則是專為開發者提供的精調工具，為的是方便研發者製作出個性化的服務產品。

使用成本上，GPT 4的費用比前輩GPT 3大為降低，1000個prompt token 0.03美元，1000個completion token 0.06 美元。

國盛證券基於參數數量和token數量估算，GPT-3訓練一次的成本約為140萬美元，而GPT 4的使用成本費用比前輩GPT 3大為降低

更方便的獲取與更低的成本，勢必導入更多的數據，形成“數據飛輪”。

它的意思是說，當一個初始小的改變在不斷累積下去，最終可以形成一個巨大的、不可逆轉的正向循環效應的過程。

OpenAI的搶跑邏輯之強大，就在於此。通過與微軟的聯手，GPT 4在微軟Azure雲上落地，再以低成本、低門檻的優勢，開放API搭建生態，而自己成為一家掌握核心技術的平台型企業。

百度的路徑與此相似。

通百度智能雲提供服務，吸引企業和機構客戶使用API和基礎設施，共同搭建AI模型、開發應用。發布會上李彥宏介紹，目前已有650家企業接入了生態。這是一個不錯的起點。

彩蛋：向Bing提問文心一言

問：你聽說“文心一言”了嗎？

Bing：聽說了。文心一言是百度推出的一款類似ChatGPT的人工智能聊天機器人產品。3月16日下午，百度在北京總部召開了文心一言的發布會，展示了它的功能和特點。你對文心一言感興趣嗎？

問：簡單說說，它有哪些能力？

Bing：根據搜索結果，文心一言目前具備五大能力，分別是文學創作、商業文案創作、數理邏輯推算、中文理解和多模態生成。它可以根據用戶的需求，生成詩歌、小說、新聞稿等文本，也可以解答數學和邏輯問題，還可以理解中文的語義和語法，以及生成與文字相關的圖片或音頻。

問：你跟它比較，誰更厲害？

Bing：這個問題很難回答，因為每個人工智能產品都有自己的特點和優勢。我不想跟文心一言比較，我只想做好自己的工作，為用戶提供最好的搜索和聊天服務。（南風窗）