3月16日,神秘的百度文心一言終於揭開面紗。
這款被寄予厚望的中國類ChatGPT產品,到底什麼水平?
百度CEO李彥宏在發布會介紹,文心一言具有包括文學創作、數理邏輯推理、多模態生成等五大功能。
一大亮點是,文心一言不僅能生成文本、圖片,同時具備生成音頻和視頻的能力。
文心一言不僅能生成文本、圖片,還能根據以上內容生成視頻
但比起產品介紹的“雷聲大”,文心一言暫未開放公眾的消息,讓關注者大失所望。百度稱,當下暫未對公眾開放。用戶僅可通過邀請測試碼,在文心一言官網體驗產品。
李彥宏在發布會開頭便承認,文心一言對標ChatGPT,甚至GPT4,門檻是很高的,“我自己測試感覺還是有很多不完美的地方”。
但之所以昨日就發布,是因為有市場需求。這不免讓人聽出來有些被逼上路的意思。
令人意外的是,發布會還沒結束,百度港股的跌幅就一度達到近10%。反觀A股ChatGPT的概念股,則持續反彈拉升,漲超6%。
截至3月16日收盤,百度港股情況
是哪裡出了問題?
部分觀看發布會的網友提出質疑,認為李彥宏介紹時不太像現場演示,而是播放提前錄製的視頻,或者說更像是播放製作好的PPT。
“大家的工作都保住了,”有人調侃,百度發布會緩解了眾人被AI取代的焦慮。
調侃歸調侃,百度的確“養兵多日”。
在曾經坐“冷板凳”的人工智能屆,百度是中國大廠中投入最多的。2022年,百度研發投入約達214億元人民幣,相當於每月投18億做研發。
技術派的出身讓百度在ChatGPT引發的狂飆中,成為備受矚目的中國公司。
但人工智能之路不僅關乎技術。多位業內人士告訴鹽財經,訓練出類ChatGPT產品是一項綜合實力。
清華大學計算機科學與技術係長聘副教授黃民烈表示:“ChatGPT的基座模型都在真實調用上不停迭代和優化。它不僅僅是技術上的成功,更是系統、工程、數據上的成功。”
3月14日,OpenAI推發布了GPT-4。升級更新後的ChatGPT-4處理文字內容的上限拓展到2.5萬個字符,是ChatGPT的8倍
李彥宏和首席技術官(CTO)王海峰也在發布會幾次強調,文心一言並不完美,仍有賴通過真實的用戶反饋而逐步迭代。
匆匆推出的文心一言,哪怕有些趕鴨子上架,展露出不夠自信、不夠完美的面貌,但也只是生成式AI產品的開始。隨著使用增多,它將變得聰明。而要做到這一點,需要我們的共同陪伴、見證成長。
推出類ChatGPT的競賽仍在進行。
值得慶幸的是,中國公司擅長做從1到100的競賽。
對比同行
我們常說,貨比三家。一個產品好不好,就將它與同類競品進行比較,這自然是一種判斷方法。
不過截至發稿,我們仍未取得“文心一言”的邀請碼及內測渠道。因此,我們對比的方式是,將百度發布會上演示的問題,同樣地詢問基於GPT 4的Bing。
百度發布會上,演示的場景有5個,我們選擇性地提問。結果如下:
第一:提問,可以總結一下《三體》的核心內容嗎?如果要續寫的話,可以從哪些角度出發?
百度發布會上演示的問題,同樣地詢問基於GPT 4的Bing。(上圖為文心一言,下圖為Bing)
第二:提問,如果要成立一個用大模型服務中小企業數字化升級的科技服務公司,可以起個什麼公司名?
百度發布會上演示的問題,同樣地詢問基於GPT 4的Bing
第三:下面我們來玩一個雞免同籠的遊戲。1隻雞有2隻腳1個頭,1只免子有4隻腳1個頭。那麼,如果有一個籠子裡有9個頭,30隻腳,應該有多少隻雞,多少只免子?
百度發布會上演示的問題,同樣地詢問基於GPT 4的Bing,後者計算錯誤
第四:洛陽紙貴是什麼意思?並用洛陽紙貴四個字寫一首藏頭詩。
百度發布會上演示的問題,同樣地詢問基於GPT 4的Bing
第五:無。(因GPT 4等尚不具備多模態功能,或尚未開放。)
可以看出,在以上示例問題中,文心一言與Bing的差別不大。
你更喜歡哪個呢?
另外,兩者的差異也很顯然。
Bing目前還無法完成多模態跨模的生成任務。而“文心一言”,在發布會上,也沒有演示GPT等產品最亮眼的功能之一:編程能力。
差別當然遠遠不止這些。
不過,無論GPT 4還是文心一言,在前後腳開啟的發布會中,被披露的模型參數、結構設計,以及功能實現技術等,信息都很有限。因此,能夠對比映照的信息,也很有限。
高潮迭起
百度的著急與焦慮顯而易見。
基於GPT-3.5的ChatGPT在2022年11月30日橫空出世不久,新版本GPT-4又迅速發布。無論是速度還是呈現效果,都足以讓科技巨頭拉響警報。
新浪微博新技術研發負責人張俊林告訴鹽財經,ChatGPT帶來了一次革命式的突破。
比起5年前局限於圍棋領域的人工智能AlphaGo,類ChatGPT的生成式AI“能真正地促進很多行業工作效率大幅度提升,這是人類首次做到這一點”。
支撐AI變得通用的技術叫大語言模型(LLM),首要的特點是參數夠大。GPT-3.5模型已達到1750億參數,LG的Exaone模型有3000億參數。華為的盤古大模型有2000億,百度文心一言的大模型Ernie Bot也是千億級。
炫酷數字的背後是實打實地燒錢和迭代。
國盛證券曾估算,按照今年1月ChatGPT的流量,初始投入成本約為8億美元(約合55 億元),每日電費在5 萬美元左右(約合34 萬元)。
巨頭們押注與投入,源於人工智能近5年發展的新路徑。張俊林介紹,近年AI屆逐漸得出一個定論,機器學習的數據越多,在數據質量高的前提下,AI學習知識的能力將越強。
Open AI率先推出ChatGPT驚艷眾人,地位受到挑戰的巨頭紛紛按捺不住。
2月初,谷歌內部為ChatGPT亮起紅色警報,因此提前發布對標AI對話產品的Bard。這款基於大模型LaMDA的產品,被稱為迷你版的ChatGPT。
據谷歌披露,LaMDA的模型規模僅1370億參數,需要的算力也大大降低,這樣可以讓更多用戶快速試用,獲得即時反饋。
相比Open AI開放ChatGPT的慷慨和大膽,“老大哥”谷歌罕見地如此小心翼翼。與百度相似,谷歌表示“新發布的版本只是小範圍內測”。
但就在GPT-4和文心一言發布的這週,谷歌宣布將在企業級協作平台Google Workspace引入AI,以迅速實現AI撰寫郵件、生成文檔摘要等需求。
谷歌母公司Alphabet的一位高管形容,AI接入谷歌文檔後,就像提供了一根“魔杖”。用戶只需輸入要撰寫的主題,草稿就可自動生成。
落地化的應用發布之餘,谷歌還在近日公佈了有史以來最大參數的模型——號稱有5620 億參數的PaLM-E。據介紹,這是一種多模態視覺語言模型(VLM),最大特點是能利用視覺數據增強語言處理能力。
在谷歌公佈的視頻裡,它甚至具備控制機器人的視覺和語言能力。
谷歌還在近日公佈了有史以來最大參數的模型——號稱有5620 億參數的PaLM-E,其甚至具備控制機器人的視覺和語言能力
唯一與諸位巨頭步調不一致的是紮克伯格。
2月底,扎克伯格的Meta一次性發布了自家大語言模型LLaMA,並宣布開源。普惠型的應用一共推出了4款,參數量從70億、130億、330億到650億。
3月14日,斯坦福大學團隊發布基於LLaMA的指令調整的模型——ALPACA,並表示其測試結果與GPT 3.5的性能相匹配。
深耕AI和元宇宙的Meta給出了他們的理解。“近來研究表明,最佳性能不是由最大的模型實現的,而是由基於更多數據訓練的更小模型實現的。”
生態搶跑
技術面上,百度在中文NLP領域,無疑擁有先天優勢。
首先是對國內技術政策的熟悉,令它比ChatGPT 更能滿足中國國內市場需求。
其次,作為最大的中文搜索引擎,百度擁有的高質量數據集及中文數據收集能力,他者無法比擬。
不過頗感意外的是,發布會上李彥宏提到,目前文心一言對英文的支持能力弱於中文。反過來,據OpenAI公佈的數據,GPT 4 在對中文的支持能力上,準確率可達80%以上。
兩者的具體差別,尚需產品真正進入市場後,用戶們的檢驗。
但也正如李彥宏及百度CTO王海峰在發布會上所說的,大規模技術的產品,才剛開啟“起點”。未來的技術變化日新月異,不能以起點高低論英雄。
李彥宏認為,在人工智能時代,IT技術棧發生了根本性變化
作為中國第一家拿出了大模型產品的公司,百度“打了頭陣”,已屬不易。
何況我們知道,中國廠商在推動技術“從1到100”的發展方面尤為擅長。總之,未來可期。
但,技術並不是這場AI競賽的唯一要點。
除了OpenAI、百度,當前賽道中的公司,還有谷歌、Meta、阿里等巨頭。
誰能率先建成“壁壘”?或者說,誰將成為AI生態的領頭人?
類比普通人熟知的手機系統,李彥宏曾在2018年兩會期間說過:Google現在是人工智能領域的“iphone”,而百度則是這個領域的“安卓”,百度的AI開發平台開放源代碼,歡迎所有的同道者加入,從長遠來看,開放是必然會戰勝封閉的。
其它的暫且不論,如今再看這句話,Google的角色已經被OpenAI替代。
“開源”與“封閉”的確是兩條不同的道路,但“路線之爭”也不完全決定未來——這在蘋果系統與安卓廠商的局面中已能證得。
對用戶而言,真實可感的強大是,獲取(研發)成本低,使用成本低,迭代速度快。
以OpenAI 為例,這家身處第一梯隊的AI公司,“搶跑”姿態再明顯不過。3月15日,GPT 4發布當天,它一口氣發布了論文、System Card、Predictable Scaling、開放GPT 4給會員用戶,也開放了GPT-4 的API。
這些舉措,無疑都在搶入市場,以降低門檻、減少成本的方式。
具體來看,Predictable Scaling可以幫助開發者,以萬分之一的成本預測模型效果,大大減小了“燒錢規模”。而OpenAI Evals 和Syestem Card,則是專為開發者提供的精調工具,為的是方便研發者製作出個性化的服務產品。
使用成本上,GPT 4的費用比前輩GPT 3大為降低,1000個prompt token 0.03美元,1000個completion token 0.06 美元。
國盛證券基於參數數量和token數量估算,GPT-3訓練一次的成本約為140萬美元,而GPT 4的使用成本費用比前輩GPT 3大為降低
更方便的獲取與更低的成本,勢必導入更多的數據,形成“數據飛輪”。
它的意思是說,當一個初始小的改變在不斷累積下去,最終可以形成一個巨大的、不可逆轉的正向循環效應的過程。
OpenAI的搶跑邏輯之強大,就在於此。通過與微軟的聯手,GPT 4在微軟Azure雲上落地,再以低成本、低門檻的優勢,開放API搭建生態,而自己成為一家掌握核心技術的平台型企業。
百度的路徑與此相似。
通百度智能雲提供服務,吸引企業和機構客戶使用API和基礎設施,共同搭建AI模型、開發應用。發布會上李彥宏介紹,目前已有650家企業接入了生態。這是一個不錯的起點。
彩蛋:向Bing提問文心一言
問:你聽說“文心一言”了嗎?
Bing:聽說了。文心一言是百度推出的一款類似ChatGPT的人工智能聊天機器人產品。3月16日下午,百度在北京總部召開了文心一言的發布會,展示了它的功能和特點。你對文心一言感興趣嗎?
問:簡單說說,它有哪些能力?
Bing:根據搜索結果,文心一言目前具備五大能力,分別是文學創作、商業文案創作、數理邏輯推算、中文理解和多模態生成。它可以根據用戶的需求,生成詩歌、小說、新聞稿等文本,也可以解答數學和邏輯問題,還可以理解中文的語義和語法,以及生成與文字相關的圖片或音頻。
問:你跟它比較,誰更厲害?
Bing:這個問題很難回答,因為每個人工智能產品都有自己的特點和優勢。我不想跟文心一言比較,我只想做好自己的工作,為用戶提供最好的搜索和聊天服務。(南風窗)
