見證歷史!GPT-4發布:能玩梗能考律師!官網連夜被擠爆,用戶:強得離譜

“見證歷史了。”看到GPT4的發布後,有多位業內人士感嘆道。

3月15日凌晨,OpenAI發布了多模態預訓練大模型GPT-4,這也是其大型語言模型的最新版本。

與此前的版本相比,GPT-4具備強大的識圖能力,文字輸入限制也提升至2.5萬字; GPT-4的回答準確性也顯著提升,還能夠生成歌詞、創意文本從而實現風格變化。同時,GPT-4在各類專業測試及學術基准上也表現優良。

“這是OpenAI努力擴展深度學習的最新里程碑。”OpenAI介紹,“GPT-4是一個大型多模態模型,它接受圖像和文本輸入、進行文本輸出,雖然在許多現實場景中它尚且不如人類,但在各種專業和學術基准上表現出與人類相當的性能。


GPT-4震撼發布:會玩梗還能考律師

從整體而言,GPT-4實現了多重能力的躍升。

OpenAI介紹稱,在日常對話中,GPT-4與GPT-3.5之間的差距或許微妙,但當任務複雜度足夠高的時候,GPT-4將具備更可靠、更具創造性的特點,且能夠處理更細緻的指令。

例如,根據OpenAI公佈的實驗數據,GPT-4通過模擬律師考試且分數在應試者的10%左右。相較之下,GPT-3.5版本大模型的成績是倒數10%。


需要注意的是,相較於此前的GPT模型而言,GPT-4最大的突破之一是在文本之外還能夠處理圖像內容。OpenAI表示,用戶同時輸入文本和圖像的情況下,它能夠生成自然語言和代碼等文本。

OpenAI用一張“梗圖”演示了GPT-4特有的多模態功能。在以下輸入圖片並設問“這些圖片有何可笑之處?請逐一描述。”GPT-4便會在對每張圖片進行表述後表示,“這幅圖的幽默之處在於,把一個大而過時的VGA接口插入一個小而現代的智能手機充電端口是荒謬的。”


除了普通圖片,GPT-4還能處理更複雜的圖像信息,包括表格、考試題目截圖、論文截圖、漫畫等。此外,在多語種方面,GPT-4也體現出優越性。在測試的26種語言中,GPT-4在24種語言方面的表現均優於GPT-3.5等其他大語言模型的英語語言性能,其中包括部分低資源語言如拉脫維亞語、威爾士語等。在中文語境中,GPT-4能夠達到80.1%的準確性。


與此前的GPT模類似,GPT-4基礎模型可在訓練完預測文檔中的單詞。在數據樣本方面,也同樣使用公開可用的數據及許可數據。為了提升基礎模型回應與用戶之間意圖的匹配性,OpenAI同樣選擇了強化學習人類反饋(RLHF)來微調模型行為。

不過,OpenAI指出,在模型訓練方面,GPT-4建立了可預測擴展的深度學習棧。通過開發基礎設施及優化,在多種規模下都可進行預測。為驗證其可擴展性,團隊提前準確預測了GPT-4在內部代碼庫上的優化指標,但使用的計算量僅為萬分之一。

儘管GPT-4功能強大,但同時OpenAI也坦言,與早期GPT模型類似,GPT-4也具備局限性。GPT-4依然會形成推理錯誤,因而在使用語言模型輸出時需要非常小心,最好以人工核查、附加上下文或避免高風險使用的方式予以輔助。

“GPT4的模型發布,本身是技術持續升級迭代發展的必然階段。AI行業每一年都會有些新模型發布,趨勢就是大模型、多模態。”在接受21世紀經濟報導記者採訪時,IDC中國研究總監盧言霞表示,“多模態肯定是必然趨勢,畢竟AI要真正達到人的智慧,需要處理多模數據。且在各行業場景裡,大都是涉及多模態數據的處理。”


OpenAI付款系統被擠爆 首批用戶連夜寫測評

目前,ChatGPT的Plus訂閱用戶已經可以使用GPT-4,其他用戶需要排隊申請內測。

據財聯社報導,當天凌晨,在部分微信群,記者看到有不少用戶不眠不休測試GPT-4的表達:或用來出營銷策劃、寫廣告詞;或用於解答邏輯題、數學題;甚至還有用來調侃腦筋急轉彎。GPT-4均對答入流,並展示出其強悍的處理能力,用戶直呼“強得離譜”、“牛啊”。

更有用戶連夜寫出了一份測評:

由於僅限於Plus訂閱用戶使用,當晚,大批新訂用戶湧入,以至於OpenAI的付款系統被擠爆了。



已在必應中應用

從商業應用角度而言,目前GPT-4沒有免費版本。

不過在GPT-4發布後,OpenAI也直接升級了ChatGPT,目前,GPT-4的訪問權限僅面向ChatGPT Plus的付費訂閱用戶及企業和開發者開放。

想要訪問GPT-4的API,用戶可以註冊等待,OpenAI將邀請部分開發者進行體驗。

此外,在GPT-4發布後,微軟方面則宣布,目前全新必應預覽版中已經搭載了定製版本的GPT-4。

“如果您在過去五週內的任何時間使用過新的必應預覽版,那麼您已經體驗過這個強大模型的早期版本。”微軟表示,“隨著OpenAI對GPT-4及更高版本進行更新,必應將從這些改進中受益。”

事實上,GPT-4的應用空間還是頗具想像的。目前,微軟已經將ChatGPT整合進云平台Azure Open AI 中,企業和個人開發者均可藉助Azure

Open AI功能直接集成到應用產品中,通過私人定制ChatGPT來提供個性化客戶服務,建立企業級智能化知識庫搜索引擎等。

“微軟有望在產業中通過GPT-4不斷拓展下游新興領域,應用於更多的場景中,並利用其多模態模型成本改變傳統AI客制化與定制化的特點,逐步向通用化方向發展。”華鑫證券計算機研究團隊分析稱。

浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任、研究員盤和林評論稱,GPT-4的核心能力提升體現為基本智能水平提升、多模態模型方面,後者意味著對文字互動形式的突破,識別能力擴展至圖片領域。

在商業落地方面,盤和林指出,GPT-4一經發布,支付渠道就出現了擁堵,用戶熱情是足夠的,“這也就意味著當前OpenAI實際上沒有商用落地的憂慮,這款產品已經可以實現變現。”

此前有業內觀點認為,GPT-4的發布有望成為生成式AI向超級AI快速演變的關鍵節點,而此次GPT-4真正亮相後,也引爆了業內討論。

“GPT-4和GPT-3的主要區別在於模型的規模和能力,其多模態的模型超出文本範圍實現了對圖像乃至視頻的AI生成,同時突破生成文本的語種限制,實現多語種語言數據的輸入輸出。”華鑫證券計算機研究團隊表示,“這是一場偉大的變革,AI可干的事越來越多,也許未來它將成為人類得心應手的工具。”(21財匯聞)