見證歷史！GPT-4發布：能玩梗能考律師！官網連夜被擠爆，用戶：強得離譜

2023/03/15

•

“見證歷史了。”看到GPT4的發布後，有多位業內人士感嘆道。

3月15日凌晨，OpenAI發布了多模態預訓練大模型GPT-4，這也是其大型語言模型的最新版本。

與此前的版本相比，GPT-4具備強大的識圖能力，文字輸入限制也提升至2.5萬字； GPT-4的回答準確性也顯著提升，還能夠生成歌詞、創意文本從而實現風格變化。同時，GPT-4在各類專業測試及學術基准上也表現優良。

“這是OpenAI努力擴展深度學習的最新里程碑。”OpenAI介紹，“GPT-4是一個大型多模態模型，它接受圖像和文本輸入、進行文本輸出，雖然在許多現實場景中它尚且不如人類，但在各種專業和學術基准上表現出與人類相當的性能。 ”

GPT-4震撼發布：會玩梗還能考律師

從整體而言，GPT-4實現了多重能力的躍升。

OpenAI介紹稱，在日常對話中，GPT-4與GPT-3.5之間的差距或許微妙，但當任務複雜度足夠高的時候，GPT-4將具備更可靠、更具創造性的特點，且能夠處理更細緻的指令。

例如，根據OpenAI公佈的實驗數據，GPT-4通過模擬律師考試且分數在應試者的10%左右。相較之下，GPT-3.5版本大模型的成績是倒數10%。

需要注意的是，相較於此前的GPT模型而言，GPT-4最大的突破之一是在文本之外還能夠處理圖像內容。OpenAI表示，用戶同時輸入文本和圖像的情況下，它能夠生成自然語言和代碼等文本。

OpenAI用一張“梗圖”演示了GPT-4特有的多模態功能。在以下輸入圖片並設問“這些圖片有何可笑之處？請逐一描述。”GPT-4便會在對每張圖片進行表述後表示，“這幅圖的幽默之處在於，把一個大而過時的VGA接口插入一個小而現代的智能手機充電端口是荒謬的。”

除了普通圖片，GPT-4還能處理更複雜的圖像信息，包括表格、考試題目截圖、論文截圖、漫畫等。此外，在多語種方面，GPT-4也體現出優越性。在測試的26種語言中，GPT-4在24種語言方面的表現均優於GPT-3.5等其他大語言模型的英語語言性能，其中包括部分低資源語言如拉脫維亞語、威爾士語等。在中文語境中，GPT-4能夠達到80.1%的準確性。

與此前的GPT模類似，GPT-4基礎模型可在訓練完預測文檔中的單詞。在數據樣本方面，也同樣使用公開可用的數據及許可數據。為了提升基礎模型回應與用戶之間意圖的匹配性，OpenAI同樣選擇了強化學習人類反饋（RLHF）來微調模型行為。

不過，OpenAI指出，在模型訓練方面，GPT-4建立了可預測擴展的深度學習棧。通過開發基礎設施及優化，在多種規模下都可進行預測。為驗證其可擴展性，團隊提前準確預測了GPT-4在內部代碼庫上的優化指標，但使用的計算量僅為萬分之一。

儘管GPT-4功能強大，但同時OpenAI也坦言，與早期GPT模型類似，GPT-4也具備局限性。GPT-4依然會形成推理錯誤，因而在使用語言模型輸出時需要非常小心，最好以人工核查、附加上下文或避免高風險使用的方式予以輔助。

“GPT4的模型發布，本身是技術持續升級迭代發展的必然階段。AI行業每一年都會有些新模型發布，趨勢就是大模型、多模態。”在接受21世紀經濟報導記者採訪時，IDC中國研究總監盧言霞表示，“多模態肯定是必然趨勢，畢竟AI要真正達到人的智慧，需要處理多模數據。且在各行業場景裡，大都是涉及多模態數據的處理。”

OpenAI付款系統被擠爆首批用戶連夜寫測評

目前，ChatGPT的Plus訂閱用戶已經可以使用GPT-4，其他用戶需要排隊申請內測。

據財聯社報導，當天凌晨，在部分微信群，記者看到有不少用戶不眠不休測試GPT-4的表達：或用來出營銷策劃、寫廣告詞；或用於解答邏輯題、數學題；甚至還有用來調侃腦筋急轉彎。GPT-4均對答入流，並展示出其強悍的處理能力，用戶直呼“強得離譜”、“牛啊”。

更有用戶連夜寫出了一份測評：

由於僅限於Plus訂閱用戶使用，當晚，大批新訂用戶湧入，以至於OpenAI的付款系統被擠爆了。

已在必應中應用

從商業應用角度而言，目前GPT-4沒有免費版本。

不過在GPT-4發布後，OpenAI也直接升級了ChatGPT，目前，GPT-4的訪問權限僅面向ChatGPT Plus的付費訂閱用戶及企業和開發者開放。

想要訪問GPT-4的API，用戶可以註冊等待，OpenAI將邀請部分開發者進行體驗。

此外，在GPT-4發布後，微軟方面則宣布，目前全新必應預覽版中已經搭載了定製版本的GPT-4。

“如果您在過去五週內的任何時間使用過新的必應預覽版，那麼您已經體驗過這個強大模型的早期版本。”微軟表示，“隨著OpenAI對GPT-4及更高版本進行更新，必應將從這些改進中受益。”

事實上，GPT-4的應用空間還是頗具想像的。目前，微軟已經將ChatGPT整合進云平台Azure Open AI 中，企業和個人開發者均可藉助Azure

Open AI功能直接集成到應用產品中，通過私人定制ChatGPT來提供個性化客戶服務，建立企業級智能化知識庫搜索引擎等。

“微軟有望在產業中通過GPT-4不斷拓展下游新興領域，應用於更多的場景中，並利用其多模態模型成本改變傳統AI客制化與定制化的特點，逐步向通用化方向發展。”華鑫證券計算機研究團隊分析稱。

浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任、研究員盤和林評論稱，GPT-4的核心能力提升體現為基本智能水平提升、多模態模型方面，後者意味著對文字互動形式的突破，識別能力擴展至圖片領域。

在商業落地方面，盤和林指出，GPT-4一經發布，支付渠道就出現了擁堵，用戶熱情是足夠的，“這也就意味著當前OpenAI實際上沒有商用落地的憂慮，這款產品已經可以實現變現。”

此前有業內觀點認為，GPT-4的發布有望成為生成式AI向超級AI快速演變的關鍵節點，而此次GPT-4真正亮相後，也引爆了業內討論。

“GPT-4和GPT-3的主要區別在於模型的規模和能力，其多模態的模型超出文本範圍實現了對圖像乃至視頻的AI生成，同時突破生成文本的語種限制，實現多語種語言數據的輸入輸出。”華鑫證券計算機研究團隊表示，“這是一場偉大的變革，AI可干的事越來越多，也許未來它將成為人類得心應手的工具。”（21財匯聞）