GPT-4變更強了!新版ChatGPT律師考試贏9成考生

OpenAI推出了其人工智能工具的最新版本,該工具催生了炙手可熱的ChatGPT和Dall-E服務,並在被稱為生成式人工智能的領域掀起了科技公司的戰火。

新版本稱為GPT-4,這家初創公司稱該版本提升了準確性、創意性和協作性。微軟公司(Microsoft Corp.)為OpenAI投資了逾100億美元,該公司稱這個新版本的人工智能工具已經在為其必應搜索引擎提供支持。

GPT-4全名“生成式預訓練轉換器4”(generative pretrained transformer 4),它將面向OpenAI的ChatGPT Plus付費用戶,開發人員註冊後可使用它開發應用程序。3月14日,OpenAI表示:“基於我們的內部評估,該工具提供有據可循的回答的機率比GPT-3.5高40%。”新版本還可處理文本和圖像查詢,用戶可提交問題及相關圖片,請GPT-4給予描述或解答。

OpenAI在2020年發布了GPT-3,之後結合GPT-3.5,創建了圖像生成工具Dall-E及聊天機器人ChatGPT。這兩個產品抓住了公眾的想像力,也激發其他科技公司在人工智能領域的進取心。從那時起,人們關於下個版本能否更智能、能否承擔更多任務的議論越來越多。

OpenAI稱摩根士丹利(Morgan Stanley)正在使用GPT-4來編排數據,電子支付公司Stripe Inc.也在測試它能否幫助打擊欺詐。其他客戶還有語言學習公司Duolingo Inc.、可汗學院及冰島政府。

Be My Eyes是一家致力於為盲人或弱視群體開發工具的公司,該公司也在一項虛擬志願者服務中使用了該軟件,用戶可將圖像發送至人工智能驅動的平台,後者會回答問題和提供視覺輔助。

OpenAI總裁兼聯合創始人格雷格·布羅克曼(Greg Brockman)表示:“我們真的開始開發出功能強大的系統,這些系統能帶來新的想法,幫你理解一些原本難以理解的事物。”他說新版本更擅長於在企業盈利報告中提取特定信息,或提供有關美國聯邦稅法的某個具體部分的回答,簡言之,就是通過梳理“繁瑣的商業法律術語”找到答案。

OpenAI表示,GPT-4在律師資格考試(Uniform Bar Examination, UBE)中可以擊敗90%的考生。在滿分1600分的美國大學入學測驗SAT拿到1300分,在高中的大學先修課程測驗中,不論是生物、微積分、總體經濟學、心理學、統計學和歷史都拿到5分的滿級分。

至於前一版本的ChatGPT並無法通過律師考試,在大部分高中的大學先修課程測驗中,也無法拿到那麼高分。

和GPT-3一樣,GPT-4也沒有談論時事的能力,其訓練數據基本都來自2021年9月以前。


早期版本的ChatGPT智能手機聊天界面


在2023年1月的採訪中,OpenAI首席執行官薩姆·阿爾特曼(Sam Altman)曾試圖降低人們的期望。

“關於GPT-4的謠言天花亂墜,”他說,“我不知道這一切是從何而來。人們在乞求失望,他們一定會失望。”該公司首席技術官米拉·穆拉蒂(Mira Murati)本月早些時候對《快公司》(Fast Company)表示,“炒作太多不是好事。”

GPT-4是一種被稱為大型語言模型的人工智能係統,它能分析互聯網的海量文字,以確定如何生成模擬人類的文本。近幾個月來,該技術激起了許多興奮,也引發了不少爭議。除了擔心文本生成系統會被用於課業作弊外,它還可能固化各種偏見和錯誤信息。

OpenAI在2019年最初發布GPT-2時,出於對惡意使用的擔憂,選擇僅公開部分模型。研究人員指出,大型語言模型有時會偏離主題,或涉及不恰當或種族主義的言論。對於訓練和運行人工智能模型所需的龐大計算能力伴隨的碳排放,他們也深感擔憂。

OpenAI稱他們花了半年時間提升這款人工智能軟件的安全性。例如,GPT-4的最終版本更擅長處理(例如)如何製造炸彈或去哪購買廉價香煙的問題,對於後一個問題,它現在會在提供可能的省錢方法的同時,發出吸煙有害健康的警告。

“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社交偏見、虛幻信息和敵意輸入,”該公司3月14日在一篇博客中寫道。這裡指的是提交旨在激發不利行為或破壞系統的信息或問題。“隨著模型的普及,我們會鼓勵和提升透明度,改善用戶學習,推進更廣泛的人工智能素養。我們還致力於增強用戶參與塑造模型的途徑。”

該公司拒絕提供有關GPT-4的具體技術信息,包括模型規模。公司總裁布羅克曼表示,OpenAI預計未來會有一些公司花費數十億美元購買超級計算機來開發尖端模型,其中一些最先進的工具將帶來風險。OpenAI希望對部分工作內容保密,以便為公司爭取“喘息空間,以真正專注於安全,落實安全”。

這種做法在人工智能領域存在爭議。一些公司和專家認為,通過提升開放性,將人工智能模型公之於眾,可以提高安全性。OpenAI還透漏,雖然未公佈模型訓練的部分細節,但該公司在提供更多信息,說明它在根除偏見和讓產品更負責任方面做了那些工作。

OpenAI政策研究員桑德希尼·阿加瓦爾(Sandhini Agarwal)表示:“實際上,我們對於安全訓練階段一直非常透明。”

這段時間,OpenAI和背後的微軟以及這個新興行業裡的其他競爭對手們發布了大量關於人工智能的新東西。包括新的聊天機器人、人工智能加持的搜索引擎,以及將該技術納入銷售和辦公人員使用的企業軟件的新方法,等等。和OpenAI近期的其他版本一樣,GPT-4的訓練也是在微軟的Azure雲平台上進行的。

3月14日早些時候,谷歌(Google)支持的初創公司Anthropic(由OpenAI前高管創立)宣布向企業客戶發布Claude聊天機器人。

與此同時,Alphabet Inc.旗下的谷歌表示將允許客戶使用該公司的一些語言模型,微軟則定於3月16日公佈其關於如何為Office軟件整合人工智能的計劃。

新一批的通用人工智能模型也引發了關於版權和所有權問題的討論,包括如果人工智能程序創建的內容與現有內容很相似時要怎麼處理?以及這些系統是否有權使用其他人的藝術、文字和編程進行訓練。OpenAI、微軟及其競爭對手已經面臨相關訴訟。(i商周)