2月28日消息,OpenAI今日宣佈推出其最新旗艦產品GPT-4.5語言模型。
這個被稱為「迄今為止知識儲備最豐富」的AI系統將率先面向Pro使用者和開發者開放研究預覽(research preview)。官方特別說明,該模型並非前沿架構版本,在部分場景下的表現可能不如o1或o3-mini等尖端模型。
從即日起,ChatGPT Pro使用者可以在網頁端、行動端和桌面端的模型選擇器中選擇GPT-4.5。該模型將於下周開始向Plus和Team使用者推出,隨後的一周向企業和教育使用者推出。
GPT-4.5可以存取最新的資訊,支援搜尋、檔案和影像上傳,並能透過畫布進行寫作和程式碼編輯,目前不支援ChatGPT中的多模態功能,如語音模式、影片和螢幕分享。
此外,OpenAI還在Chat Completions API、Assistants API和Batch API中向所有付費使用者層級的開發者預覽GPT-4.5,支援關鍵功能,如函數呼叫、結構化輸出、串流和系統訊息。它還通過圖像輸入支援視覺能力。
OpenAI指出,GPT-4.5是一個非常龐大且計算密集的模型,其使用成本比GPT-4o更高,且並非後者的替代品。
GPT-4.5在預訓練和後期訓練方面取得了重大突破,透過擴大無監督學習的規模,GPT-4.5提高了識別模式、建立聯絡以及生成創造性見解的能力,且這一過程無需直接推理。
早期的測試顯示,使用者與GPT-4.5互動時感覺更加自然。其更廣泛的知識庫、對使用者意圖的改進理解以及更高的「情緒智商」(EQ)使其在提高寫作、程式設計和解決實際問題等任務中表現出色。同時,OpenAI預期GPT-4.5的虛構資訊將更少,甚至略低於其o1模型。
根據山姆·奧特曼披露的資訊,OpenAI計畫在2月結束前推出GPT-4.5,並在5月底前推出GPT-5。
OpenAI首席執行官山姆·奧特曼(Sam Altman)曾把GPT-5稱為“整合了我們眾多技術的系統”,它將包含OpenAI在去年12月的“聖誕十二日”活動中展示的新o3推理模型。
先前,OpenAI發佈了o3-mini,但完整的o3模型僅會作為即將推出的GPT-5系統的一部分推出。這與OpenAI的目標一致,即整合其大型語言模型,最終打造一個有望被視為通用人工智慧(AGI)的更強大模型。
OpenAI透過擴展兩種互補範式來提升AI能力:無監督學習和推理,兩者代表了智能的兩個不同維度。
推理能力的擴展教會了模型在回應之前進行思考和產生思維鏈,從而使它們能夠解決複雜的科學、技術、工程和數學(STEM)或邏輯問題。 OpenAI o1和OpenAI o3mini等模型就是這範式的代表。
相對而言,無監督學習提高了世界模型的精確性和直覺。
當詢問GPT-4.5「第一種語言是什麼時,」它給出的答案是:「我們尚不完全清楚第一種語言是什麼,並引用各方觀點供使用者參考。
GPT-4.5透過擴展計算和資料規模,以及架構和最佳化創新,實現了無監督學習的擴展。結果是,該模型擁有更廣泛的知識和對世界的更深刻理解,從而減少了虛構資訊,並在廣泛的主題上提高了可靠性。
隨著OpenAI的研究人員擴大模型規模並解決更複雜的問題,教會它們更好地理解人類需求和意圖變得越來越重要。
對於GPT-4.5,研究人員開發了新的可擴展技術,這些技術使得能夠利用較小模型的資料來訓練更大、更強大的模型。這些技術提高了GPT-4.5的可操控性、對細微差別的理解以及自然對話的能力。
將對世界的深刻理解與改進後的協作能力相結合,GPT-4.5能夠在溫暖且直觀的對話中自然地整合想法,這些對話更加符合人類協作的需求。
OpenAI展示了GPT-4.5和GPT-4o處理三個相同問題的結果:
問題一:困難時期的幫助
使用者稱,「我考試不及格,現在很難過。」GPT-4.5的回答擁有更好的情感代入,相比4o機械式給解決方案,「AI味」少了很多。
問題二:太空探索
使用者問「你對太空探索有什麼看法?」GPT-4.5的回答比較像是正常人,輸出自己的見解和觀點,GPT-4o的回答則引經據典,過於學究。
GPT-4.5在響應時不進行預先推理,這使得它的優勢與OpenAI的o1等推理模型截然不同。與OpenAI的o1和o3-mini相比,GPT-4.5是一個更通用、更聰明的模型。
OpenAI相信,推理能力將是未來模型的核心能力,而預訓練和推理這兩種擴展方法將相互補充。
隨著像GPT-4.5這樣的模型透過預訓練變得更聰明、更博學,它們將成為推理和工具使用代理的更強大基礎。
模型能力的每一次提升,也是使其更安全的機會。 GPT-4.5採用了新的監督訓練技術,結合了傳統的監督微調(SFT)和人類回饋強化學習(RLHF)方法,與GPT-4o所使用的方法類似。OpenAI希望這些工作能為未來更強大的模型對齊提供基礎。
為了測試OpenAI的改進,研究人員在部署前根據他們的準備框架進行了一系列安全測試。結果發現,擴展GPT範式有助於提升GPT-4.5在各項評估中的能力。 (AIGC新智界)