OpenAI推出GPT-4.5：最強知識模型，「AI味」、幻覺大幅減少

2025/03/01

•

2月28日消息，OpenAI今日宣佈推出其最新旗艦產品GPT-4.5語言模型。

這個被稱為「迄今為止知識儲備最豐富」的AI系統將率先面向Pro使用者和開發者開放研究預覽（research preview）。官方特別說明，該模型並非前沿架構版本，在部分場景下的表現可能不如o1或o3-mini等尖端模型。

從即日起，ChatGPT Pro使用者可以在網頁端、行動端和桌面端的模型選擇器中選擇GPT-4.5。該模型將於下周開始向Plus和Team使用者推出，隨後的一周向企業和教育使用者推出。

GPT-4.5可以存取最新的資訊，支援搜尋、檔案和影像上傳，並能透過畫布進行寫作和程式碼編輯，目前不支援ChatGPT中的多模態功能，如語音模式、影片和螢幕分享。

此外，OpenAI還在Chat Completions API、Assistants API和Batch API中向所有付費使用者層級的開發者預覽GPT-4.5，支援關鍵功能，如函數呼叫、結構化輸出、串流和系統訊息。它還通過圖像輸入支援視覺能力。

OpenAI指出，GPT-4.5是一個非常龐大且計算密集的模型，其使用成本比GPT-4o更高，且並非後者的替代品。

GPT-4.5在預訓練和後期訓練方面取得了重大突破，透過擴大無監督學習的規模，GPT-4.5提高了識別模式、建立聯絡以及生成創造性見解的能力，且這一過程無需直接推理。

早期的測試顯示，使用者與GPT-4.5互動時感覺更加自然。其更廣泛的知識庫、對使用者意圖的改進理解以及更高的「情緒智商」（EQ）使其在提高寫作、程式設計和解決實際問題等任務中表現出色。同時，OpenAI預期GPT-4.5的虛構資訊將更少，甚至略低於其o1模型。

根據山姆·奧特曼披露的資訊，OpenAI計畫在2月結束前推出GPT-4.5，並在5月底前推出GPT-5。

OpenAI首席執行官山姆·奧特曼（Sam Altman）曾把GPT-5稱為“整合了我們眾多技術的系統”，它將包含OpenAI在去年12月的“聖誕十二日”活動中展示的新o3推理模型。

先前，OpenAI發佈了o3-mini，但完整的o3模型僅會作為即將推出的GPT-5系統的一部分推出。這與OpenAI的目標一致，即整合其大型語言模型，最終打造一個有望被視為通用人工智慧（AGI）的更強大模型。

OpenAI透過擴展兩種互補範式來提升AI能力：無監督學習和推理，兩者代表了智能的兩個不同維度。

推理能力的擴展教會了模型在回應之前進行思考和產生思維鏈，從而使它們能夠解決複雜的科學、技術、工程和數學（STEM）或邏輯問題。 OpenAI o1和OpenAI o3mini等模型就是這範式的代表。

相對而言，無監督學習提高了世界模型的精確性和直覺。

當詢問GPT-4.5「第一種語言是什麼時，」它給出的答案是：「我們尚不完全清楚第一種語言是什麼，並引用各方觀點供使用者參考。

GPT-4.5透過擴展計算和資料規模，以及架構和最佳化創新，實現了無監督學習的擴展。結果是，該模型擁有更廣泛的知識和對世界的更深刻理解，從而減少了虛構資訊，並在廣泛的主題上提高了可靠性。

隨著OpenAI的研究人員擴大模型規模並解決更複雜的問題，教會它們更好地理解人類需求和意圖變得越來越重要。

對於GPT-4.5，研究人員開發了新的可擴展技術，這些技術使得能夠利用較小模型的資料來訓練更大、更強大的模型。這些技術提高了GPT-4.5的可操控性、對細微差別的理解以及自然對話的能力。

將對世界的深刻理解與改進後的協作能力相結合，GPT-4.5能夠在溫暖且直觀的對話中自然地整合想法，這些對話更加符合人類協作的需求。

OpenAI展示了GPT-4.5和GPT-4o處理三個相同問題的結果：

問題一：困難時期的幫助

使用者‌稱，「我考試不及格，現在很難過。」GPT-4.5的回答擁有更好的情感代入，相比4o機械式給解決方案，「AI味」少了很多。

‌問題二：太空探索

使用者‌問「你對太空探索有什麼看法？」GPT-4.5的回答比較像是正常人，輸出自己的見解和觀點，GPT-4o的回答則引經據典，過於學究。

GPT-4.5在響應時不進行預先推理，這使得它的優勢與OpenAI的o1等推理模型截然不同。與OpenAI的o1和o3-mini相比，GPT-4.5是一個更通用、更聰明的模型。

OpenAI相信，推理能力將是未來模型的核心能力，而預訓練和推理這兩種擴展方法將相互補充。

隨著像GPT-4.5這樣的模型透過預訓練變得更聰明、更博學，它們將成為推理和工具使用代理的更強大基礎。

模型能力的每一次提升，也是使其更安全的機會。 GPT-4.5採用了新的監督訓練技術，結合了傳統的監督微調（SFT）和人類回饋強化學習（RLHF）方法，與GPT-4o所使用的方法類似。OpenAI希望這些工作能為未來更強大的模型對齊提供基礎。

為了測試OpenAI的改進，研究人員在部署前根據他們的準備框架進行了一系列安全測試。結果發現，擴展GPT範式有助於提升GPT-4.5在各項評估中的能力。（AIGC新智界）