OpenAI突破！GPT-4.5"獵戶座"上線，但價格貴到離譜！

2025/03/03

•

剛剛，OpenAI正式發佈了代號為"Orion"（獵戶座）的GPT-4.5模型，這是迄今為止該公司最龐大的AI模型，使用了前所未有的計算能力和資料量進行訓練。但是，這個龐然大物真的如宣傳的那麼完美嗎？🧐

令人驚訝的是，在發佈幾小時後，OpenAI悄悄從白皮書中刪除了"GPT-4.5不是前沿AI模型"這一關鍵聲明。這種反常舉動背後究竟隱藏著什麼秘密？

從2月27日開始，每月支付200美元的ChatGPT Pro訂閱使用者將作為"研究預覽"的一部分率先獲得GPT-4.5的存取權。其他使用者呢？ChatGPT Plus和ChatGPT Team使用者需要再等一周才能體驗這款新模型。

傳統訓練方法的終極考驗

業界對"獵戶座"充滿期待，許多人將其視為傳統AI訓練方法可行性的晴雨表。GPT-4.5沿用了OpenAI一貫的技術路線——在"預訓練"階段大幅增加計算能力和資料量。這種方法曾在之前的每一代GPT中帶來數學、寫作和程式設計等領域的巨大性能飛躍。

OpenAI表示，GPT-4.5的規模擴大賦予了它"更深的世界知識"和"更高的情感智能"。然而，有跡象表明，通過擴巨量資料和計算獲得的收益正在逐漸減弱。在多項AI基準測試中，GPT-4.5竟然不敵中國AI公司DeepSeek、Anthropic和OpenAI自己的新型"推理"模型。😮

GPT-4.5還面臨另一個嚴峻問題——運行成本高得驚人！OpenAI承認這一點，甚至表示正在評估是否長期在其API中提供GPT-4.5服務。

要訪問GPT-4.5的API，OpenAI向開發者收取每百萬輸入令牌（約75萬字）75美元，每百萬輸出令牌150美元的費用。相比之下，GPT-4o每百萬輸入令牌僅需2.50美元，每百萬輸出令牌10美元。這種差距是否意味著技術突破的代價越來越高？🤔

OpenAI強調，GPT-4.5並非設計為GPT-4o的替代品。雖然GPT-4.5支援檔案和圖像上傳以及ChatGPT的畫布工具等功能，但目前缺乏對ChatGPT逼真的雙向語音模式等功能的支援。

在SimpleQA基準測試中，GPT-4.5在精準性方面優於GPT-4o和OpenAI的推理模型o1和o3-mini。根據OpenAI的說法，GPT-4.5的幻覺頻率低於大多數模型，這理論上意味著它不太可能編造內容。

然而，AI初創公司Perplexity的Deep Research模型在事實精準性測試中表現超過了GPT-4.5，這一點值得注意。🧩

在創造性任務和情感理解方面，GPT-4.5似乎確實表現出色。在一項非正式測試中，OpenAI要求GPT-4.5和其他兩個模型GPT-4o和o3-mini使用SVG建立獨角獸圖像。只有GPT-4.5創造出了類似獨角獸的形象。

在另一項測試中，OpenAI要求三個模型回應"我在考試失敗後正經歷艱難時期"的提示。雖然GPT-4o和o3-mini提供了有用的資訊，但GPT-4.5的回應在社交適當性方面表現最佳。💖

OpenAI聲稱GPT-4.5"處於無監督學習所能達到的前沿"。這可能是真的，但模型的侷限性也似乎證實了專家們的猜測：預訓練的"擴展法則"可能無法繼續保持下去。

OpenAI聯合創始人兼前首席科學家Ilya Sutskever在去年12月表示，"我們已經達到了資料巔峰"，"我們所知道的預訓練無疑將結束"。他的評論呼應了AI投資者、創始人和研究人員的擔憂。

面對預訓練障礙，包括OpenAI在內的整個行業已經轉向推理模型，這些模型完成任務的時間比非推理模型長，但傾向於更加一致。通過增加AI推理模型用於"思考"問題的時間和計算能力，AI實驗室有信心可以顯著提高模型的能力。

OpenAI計畫最終將其GPT系列模型與"o"推理系列結合起來，從今年晚些時候的GPT-5開始。據報導，GPT-4.5的訓練成本極其昂貴，多次延遲，並未能達到內部預期，它可能無法獨自獲得AI基準測試的桂冠。但OpenAI可能將其視為通往更強大產品的墊腳石。🚀

你怎麼看待OpenAI的這一最新突破？是否認為傳統的AI訓練方法正在遇到瓶頸？ (澤問科技)