OpenAI突破!GPT-4.5"獵戶座"上線,但價格貴到離譜!

剛剛,OpenAI正式發佈了代號為"Orion"(獵戶座)的GPT-4.5模型,這是迄今為止該公司最龐大的AI模型,使用了前所未有的計算能力和資料量進行訓練。但是,這個龐然大物真的如宣傳的那麼完美嗎?🧐

令人驚訝的是,在發佈幾小時後,OpenAI悄悄從白皮書中刪除了"GPT-4.5不是前沿AI模型"這一關鍵聲明。這種反常舉動背後究竟隱藏著什麼秘密?

普通使用者需要等待,精英使用者優先體驗

從2月27日開始,每月支付200美元的ChatGPT Pro訂閱使用者將作為"研究預覽"的一部分率先獲得GPT-4.5的存取權。其他使用者呢?ChatGPT Plus和ChatGPT Team使用者需要再等一周才能體驗這款新模型。

傳統訓練方法的終極考驗

業界對"獵戶座"充滿期待,許多人將其視為傳統AI訓練方法可行性的晴雨表。GPT-4.5沿用了OpenAI一貫的技術路線——在"預訓練"階段大幅增加計算能力和資料量。這種方法曾在之前的每一代GPT中帶來數學、寫作和程式設計等領域的巨大性能飛躍。

OpenAI表示,GPT-4.5的規模擴大賦予了它"更深的世界知識"和"更高的情感智能"。然而,有跡象表明,通過擴巨量資料和計算獲得的收益正在逐漸減弱。在多項AI基準測試中,GPT-4.5竟然不敵中國AI公司DeepSeek、Anthropic和OpenAI自己的新型"推理"模型。😮

天價運行成本令人咋舌

GPT-4.5還面臨另一個嚴峻問題——運行成本高得驚人!OpenAI承認這一點,甚至表示正在評估是否長期在其API中提供GPT-4.5服務。

要訪問GPT-4.5的API,OpenAI向開發者收取每百萬輸入令牌(約75萬字)75美元,每百萬輸出令牌150美元的費用。相比之下,GPT-4o每百萬輸入令牌僅需2.50美元,每百萬輸出令牌10美元。這種差距是否意味著技術突破的代價越來越高?🤔

性能表現喜憂參半

OpenAI強調,GPT-4.5並非設計為GPT-4o的替代品。雖然GPT-4.5支援檔案和圖像上傳以及ChatGPT的畫布工具等功能,但目前缺乏對ChatGPT逼真的雙向語音模式等功能的支援。

在SimpleQA基準測試中,GPT-4.5在精準性方面優於GPT-4o和OpenAI的推理模型o1和o3-mini。根據OpenAI的說法,GPT-4.5的幻覺頻率低於大多數模型,這理論上意味著它不太可能編造內容。

然而,AI初創公司Perplexity的Deep Research模型在事實精準性測試中表現超過了GPT-4.5,這一點值得注意。🧩

創造力和情感智能的優勢

在創造性任務和情感理解方面,GPT-4.5似乎確實表現出色。在一項非正式測試中,OpenAI要求GPT-4.5和其他兩個模型GPT-4o和o3-mini使用SVG建立獨角獸圖像。只有GPT-4.5創造出了類似獨角獸的形象。

在另一項測試中,OpenAI要求三個模型回應"我在考試失敗後正經歷艱難時期"的提示。雖然GPT-4o和o3-mini提供了有用的資訊,但GPT-4.5的回應在社交適當性方面表現最佳。💖

預訓練擴展法則受到挑戰

OpenAI聲稱GPT-4.5"處於無監督學習所能達到的前沿"。這可能是真的,但模型的侷限性也似乎證實了專家們的猜測:預訓練的"擴展法則"可能無法繼續保持下去。

OpenAI聯合創始人兼前首席科學家Ilya Sutskever在去年12月表示,"我們已經達到了資料巔峰","我們所知道的預訓練無疑將結束"。他的評論呼應了AI投資者、創始人和研究人員的擔憂。

面對預訓練障礙,包括OpenAI在內的整個行業已經轉向推理模型,這些模型完成任務的時間比非推理模型長,但傾向於更加一致。通過增加AI推理模型用於"思考"問題的時間和計算能力,AI實驗室有信心可以顯著提高模型的能力。

OpenAI計畫最終將其GPT系列模型與"o"推理系列結合起來,從今年晚些時候的GPT-5開始。據報導,GPT-4.5的訓練成本極其昂貴,多次延遲,並未能達到內部預期,它可能無法獨自獲得AI基準測試的桂冠。但OpenAI可能將其視為通往更強大產品的墊腳石。🚀

你怎麼看待OpenAI的這一最新突破?是否認為傳統的AI訓練方法正在遇到瓶頸? (澤問科技)