GPT-4.5“既差還貴”,再不出GPT-5,OpenAI就難了


GPT-4.5被認為是“華而不實”,其性能不值如此高的價格。如果OpenAI不能盡快推出一個性能顯著提升的模型,關於其領先地位正在削弱的質疑聲將會越來越大。

憑藉GPT系列模型引領AI浪潮的OpenAI,近日推出的GPT-4.5卻遭遇滑鐵盧。

這款被寄予厚望的新模型不僅性能不及預期,價格更是高得驚人。業界普遍認為,OpenAI正面臨前所未有的壓力,如果不能盡快推出具有突破性的GPT-5,其領先地位恐將不保。

01. 高價低能,OpenAI自降預期

AI大模型競賽愈發白熱化,上周OpenAI推出了GPT-4.5(Orion)大模型。

然而,與以往不同的是,OpenAI此次刻意降低了市場對這款新模型的期望。OpenAI CEO Sam Altman在社交平台X上表示,GPT-4.5是一個“巨大、昂貴的模型”,並且“不會在基準測試中取得壓倒性優勢”。

OpenAI自身的評估也顯示,GPT-4.5在多項指標上不僅落後於Anthropic最新發佈的Claude 3.7 Sonnet,甚至不如OpenAI自家數月前推出的推理模型。

更令人咋舌的是,GPT-4.5的定價高達每百萬輸入tokens 75美元,每百萬輸出tokens 150美元,是GPT-4o的30倍,Claude 3.7 Sonnet的10倍以上。

儘管GPT-4.5在對話的真實性和幽默感方面有所提升,可能更適用於語音互動,但其整體性能顯然未能達到OpenAI最初的預期。The Information指出,這可能是預訓練收益遞減的證據。

開發者們對GPT-4.5的反響普遍冷淡。AI領域的知名評論家Gary Marcus直言GPT-4.5是“nothingburger”(毫無價值的東西)。Ars Technica援引一位匿名專家的話稱,GPT-4.5“華而不實”,其性能不值如此高的價格。

即使在OpenAI引以為傲的“情感智能”方面,GPT-4.5也未能贏得廣泛認可。許多使用者在社交平台上調侃, GPT-4.5 雖然情商高,但在工作上卻不那麼擅長,他們需要的是一個聰明的模型,而不是一個能理解他們感受的模型。

更令人擔憂的是,GPT-4.5仍然存在幻覺和錯誤。據MIT Technology Review報導,OpenAI自己也承認,GPT-4.5在一個關鍵測試中仍然有37%的機率會“編造事實”。

OpenAI先發優勢消退

02. 縮短藥物研發周期和投資周期

如果OpenAI不能盡快推出一個性能顯著提升的模型,關於其領先地位正在削弱的質疑聲將會越來越大。

此前,美國著名TMT投資人Gavin Baker在一篇推文中表示,AI產業格局的變革正在加速,OpenAI的先發優勢消退,微軟也選擇後撤一步。

Gavin在推文中指出:

當ChatGPT在2022年11月橫空出世時,OpenAI通過激進押注Scaling Law,在生成式AI領域建立了長達7個季度的統治地位。但這一優勢窗口正在關閉:Google的Gemini、xAI的Grok-3,以及Deepseek的最新模型,均已達到與GPT-4相近的技術水平。
就連OpenAI創始人Altman也指出,OpenAI未來的領先優勢將更加狹窄;微軟CEO納德拉基本上表示,他們在模型能力方面領先的獨特時期即將結束。

面對GPT-4.5的困境,業界將目光投向了OpenAI的下一代模型GPT-5,以及其o3推理模型。然而,OpenAI在發佈新技術方面一向有“預告”的習慣,實際發佈時間往往滯後。

距離OpenAI宣佈o3的性能評估已經過去了兩個多月,但Sam Altman最近表示,o3不會像o1那樣作為一個獨立的模型發佈。

儘管Gavin仍看好OpenAI,但他預計,未來資料成為競爭核心,無法獲得獨特、有價值資料的前沿模型是歷史上貶值最快的資產。

在AI大模型競爭日益激烈的當下,單純依靠預訓練已經難以建立長期優勢。OpenAI能否憑藉GPT-5重回巔峰,將取決於其在資料獲取、推理能力以及技術創新方面的突破。 (硬AI)