OpenAI昨夜動作頻頻:伺服器一度當機,o3模型價格暴跌80%,o3-pro正式發佈,開源模型卻意外跳票,Sam Altman還發了篇可能是最後一次純人工寫作的長文。
OpenAI宣佈將o3模型的價格下調80%,輸入價格從8美元降至2美元每百萬token,輸出價格從40美元降至8美元。
這個價格調整立即生效,意味著o3的單token價格已經與GPT-4.1持平。不過別高興太早,由於o3生成的token數量約為GPT-4.1的7倍,實際每次查詢的成本還是明顯更高。
Artificial Analysis 分析指出:
o3的新定價與Gemini 2.5 Pro相當,在人工智慧指數表現上也旗鼓相當。同時,它以更低的單token價格實現了比Claude 4 Sonnet Thinking更高的智能水平。
OpenAI研究員Noam Brown表示,智能成本與智能能力的曲線將持續快速提升。「輸入成本現為每100萬次呼叫2美元,輸出成本為每100萬次呼叫8美元。成本與智能提升的曲線將繼續快速發展。」
開發者Scott Wu的評價更加直接:「新的o3價格比兩年前的GPT-4-32k便宜了15倍。與此同時,用例數量可能增長了100萬倍。向OpenAI團隊致敬!」
知名AI專家Jeremy Howard更新了Aider的評測,指出o3以更低成本和更快速度實現了接近Gemini Pro模型的性能,位列第三。
OpenAI同時發佈了o3-pro模型,現已向所有ChatGPT Pro使用者和API開放。
在專家評測中,o3-pro在科學、教育、程式設計、資料分析和寫作等關鍵領域全面超越o3。評審者一致認為o3-pro在清晰度、全面性、遵循指令能力和精準性方面表現更優。
學術評測資料顯示,o3-pro確實強悍:
o3-pro還支援20萬token上下文,最高輸出10萬token,適合處理完整項目歷史及大型程式碼庫。
沃頓商學院的Ethan Mollick教授分享了一個有趣的測試:o3-pro成功解決了從「SPACE」到「EARTH」的詞梯難題,而且生成的路徑與網際網路上僅有的答案不同,排除了訓練資料污染的可能。
Rohan Paul興奮地表示:「o1與o1 pro版本有顯著差距,o3 Pro被認為具有非常卓越的性能表現。」他還分享了詳細的性能對比圖:
Boris Power指出:「自最初的o1-preview版本以來,推理模型性能的提升呈現令人矚目的軌跡,60%以上的勝率在模型升級中極為罕見。」
Sam Altman自己也難掩興奮:「初次看到與o3版本相比的勝率時難以置信其提升幅度。」
Alex Volkov在他的播客中評價:「o3-pro基於人類反饋,表現顯著優於o3及其他已有模型。」
開發者Yuchen Jin的測試讓人哭笑不得:僅僅一句「Hi」的互動,o3-pro思考了13分28秒,花費高達80美元!
Yuchen Jin無奈地說:「o3-pro是當前推理速度最慢且過度推理的模型。」他甚至向Sam Altman喊話,希望能看到o3-pro的「內在獨白」,瞭解它到底在想什麼。
另一位使用者Advait抱怨:「o3 pro什麼時候能回答我的問題?已經載入45分鐘了。」
儘管如此,Yuchen Jin還是承認:「o3-pro繼承了o1-pro的穩健性,同時整合了內建搜尋功能,表現穩定。」
OpenAI員工Aidan McLaughlin透露,ChatGPT實際使用的是「o3-medium」配置,而非更高級的「o3-high」。這種配置從o1開始就一直在用,可能是出於成本考慮,也可能是為了突出o3-pro的性能躍升。
API定價方面,o3-pro每百萬輸入token收費20美元,輸出80美元,比o1-pro便宜87%。OpenAI建議搭配後台模式使用,適合處理長時任務。
Kevin Weil表示,OpenAI正在為Plus使用者翻倍o3的呼叫速率限制,讓使用者能更自由地使用這個強大的模型。
就在大家期待OpenAI的開源模型時,Sam Altman突然宣佈延期:
「我們的開源權重模型需要更多時間,預計夏末發佈而非6月。我們的研究團隊做了一些意想不到且相當驚人的事情,我們認為等待將非常值得,但需要更長時間。」
網友們的反應各異。
有人直接問「GPT-5在那?」,有人調侃「你真的說了'我們在烹飪',然後就關火去過暑假了」。
這個時間點很微妙。
DeepSeek剛剛發佈了性能強悍的R1模型,OpenAI選擇在此時延期,是為了狙擊對手,還是因為自家模型還不如DeepSeek R1?
OIiver的猜測:「延期幾乎可以肯定是因為OpenAI在周期很晚的時候決定,將支援scratchpad的思考方案拼接到記憶體高效的MoE架構上,並配備即時推理檢查安全工具。這三個部分單獨來看都是開創性的,整合在一起需要重新訓練、新的評估和新的紅隊測試——如果要公開發佈權重,這些工作不能急於求成。」
在這個特殊的夜晚,Sam Altman發佈了一篇題為《溫和奇點》的長文,他說這可能是自己最後一次完全不借助AI寫作了。
文章的核心觀點相當震撼:
「我們已經越過了事件視界;起飛已經開始。人類即將建構數字超級智能,至少到目前為止,它遠沒有看起來那麼奇怪。」
時間線預測:
關於智能成本: 「在2030年代,智能和能源——想法,以及實現想法的能力——將變得極其豐富。這兩者長期以來一直是人類進步的根本限制因素;有了豐富的智能和能源(以及良好的治理),理論上我們可以擁有其他一切。」
關於奇點的本質: 「從相對論的角度來看,奇點是一點一點發生的,融合是緩慢進行的。我們正在攀登指數技術進步的長弧;向前看總是垂直的,向後看總是平坦的,但它是一條平滑的曲線。」
「這就是奇點的運作方式:奇蹟變成例行公事,然後成為賭注。」
關於ChatGPT查詢的能耗: 「人們經常好奇ChatGPT查詢使用多少能源;平均查詢使用約0.34瓦時,大約是烤箱一秒鐘多一點的用電量,或高效燈泡幾分鐘的用電量。它還使用約0.000085加侖的水;大約是一茶匙的十五分之一。」
關於工作的未來: 「一千年前的自給農民看到我們今天的工作會說我們有假工作,認為我們只是在玩遊戲來娛樂自己,因為我們有充足的食物和難以想像的奢侈品。我希望我們看一千年後的工作時會認為它們是非常假的工作,我毫不懷疑對於從事這些工作的人來說,它們會感覺非常重要和令人滿意。」
關於AI安全和分配的兩步走戰略:
最後的願景: 「智能太便宜而無法計量已經觸手可及。這聽起來可能很瘋狂,但如果我們在2020年告訴你今天會達到什麼程度,那可能聽起來比我們對2030年的當前預測更瘋狂。」
「願我們平穩、指數級且平靜地擴展到超級智能。」
網友們對這篇文章的反應相當激烈:
有人認為這是重大訊號:「Sam說這是他最後一次純人工寫作,這意味著什麼?AGI真的要來了?」
有人關注實際影響:「如果2027年機器人真的能在現實世界執行任務,那製造業、服務業都要天翻地覆了。」
也有人保持懷疑:「每年都說AGI要來了,結果呢?我看這就是在給投資人畫餅。」
還有人關注倫理問題:「Sam提到的對齊問題確實很關鍵,社交媒體演算法已經是個教訓了,超級智能如果錯位,後果不堪設想。」
一位開發者評論道:「有意思的是他提到科學家現在的生產力是之前的2-3倍,如果AI能讓我們在一年內完成十年的研究,那確實是指數級的變化。」
另一位網友則關注能源問題:「ChatGPT一次查詢只用0.34瓦時,比我想像的少多了。但如果真的智能無處不在,總能耗還是個大問題。」
或許,我們真的站在了一個時代的轉折點上。
OpenAI官方連結:
Sam Altman的「溫和奇點」長文:
第三方分析連結:
相關推文連結: