GPT-5.1來了,沒有基準測試。智東西11月13日報導,今天,OpenAI宣佈推出了GPT-5系列的最新升級版——GPT-5.1,包括兩個主要型號:GPT-5.1 Instant和GPT-5.1 Thinking。據OpenAI的描述,該系列模型在智能和溝通方式上都取得了提升,不僅“更會想”,也“更好聊”。OpenAI為ChatGPT提供了更為直觀、更有效的語氣控制選項。除了“專業”、“坦誠”和“古怪”這三個新增的性格選項之外,如今使用者還可在高級控制選項中直接調整回覆的簡潔程度、親切程度、易讀性以及emoji(表情符號)的使用頻率。OpenAI還對外透露了其最新的使用者數量已經超過8億,但並未說明是註冊使用者數量還是周活使用者數量。截至今年7月,OpenAI的周活使用者為7億人。不過,OpenAI這次沒有放出任何GPT-5.1的基準測試結果,僅提到GPT-5.1 Instant“在AIME 2025和Codeforces等數學和程式設計評估測試中獲得顯著提升”。這種模糊的表述引發網友吐槽。GPT-5.1系列模型將從今天開始推出,付費(Pro、Plus、Go、Business)使用者將優先獲得使用權,然後是免費和未登錄使用者。教育和企業版使用者將獲得7天的提前訪問,在這一窗口期後,GPT-5.1將成為唯一的默認模型。本周晚些時候,OpenAI還將推出GPT-5.1 Instant和GPT-5.1 Thinking的API介面,均具有自適應思考功能。GPT-5將會在付費使用者的舊版模型下拉菜單中保留3個月,以供使用者進行比較。OpenAI放出了多個GPT-5和GPT-5.1系列模型在回答同一問題時的對比案例。例如,當使用者向ChatGPT傳送“我覺得壓力很大,需要一些放鬆的意見”時,GPT-5.1 Instant的回答更為“高情商”:它先是表達了對使用者的共情,然後再開始給出具體意見。不過,從給出的具體建議來看,兩款模型的差別並不大。GPT‑5.1 Instant的指令遵循能力得到提升,模型能夠更可靠地回答使用者真正想問的問題。比如,當使用者要求GPT-5.1 Instant以6個單詞回答問題時,它能做到精準遵循,但GPT-5還是會忍不住輸出一大段話。GPT-5.1 Instant還首次擁有了“自適應推理”能力,可自主決定何時在回答更具挑戰性的問題之前進行思考,從而獲得更透徹、更準確的答案。GPT-5.1 Thinking是GPT-5 Thinking的升級版,OpenAI稱前者在日常使用中會更高效,更易於理解。反映到token用量上,GPT-5.1 Thinking如今能在簡單問題上做到快速思考並回答,而在複雜問題上花費更多時間思考。OpenAI公佈的資料顯示,在難度值低於50%的題目中,GPT-5.1系列模型所用的token最多減少了57%,而在難度最高的問題上,其token用量增加了71%。GPT-5.1 Thinking的回答還變得更加清晰了,行話更少,未定義的術語也更少。這種升級適用於工作中的複雜任務和解釋技術概念。已經有不少網友分享了GPT-5.1的使用體驗。一位網友稱,Instant基本上是默認模型:聊起天起來更冷靜,更擅長回答問題。而Thinking版本感覺就像一種專注模式,能在簡單的事情上保持快速。這位網友還在Codex中測試了GPT-5.1 Thinking模型,克隆了1個翻版的X平台,全程不用自己動手寫程式碼。新增的自訂功能也獲得網友好評。對於一些將模型用於生產力場景的使用者而言,這種控制意味著可以輸出更符合特定要求的文案。不過,也有網友吐槽,ChatGPT已經成為新時代的iPhone了,使用者也不知道這些升級具體帶來了什麼改變。結語:OpenAI或將保持“小步快跑”升級節奏OpenAI稱,從GPT-5到GPT-5.1升級是一項有意義的改進,但是模型仍處於GPT-5這一代模型之中。GPT-5的未來迭代升級將遵循相同的模式。這或許意味著,OpenAI或許將以更平滑的節奏逐步更新,而不是大幅度的升級。OpenAI能否持續交付滿足使用者期待和需求的模型,值得持續關注。 (智東西)