GPT-5波折超乎想像!奧特曼連夜回應一切:4o重新上陣,團隊緊急補救

奧特曼和OpenAI團隊回應關於GPT-5的所有問題。

GPT-5發布會,大家都看了吧~

感覺現在整個世界,都在討論GPT-5。

網友們都吵翻了天,直播的時候跑分圖都能畫錯,這也算AGI?更有網友哭著喊著:還我GPT-4o!

但另一邊呢?畫風完全不一樣,很多網友實測後表示「GPT-5強無敵」

這種又愛又恨的奇妙感覺,恰恰說明了一件事:我們對AGI,太期待了!

這種讓整個AI圈都「炸鍋」的盛況,上一次或許還是ChatGPT橫空出世那會兒。

2022年11月30日,ChatGPT上線,才短短不到3年,我們對GPT-5的期待已經是AGI了!

這世界,因為AI,真的變得太快了。

面對GPT-5發布後的所有的疑問和口誅筆伐,奧特曼,終於回應了這一切。

奧特曼「回應」所有問題

首先是,面對沸騰的輿論,GPT-5剛發表後的第一時間,奧特曼就表示要進行一波全面更新。

我們會繼續努力保障系統穩定,並持續聽取大家的回饋。

一次上線這麼多新東西,我們預料到過程會有些磕磕絆絆。

但實際的波折比我們預想的還要多一些!

  • 在完成全面部署後,我們會將ChatGPT Plus用戶的GPT-5使用限額加倍
  • Plus使用者將可選擇繼續使用4o。我們會持續關注其使用情況,並依此決定舊版模型會保留多久。
  • 從今天起,GPT-5會感覺更聰明。 (昨天,模型的自動切換器出了故障,當機了大半天,導致GPT-5表現得笨了很多。)
  • 我們會讓你更清楚地看到,回答每一個問題的究竟是那個模型。
  • 我們會調整使用者介面,讓使用者更方便地手動觸發模型的「思考」過程。
  • 完全向所有使用者開放的過程比我們預想的要長一些。這畢竟是一次規模龐大的系統性變更。
  • 舉個例子,在過去24小時裡,我們的API流量就幾乎翻了一倍…(雖然大家嘴上罵著,但是都管不住手啊)
  • 我們確實低估了使用者會如此重視GPT-4o的某些特性,即便GPT-5在絕大多數方面都表現得更好。
  • 關於GPT-4o和GPT-5(Chat版本)的相對優劣,使用者的看法大相逕庭。
  • 這件事讓我們明白,不存在一個能滿足所有人的模型,我們需要為不同使用者提供好的個性化訂製方案。
  • 我們正在集中精力完成GPT-5的全面推送並確保系統穩定。

OpenAI GPT-5團隊「回應一切」

與此同時,每次發布會後的「例行公事」AMA問答環節也已完成,奧特曼和眾多高管在線答疑。

太長不看版:

  • GPT-4o回歸:Plus使用者將重新獲得4o的使用權限,支援時長取決於使用情況;
  • 是否同時提供4o/4.1與GPT-5正在研究中。
  • 考慮推出不限量模式。(以前的Plus用4.1是無限的)
  • GPT-5將自動啟用推理能力,下次更新會讓切換更順滑,可用「think hard」強制進入推理模式。
  • 新語音模型:更快、更好地遵循指示。
  • 將支援IDE中使用第三方外掛。
  • 偏見處理較好,GPT-5 mini更有人情味。
  • 計畫讓Plus使用者無限次使用推理模型,並提升GPT-5 mini推理的使用額度。
  • 遺憾的是,由於算力成本限制,沒能實現100萬Token的上下文

AMA問答參與成員:

· 奧特曼(CEO)
· Sulman Choudhry(工程)
· Yann Dubois(研究)
· Alexander Embiricos(產品)
· Tarun Gogineni(研究)
· Saachi Jain(安全)
· Christina Kim(研究)
· Elaine YaLe(研究)
· Daniel Levine(產品)
· Eric Mitchell(研究)
· Michelle Pokrass(研究)
· Max Schwarzer(研究)

問:請讓4o回歸吧。別移除不同的模型版本,大家各有所好。

奧特曼:好的,我們都聽到了大家對4o的呼聲;我們會為Plus用戶重新上線4o,並會根據使用情況來決定支援它多久。

問:請給我們一個選項,可以同時使用GPT-4o/4.1和GPT-5。

奧特曼:我們正在研究這個問題。是必須同時擁有4o和4.1,還是只有4o就夠了?

問:別忘了Plus訂閱用戶曾經有過不限量的模式。

奧特曼:我們該搞一個不限量的東西

問:之前那幾張圖表是怎麼回事?看起來很有誤導性。

奧特曼:圖裡的資料是精準的,但長條圖和簡報搞砸了。當初壓根就不該放那張幻燈片。我們正在整理一份更好的對比資料供大家參考。

問:現在大多數人還是把ChatGPT當聊天機器人。它的用途將如何演變?

Sulman Choudhry:ChatGPT正在為使用者完成越來越多具有經濟價值的工作。人與ChatGPT的互動方式,應該從「提問」逐漸轉變為更適合「做事」的模式。隨著大家學會用新的方式來使用ChatGPT,這個轉變會逐漸發生。

問:ChatGPT語音功能自發布以來有什麼改進嗎?

Sulman Choudhry:我們昨天上線了一個新的語音模型,它在指令遵循和響應速度上都更加出色

問:你們會直接整合類似Cursor的功能嗎?

Alexander Embiricos:你試過Codex CLI嗎?這是我們的開源編碼智能體,可以在本地運行。

問:GPT-4.5的寫作品質怎麼了?

Tarun Gogineni:我們希望GPT-5的思考模式(thinking)能寫得更好、更有趣。

問:GPT-5在處理偏見問題上有什麼不同嗎?

Saachi Jain:當然!實際上我們對這方面所取得的進展感到非常興奮。 GPT-5mini會讓人感覺更有人情味,而不是那麼平淡乏味。

問:為什麼這些新模型還沒有整合在一起?

Christina Kim:我們希望盡快把最強的模型透過統一的體驗提供給大家。未來的版本會繼續將它們融合起來。

問:感覺ChatGPT-5的個性更平淡了。

Christina Kim:我們是刻意訓練GPT-5這麼做的,讓它在默認情況下表現得更中立;你仍然可以通過風格指令來引導它的表達方式。

問:模型之間的切換會變快嗎?

Elaine YaLe:會的! GPT-5會自動判斷是否需要啟用推理能力。在下個版本更新中,切換過程應該會更順滑

問:有沒有什麼提示詞可以強制開啟「思考」模式?

Elaine YaLe:你可以在提示詞裡加上think hard」 (認真思考),就能直接觸發推理模式。

問:ChatGPT會允許在IDE裡使用第三方外掛嗎?

Daniel Levine:會的,這正是我們的目標。我們希望ChatGPT能藉助外部工具幫你建構軟件。

問:身為長期的Plus使用者,我能無限使用推理功能嗎?

Eric Mitchell:我們正在推進一個讓Plus使用者可以無限次使用推理功能的計畫。

問:你們在新套餐裡削減了推理功能的使用量。

Eric Mitchell:我們正在努力讓大家能用gpt-5-mini進行更多推理!我們的目標絕不是限制大家使用推理功能。

問:它的編碼能力和Opus4.1比怎麼樣?

Michelle Pokrass:兩個都是非常棒的模特兒!我們不方便過度評論其他實驗室的模型,但我們認為GPT-5的思考模式(thinking)是我們發佈過的最強編碼模型。

問:你們最想在GPT-5中實現、但最終沒能做到的功能是什麼?

Michelle Pokrass:我們曾經非常希望在GPT-5中實現高達100萬Token的更長上下文,但部分由於算力成本的限制,目前還無法實現

為了測試GPT-5的幻覺問題,我們問了3次GPT-5「9.11和9.9那個數字更大」這個問題。

3次問答,3種模式下,GPT-5都完全回答正確,沒有幻覺出現!

而GPT-5、GPT-5Thinking和GPT-5Pro模式下的回答都體現了不同模型的特點,Pro模式甚至思考了接近1分鐘。


參考資料:

https://www.reddit.com/r/ChatGPT/comments/1mkae1l/gpt5_ama_with_openais_sam_altman_and_some_of_the/

https://x.com/OpenAI/status/1953548075760595186 (新智元)


支援中文好像有點問題,變成方塊