ChatGPT再進化:o1支援呼叫Python分析資料,網友:已經成為Copilot了

今天一大早,ChatGPT突然更新——

基於Python的資料分析功能,在o1和o3-mini當中也可以使用了。

OpenAI介紹,現在可以通過兩款模型呼叫Python,完成資料分析、可視化、基於場景的模擬等任務。


量子位實測發現,雖然介面並無明顯變化,但是Python的確已經在o1當中悄悄“上崗”了。


有網友評論說,這相當於是ADA(高級資料分析)功能迎來了第三個版本:


還有人評價說,o1已經從一個助理,進化成全能的資料分析Copilot了。


那麼,擁有了Python這一強大武器之後的o1,在資料分析上表現究竟如何呢?我們進行了一波實測。

o1挑戰Python資料分析

第一輪測試,我們整理了某架飛機近一年時間裡執飛過的400多條航班記錄,交給模型對其中的資料進行分析。

表面上,需要回答的問題有4個:

  • 這架飛機都執飛過那些航線,每條各執飛過多少次;
  • 在每條航線中,執飛次數最多的航班號分別是多少;
  • 這架飛機的實際起飛時段集中在一天中的那段時間(以整小時統計),注意表中為UTC時間,請換算成台北時間;
  • 僅考慮落地時間,這架飛機一共出現過多少次延誤,平均和最長延誤時間分別是多少。

但實際上,模型還需要考慮更多的事情。

第一個問題,還可以通過簡單直接統計實現,第二個問題就需要根據第一個問題的結果對資料進行歸類後再進行計算。

第三個問題要做的工作就更多了,需要從原始的時間資料中提取出所在的小時段,還需要進行時差換算

最後一個問題也最複雜,需要從混雜有其他文字的結構化資訊中先找出時間,然後還涉及到比較和時間差計算,計算完後還要再進行篩選和進一步統計。


最終,這四個問題,o1在呼叫了Python之後全都分析對了。


當然,4o也答對了這些問題,不過輸出的格式不太美觀。


Claude(3.7 Sonnet)這邊則是鬧出了一些烏龍,一開始表示自己無法打開上傳的檔案(可能是檔案名稱包含中文的緣故),反覆自動重試多次後,竟然自己編了一套答案出來。

屬於是沒活硬整了。


右側答案為Claude編造的錯誤資訊

不過當我們去掉檔案名稱中的中文之後,Claude成功讀取了檔案,並給出了正確的結論。


測試完在問答式的任務上的表現,再來看看可視化能力

這裡我們找來了最近某班次航班的飛行記錄,包含了起飛到降落過程中各時間點的位置、高度、速度、航向等資訊,一共有1700余個資料點。

給出的任務則是繪製出高度和速度隨時間變化的折線圖,並且涉及到了時區和計量單位的換算(原始資料中時間為UTC時間、高度為英呎、速度為節,需要換算成台北時間、高度單位為米、速度單位為公里每小時)。

在分別呼叫Python後,o1(左)和4o(右)繪製出的圖像是這樣的。

這裡4o的標記更加易於分辨,而o1對兩條線都採用了混色繪製,有些分不清具體所指:


當然對於圖線的形狀來說,經過對比原始資料來源中給出的圖線,結果是一致的。


Claude這邊的操作更加高級,直接做成了一個可互動的網頁,滑鼠劃過後會顯示時間點對應的原始資訊。

但關鍵的問題是,Claude在時區的轉換上出了錯,並且也沒按要求把時間間隔較長的資料點用虛線連接。


One More Thing

除了o1和o3-mini的功能更新外,OpenAI還宣佈了另一個消息——

之前Mac客戶端會員專屬的Work with Apps功能,現在開放給所有使用者了。

該功能可以從文字編輯和IDE工具等程序中讀取程式碼等資料,無需反覆複製貼上就能更方便地完成程式設計等任務。


(量子位)