最近一周,全球AI領域迎來了交鋒時刻。
當地時間5月13日,OpenAI透過直播發布了GPT-4系列新模型GPT-4o,以及ChatGPT的桌面版本。未親臨直播現場的OpenAI執行長山姆·奧特曼在X上發文表示:「我們的新模型:GPT-4o,是我們目前最好的模型,它智慧且快速,還是原生多模態模型。 」
OpenAI首席技術長米拉·穆拉蒂介紹道,GPT-4o將面向包括免費用戶在內的所有用戶,它較上一代產品更快,改進了文本、視頻和語音功能,提高50種不同語言ChatGPT的服務品質。 GPT-4o也將透過OpenAI的API提供支持,開發者可以使用新模型建立應用程式。
直播時,穆拉蒂與兩位技術人員對GPT-4o進行了現場測試。新模型減少了人機對話的遲滯感,在過程中,人們可以隨時打斷GPT-4o的輸出,情緒傳達實現進步,再結合視頻功能,讓機器更像一個能看能聽的真實存在的人。
如果說之前的GPT是基於數據,在理性分析層面給人以技術跨越的震撼,那麼這次GPT-4o呈現出與人類相似的感性層面的補充,讓人感嘆科幻電影情節已經發生。
OpenAI在這次迭代中,沒有滿足外界對GPT-4.5或GPT-5的期待,但「o」相較數字,更直接地表達了一種進化。根據OpenAI官網介紹,這裡的“o”代表“omni”,意為“全能”,源自拉丁語。而在英語中,它常被用作詞根,可以聯想到“全知全能”和“無處不在”。
值得注意的是,GPT-4o發佈時間點卡在了GoogleI/O開發者大會的前一天。而在往後的一個月中,微軟Build年度開發者大會和蘋果WWDC也即將先後召開。
當地時間5月14日,Google在I/O開發者大會中公佈AI新進展,在前一天OpenAI的鋪墊下,市場自然會以更高的眼光審視這家老牌巨頭的新產品。
OpenAI確實透過這次佈景簡單且短暫的直播成功向Google施壓——開發者現場的即時對話展示,讓人不禁聯想到谷歌大模型Gemini先前發布的展示影片被指剪輯、誇大宣傳。此模型在實際應用中,並未達到其宣傳中的效果。對此,Google承認道,演示影片經過編輯,為簡潔起見,延遲已減少,Gemini輸出也已縮短。 2024年的I/O開發者大會成為Google的關鍵挽尊機會。
其實,Google執行長桑達爾·皮查伊早在七八年前就在I/O開發者大會上表態,要從“移動優先”轉為“AI優先”,但在提前看清方向的條件下,谷歌並沒有延續領先優勢。在上一代網路時代習慣處在領先地位的谷歌,經歷過去一年圍繞AI的挑戰後,似乎變成了追趕者。它需要向外界釋放有關最新技術的正面訊號。
這次I/O開發者大會上,Google亮出了能與GPT-4o相抗衡的Project Astra,該專案展現了多模態理解和即時對話能力。透過演示能夠看出,Astra的延遲較GPT-4o更長,且情感多樣性仍有待提升。
同時,Google也推出了標Sora的影片生成模型Veo。今年2月,與Gemini 1.5 Pro幾乎同時推出的Sora搶盡風頭。
在搜尋引擎方面,Google主動實現自我革命,在搜尋功能中推出AI概覽(AI Overviews),歸納總結搜尋結果。谷歌稱,搜尋將具備多步驟推理能力,並支援影片形式的解決方案搜尋。同時,Google將擁有100萬tokens長的上下文視窗的Gemini 1.5 Pro擴展至200萬tokens級別,這意味著大模型能夠處理更多信息,並擁有更全面的理解能力。
由於ChatGPT自2022年底走入大眾視野後,就對搜尋領域形成了直接威脅,因此市場曾推測,OpenAI會在這次發表會上推出基於ChatGPT的搜尋引擎。但該公司目前並未宣布邁出這一步。
OpenAI和Google的研發競賽陷入膠著,這對包括蘋果和亞馬遜在內的公司形成了威脅。它們需要跟上日益加快的步伐,至少不能落後太多,否則Siri和Alexa都會陷入尷尬。由於蘋果的AI研發進度並不明朗,已經有傳言正在與OpenAI談判,以求在短期內獲得技術許可,將最先進的AI技術應用於蘋果產品。
AI競爭已經從基建向應用與生態搭建蔓延。
谷歌在企業應用和消費者應用上的積累,為其建立AI生態圈提供了天然優勢。或許OpenAI注意到了這一點。今年1月,OpenAI推出個人化AI應用商店GPT Store,用戶可以透過其發現並建立GPT。目前GPT Store主要針對付費版本開放。這項功能被認為可能成為下一個Apple Store。從去年年底宣布,到今年年初問世,歷時兩個月,期間經歷了奧特曼被意外罷免再復職的風波。
截至目前,GPT Store還只是一個管道,距離大眾透過OpenAI潛力所構想的生態建立仍有很大差距。但隨著GPT-4o的技術迭代,對於AI應用的想像得以進一步豐富,不能排除OpenAI正在為生態搭建架構的可能。
在OpenAI此次發表會的最後,穆拉蒂說:「今天我們專注於免費用戶、新模式,和新產品,但我們也非常關心下一個前沿領域。很快,我們將向大家更新下一個大事件的進展
。在激烈競爭之下,保留底牌或許已成為各大巨頭的習慣。 OpenAI的「下一個大事件」的官方時間,或許在後續微軟和蘋果的發表會之後,或許會找另外一個時間節點。畢竟奧特曼一直擅長在正確的時間釋放正確的訊息。 OpenAI先前的技術曝光節奏都取得了不錯的效果。 (財富中文網)