OpenAI深夜回擊Google,新GPT-4o圖像生成免費用

今日凌晨1點,Google發佈Gemini 2.5思考模型家族首個Gemini 2.5 Pro實驗版本,大約一小時後,OpenAI創始人兼CEO薩姆·阿爾特曼就開直播發佈了迄今為止最先進的圖像生成器GPT-4o圖像生成技術。

OpenAI CEO Sam Altman 在 X 平台繼續誇誇群主上線,表示初次見到模型生成的圖片時,難以相信是 AI 所為,並期待使用者能發揮創意。

新功能亮點如下:
· 能夠精確渲染文字內容
· 支援多模態輸入輸出(文字、圖像、音訊)
· 能理解複雜指令並結合上下文
· 能建立具有真實感的第一人稱視角圖像
· 遵循指令,可以處理上傳的圖片並進行編輯或風格轉換

目前,新功能已向 Plus、Pro、Team 和免費使用者開放,Enterprise 和 Edu 使用者即將獲得存取權。

此外,Google的Gemini 2.5 Pro,Gemini 2.5 繼承並行揚了 Gemini 模型的優勢——原生多模態能力和超長上下文長度。Gemini 2.5 Pro 就支援 100 萬 token 的上下文窗口(200 萬 token 也即將推出),性能顯著超越了前代模型。

在大模型競技場 Chatbot Arena 中,新模型力的排名壓 Gork 3,再次遙遙領先。 (科技漩渦)