你是否曾經在白板上畫出一個模糊不清的草圖,然後發現身邊的人完全無法理解你想表達什麼?🤔
現在,AI已經超越了人類的這一障礙!OpenAI剛剛發佈的全新模型,不僅能看懂你的塗鴉,還能分析它,與它互動,甚至能像人類一樣"思考"它!
這是否意味著,AI距離真正理解人類世界的方式,又邁進了一大步?📝
2025年4月16日,OpenAI推出了其最新的人工智慧模型o3,這被稱為是該公司迄今為止最先進的模型。與此同時,他們還發佈了一個規模較小的模型o4-mini。這兩款模型都具有一項革命性的能力——"用圖像思考"。
這些模型不只是能"看到"圖像,它們能夠將視覺資訊直接整合到思考鏈中。無論是白板上的草圖、手繪的示意圖,還是質量不佳的圖表,o3都能理解並分析它們。使用者可以上傳這些圖像,然後AI會對它們進行分析並展開討論,甚至能旋轉、縮放和使用其他圖像編輯工具。
OpenAI在聲明中寫道:"我們的推理模型首次能夠獨立使用所有ChatGPT工具——網路瀏覽、Python程式設計、圖像理解和圖像生成,",這幫助它們更有效地解決複雜的多步驟問題,並朝著獨立行動邁出實質性的步伐。
OpenAI表示,o3模型特別擅長數學、程式設計、科學和圖像理解,而o4-mini則運行更快,成本更低。從4月17日開始,ChatGPT Plus、Pro和Team使用者就可以使用這兩種模型了。
這是否預示著AI即將成為我們生活中不可或缺的全能助手?💻
有趣的是,OpenAI的使用者社區長期以來一直調侃其奇怪或令人困惑的AI模型命名方式。CEO Sam Altman本周也加入了這場調侃,他在X平台上發文說:"如果我們在今年夏天之前解決我們的模型命名問題,那麼在此之前的幾個月裡,大家可以盡情取笑我們(我們確實應該被取笑)如何?"
這種親民的態度,是否也是科技巨頭與普通使用者拉近距離的一種方式?🤭
自2022年底推出爆火的ChatGPT聊天機器人以來,OpenAI一直在快速升級其模型,遠遠超越了文字功能,擴展到圖像、語音和視訊領域。該公司正在努力在生成式AI領域保持領先地位,面臨著包括Google、Anthropic和埃隆·馬斯克的xAI在內的激烈競爭。
上個月,OpenAI發佈了一項原生圖像生成功能,因其能夠生成吉卜力工作室風格的動漫圖像而在網上病毒式傳播。而在上個月的融資輪中,該公司的估值已達到驚人的3000億美元。
技術的飛速發展,資本的瘋狂湧入,這是否預示著我們正處於AI革命的風口浪尖?🌊
你怎麼看待OpenAI這一突破性進展?AI能夠理解圖像並與之互動的能力會給我們的日常工作和生活帶來什麼樣的變化? (澤問科技)