#生圖模型
OpenAI新文生圖模型:AI繪圖進入“零門檻”時代
在人工智慧的浪潮中,每一次技術的突破都可能引發行業的巨震。2025年3月25日,OpenAI發佈了一款全新的文生圖模型,整合於GPT-4o與Sora平台,支援免費使用者使用,並開放企業版、教育版及API介面。這一事件不僅是AI繪圖領域的一次重大突破,更是對整個創意設計行業的一次“顛覆性時刻”。技術亮點方面,該模型的圖像生成速度僅需15秒,支援自訂操作、連續提問、風格轉換及“圖像PPT”等實用功能,其逼真度媲美頭部平台Midjourney這一模型的發佈,不但大幅地降低了,AI繪圖的門檻,而且還為創意設計,帶來了全新的可能性。為何這一模型會引發如此大的震動?首先技術普惠是關鍵。免費開放策略使得普通使用者也能生成專業級圖像,極大地降低了AI繪圖的門檻。其次多模態融合是該模型的核心優勢。結合文字、音訊圖像等多維度輸入,實現“對話式創作”,使用者可以通過簡單的對話指令,生成複雜的圖像。技術場景與爭議的三維解析(一)技術突破非自回歸生成技術傳統的自回歸模型,逐像素地生成圖像,速度較為緩慢,而且容易累積錯誤。不過OpenAI的新模型,採用了非自回歸生成技術,能夠直接生成完整的圖像,速度提升了3倍以上,其細節的一致性也顯著地增強了。這一技術突破,使得AI繪圖的速度以及質量,都得到了質的飛躍。多模態融合能力該模型支援跨模態輸入,使用者可以通過文字、音訊參考圖像聯合輸入生成新圖像。例如結合音訊描述與圖片風格創作,使用者可以輕鬆生成符合需求的圖像。除此之外,連續對話最佳化功能,允許使用者通過多次提問,細化圖像細節,例如“放大手部骨骼特寫”,這樣的話,極大地提升了創作的靈活性,並且提升了創作的精準度。精準文字遵循在複雜場景還原能力方面,該模型表現出色。測試案例中,對“甜品世界”等超現實場景的細節還原度達90%以上。這表明在創意設計領域的以及商業行銷方面的,該模型都可提供高品質圖像生成的解決方案。它為各個領域帶來了高效的助力,輕鬆地且愉快地,功能清晰地直接。並且它在兩個領域中都能發揮關鍵的作用,著實令人讚嘆。(二)應用場景教育領域在教育領域,該模型可以作為動態教學工具,生成牛頓定律、人體結構等教學圖像PPT,替代傳統圖文排版。這種創新的教學方式,不但能夠提升,學生的學習興趣,而且還能提高教學效率。醫療與科研在醫療與科研領域,該模型可以生成高精度醫學圖像,輔助醫生教學與患者溝通。比如通過生成人體解剖圖這種方式,接下來呢,醫生就能更加清楚地給患者講解病情啦。這樣的話,就能夠提升醫患溝通的成效咯。提示詞:用一張圖片介紹人體各個結構創意設計對於創意設計行業,該模型提供了個性化的創作體驗。使用者輸入“復古書房拼貼詩”等抽象描述,AI可以生成兼具藝術性與邏輯性的視覺作品這種能力,不但能夠引發設計師的靈感;而且還能給普通使用者給予創作的可能性。商業行銷在商業行銷領域,該模型可以快速生成商品場景圖,電商企業可以利用這一功能,將商品展示得更加生動和吸引人,成本降低90%。這不但提升了行銷的效率,而且還給企業帶來了更突出的經濟效益。(三)行業衝擊對Midjourney等平台的威脅:OpenAI的免費策略直接衝擊了Midjourney的訂閱制商業模式通過向C端使用者開放,OpenAI不僅吸引了大量使用者,還為開發者提供了更強大的工具,這對Midjourney等競爭對手構成了巨大的壓力。設計師職業爭議:AI繪圖的普及引發了設計師職業的爭議。一方面基礎設計工作(如Banner、PPT配圖)可能逐步被AI替代。另一方面,設計師可以轉向創意策劃與AI調校,聚焦高階審美與場景定義。這一轉變,不但帶來了效率的革命,與此同時也為設計師帶來了新的機遇。倫理與安全風險:AI繪圖獲得了廣泛的傳播,不過此情況也給倫理與安全埋下了隱患。該模型或許會生成帶有暴力且存有偏見的畫面,所以這不僅需要使用者自身自覺地去約束自我,還需要平台展開嚴格的內容審查,以此來妥善應對潛在的問題。除此之外,AI生成的圖像,其版權歸屬並非清晰明了;而且或許會誘發法律範疇內的糾紛。這些問題,需要行業以及政策制定者共同去面對,並且加以解決。總結在短期內,開發者將通過API將模型整合至設計軟體、教育平台,形成工具鏈閉環這個時候OpenAI計畫最佳化中文提示支援,解決生成文字模糊問題這一趨勢,將進一步,推動AI繪圖技術的普及和應用。從長期來看,AI繪圖將結合ARVR技術,實現“所想即所見”的沉浸式創作體驗。未來AI將負責執行,人類將聚焦於創意,重塑藝術生產鏈條這一願景,不但將提升創作的效率,而且將激發更為豐富的創意和創新。對於創作者來說,學習“AI提示詞工程”,掌握跨模態輸入技巧,是應對AI繪圖時代的重要策略對於企業來說,探索AI繪圖在行銷、培訓等場景的降本增效潛力,將為企業帶來更大的競爭優勢。總之OpenAI的新文生圖模型,不但意味著AI繪圖踏入了“幾乎無需門檻”的時代而且給整個創意設計行業帶去了嶄新的機遇與挑戰。在往後伴隨技術持續地發展,還有應用不停地拓展,AI繪圖將會給人類社會帶來更為繁多的驚喜與變革。 (不掉髮的小呆呆)
增強版Sora生圖模型發佈:不僅能直接在ChatGPT用,還搶了梗圖作者的飯碗
官方帶頭畫梗圖。在 DeepSeek 24 小時前剛剛發佈了 V3 模型 0324 版本更新之後,OpenAI 似乎真的有點「不甘示弱」的較勁感,在台北時間 3 月 26 日凌晨宣佈了新產品的發佈預告。雖然在正式開始之前,有一些傳言猜測本次有可能發佈 GPT-5,但根據以往 OpenAI 的各種產品發佈節奏來看,這次並不會是一次重磅更新,但本次直播中,發佈的整合進 ChatGPT 中的新版 Sora,還是給大家帶來的意料之外的「節目效果」。目前,整合進 ChatGPT 中的 Sora,相比於獨立應用版本,能力暫時被侷限在了圖像生成,但據 OpenAI 在直播中介紹,該模型比之前的模型有了質的飛躍。據介紹,開發團隊使用了GPT-4o「全模態」(或可以生成文字、圖像、音訊和視訊等任何類型資料的模型)能力為基礎,來開發這個版本的 Sora。因此使用者可以直接說出自己的需求,甚至上傳或者拍一張照片,作為提示詞來使用。比如直播現場的演示環節,就直接用手機給 Sam Altman 在內的三人來了張自拍,並要求 Sora 生成一張「動漫風格的版本」。這還沒完,他們三人甚至還現場演示了讓 Sora 在圖片上加入一段文字「Feel The AGI」(感受通用人工智慧)。現場畫了第一張新版 Sora 的表情包。這個現場生成的表情包不僅文字精準清晰,並且精準理解了當代流行梗圖中的包括粗體字等必備元素,已經能直接拿來當梗圖發到各種群裡了。由於是 OpenAI 官方帶頭整活,評論區也有不少使用者也被激發熱情,嘗試著把相同的提示詞喂給 Grok,用相同的提示詞和照片,生成同樣風格的內容 ———— 但顯然效果還是比新版 Sora 差了不少,反而帶來了更喜感的效果。除了帶頭畫梗圖,OpenAI 還演示了新版本 Sora 在文字渲染方面的改進,可以讓在圖像上生成沒有拼寫錯誤的連貫文字的成功率明顯提升。在另一個演示場景中,OpenAI 團隊讓 Sora 去生成一幅用於理解相對論的漫畫卡片。不同於以往生圖模型中,在文字生成部分經常容易變得混亂不堪,甚至是「AI 造字」的情況發生,新版 Sora 其原生圖像生成,生成的文字,已經沒有任何明顯錯亂,甚至還在漫畫生成了非常自然流暢的日文,意外的讓日文社區的不少日本使用者「炸鍋」。對於圖片生成模型來講,過去正確渲染文字是一個巨大的挑戰。如果小標題或文字元素有拼寫錯誤或錯誤,整個圖像都可能變得無法使用。此外在這個案例中,OpenAI 還演示了類似對相對論這樣「世界上現有知識」的正確引用。「如果我畫一張圖像,我會受到自身技能的限制……以及我積累的所有世界知識的限制,」 ChatGPT多模態產品負責人 Jackie Shannon  在接受媒體採訪時解釋這個功能的必要性。「該模型將世界知識代入其中,因此當你要求生成牛頓棱鏡實驗的圖像時,你無需解釋「牛頓棱鏡實驗」這件事它本身是什麼,就能得到精準的圖像。」除了上述這些直播中提到的模型能力改進,OpenAI 還表示新版 Sora 大幅提升了在屬性和對象之間保持正確關係的能力。例如,繫結能力較差的模型可能會將要求生成藍色星星和紅色三角形的提示詞,生成為紅色星星而沒有三角形。據 OpenAI 介紹,現有的大多數圖像模型在這方面都很容易「犯錯」,尤其是當被要求渲染多個項目(通常在5到8個左右)時,經常會混淆顏色和形狀。而新版 Sora 的圖像生成功能,可以正確繫結15到20個對象的屬性,在理解各自的複雜需求的同時,保證不會被誤導,從而大幅提高成功率。除了這些使用體驗上的改進,還有一個細節是,OpenAI 已經確認,新版 Sora 生成圖像的時間比以前更長,但 OpenAI 認為這是一個值得的權衡。「雖然我們在延遲方面肯定還有改進的空間……但(我們覺得)這些生成圖片的質量、功能和世界知識,確實彌補了使用者需要等待的額外幾秒鐘,」Shannon說。至於生圖領域的安全問題 —— 從去年到今年已經出現多次偽造名人不雅圖像、熱點事件虛假圖像,以及 Google Gemini 去除照片原水印這樣的問題,OpenAI 團隊強調新版 Sora 已經可以去除照片水印,同時阻止生成性深度偽造圖像,並拒絕生成相關的內容請求。同時所有生成的圖像都將包含標準的C2PA中繼資料,以標記該圖像是由OpenAI建立的。目前,新版整合在 ChatGPT 內的 Sora 圖像生成模型功能,已經開放給 Pro 和 Plus 訂閱套餐的使用者,並且 OpenAI 承諾,新版 Sora 也會在不久的將來,提供給免費版本和 API。現在我最想做的,就是立即讓它幫我畫自己的梗圖了。 (極客公園)