新模型對標Nano Banana Pro,能免費體驗。
Seedance 2.0的熱度還沒下去,字節新模型又來了!
智東西2月10日報導,今日,字節圖像生成模型Seedream 5.0 Preview在視訊編輯應用剪映、剪映海外版Capcut、字節AI創作平台小雲雀均已上線,在即夢AI平台開啟灰度測試,圖片生成可限時免費體驗。
Seedream 5.0 Preview的圖像支援2K和4K解析度輸出,2K為圖片生成直出,4K為AI增強後的解析度。根據Capcut官網,新模型5.0 Preview的升級點為首次支援檢索生圖,對提示詞的理解精準性增強、支援更細節、精緻紋理的圖像生成,還允許使用者精確調整圖像。Seedream 4.5於2025年12月4日上線。
智東西實際體驗並對比了Seedream 5.0 Preview與Nano Banana Pro、Seedream 4.5,發現新模型可以理解“靜謐科技感”等抽象提示詞,但最後的生成效果相比Seedream 4.5很難說有跨越式提升,其聯網搜尋能力尚不穩定、生成效果升級點體現在更美觀、多樣化上。
Capcut的官宣推文裡提到,Seedream 5.0 Preview可與Nano Banana Pro對標,且更便宜,目前所有使用者可免費使用20次,美國地區之後上線。有網友對比了Nano Banana Pro、ChatGPT、Seedream 5.0 Preview、Grok Imagine Image的生成效果,其提示詞為:生成一張高品質的資訊圖,解釋在特拉普修道院製作啤酒的過程,並配有豐富的插圖。
相比於其他幾個,Seedream 5.0 Preview的步驟解釋最為詳細,每步都有詳細的文字說明,但藝術設計感相比Nano Banana Pro稍弱。
從社交平台X上的網友評論來看,此次Seedream 5.0預覽版的升級優先考慮的是智能水平而非美觀,可以應對複雜的知識驅動型任務。
有網友認為,Seedream 5.0 Preview的智能水平、中文能力有提升,但都比不上Nano Banana Pro。
還有網友調侃,新模型的進步程度僅0.09,僅相當於加了網路搜尋的Seedream 4.5。
根據Capcut官網,此次Seedream 5.0 Preview的重要升級點包括精準性與智能水平增強、更快更具表現力的圖像建立、支援聯網知識整合。
首先在智能水平方面,Seedream 5.0 Preview能深入理解提示詞,生成與使用者意圖相匹配、細節精準、佈局清晰、文字渲染效果更佳的圖像。
第二點是增強風格化效果,其圖像到圖像功能增強了風格化效果,模型可以提供更清晰的細節、精緻的紋理和平衡的照明。該模型還新增了編輯功能,使用者可以控制筆刷精準選擇並調整相應元素。
最後是智能推理能力,其官網提到,新模型的多步邏輯、空間理解及特定領域知識增強。
智東西體驗了Seedream 5.0 Preview的圖片生成能力。
第一個提示詞是“為《靜夜思》生成古詩插圖”,可以看到生成的結果中人物“舉頭望明月”這一關鍵元素都沒有缺失,還附上了人物在月光下的影子等,但原詩中的“床前”等沒有在圖片中涉及到。
為了考驗Seedream 5.0 Preview的聯網搜尋能力,智東西輸入了提示詞“最近有很多家機器人都要參加2026春晚,生成一張已官宣參加春晚的機器人海報”。
Seedream 5.0 Preview生成的視覺元素精準,在大段文字生成中也未出現亂碼,表現穩定。但其並沒有理解“已官宣參加春晚的機器人”,而是僅生成了機器人上春晚的海報。
還有抽象的提示詞,智東西輸入“生成一個靜謐科技感且帶有落日餘暉氛圍的鬧鐘圖片”,新模型生成的圖片中,從鬧鐘的設計到背景將落日、科技感融合在了一起。
關於更為細緻的圖像輸出,提示詞為“特寫電影感肖像,一位有雀斑、深色捲髮的年輕女性,被鮮豔的野花和藤蔓環繞,頭上戴著花冠。在黃金時段拍攝,溫暖的逆光在她的頭髮和皮膚上形成光暈,淺景深,前景花朵柔焦,照片級真實感”。
可以看到,輸出的圖片中的逆光效果非常到位,髮絲邊緣的光暈、皮膚的光澤以及前景花朵的柔焦虛化,都營造出了自然的氛圍感。
當智東西的提示詞為“最新奧斯卡獲獎者紅毯風格”時,Seedream 5.0 Preview可以直接生成有紅毯、背景板、攝影師的完整圖像,背景板還有不少奧斯卡的小金人。
根據參考圖生成圖片方面,智東西上傳了最近熱度超高的《閃靈》男主傑克,並讓Seedream 5.0 Preview“生成這個人的拜年圖片,主人公要身有年味的服裝,手拿燈籠和對聯”。
生成的效果中,主人公的面部與參考圖一致,手拿燈籠、對聯的元素也都具備。
智東西還比較了Seedream 5.0 Preview與Nano Banana Pro的生成效果。一個超難提示詞為“生成一個用左手寫字的人,背景有一個顯示5:25的模擬時鐘”,Seedream 5.0 Preview與Nano Banana都失敗了,要麼是拿筆的手不對,要麼是背景的鐘錶時間不對。
Nano Banana Pro生成的圖片中,人物握筆的手為左手,可以從模糊的時鐘看出其時間為5:30左右。
雖然Seedream 5.0 Preview有些圖片生成的並不精準,但其一次性生成的圖片更具多樣性,從現代風、古風到卡通都有。
在比較Seedream 4.5和Seedream 5.0 Preview時,智東西上傳的提示詞是“幫我生成番茄炒雞蛋的菜譜,卡通風格”。相比之下,Seedream 5.0 Preview的整體排版、架構設計會更為美觀。
當前頭部圖像模型的迭代路徑,正朝著提升理解能力、可控生成、編輯精度等實用能力升級。
從Seedream 5.0 Preview的升級來看,其選擇在檢索增強、細節紋理、精準調整、4K增強上做最佳化,生成的結果並沒有顛覆性效果,這或許更貼近使用者的實際需求。但從實測與輿論反饋來看,使用者對小版本迭代的感知正在變弱,尤其在抽象語義理解、文字渲染、複雜邏輯構圖等方面仍存在技術瓶頸。 (智東西)