字節跳動發布文生圖開放模型SDXL-Lightning

2024/02/24

•

介面新聞從知情人士處獲悉，字節發布文生圖開放模型SDXL-Lightning。

從AI開源社群Hugging Face的最新名單上，介面新聞查詢到了這個模型。SDXL-Lightning 躋身模型趨勢榜，同時也成為Hugging Face Spaces上的熱門模型。

與SDXL-Lightning一同上榜的，是谷歌新推出的「最強開放大模型」Gemma系列，以及Stability AI的新一代文生圖模型Stable Cascade。

在影像生成領域，先進模型的生成技術依賴擴散過程，就是把雜訊逐步轉換為影像樣本的迭代。這個過程通常需要20到40次呼叫神經網絡，不僅會耗費龐大的運算資源，生成速度也比較慢。產生一張高品質影像，大約需要5秒。

知情人士透露，字節跳動的SDXL-Lightning透過漸進式對抗蒸餾的技術，實現前所未有的生成速度。此模型能夠在2步或4步內產生極高品質和解析度的影像，將產生速度加快十倍，是1024解析度下速度最快的文生圖模型，計算成本則降低為十分之一。

一位分析師表示，對於需要快速影像生成的應用程式場景，如即時廣告創意、遊戲角色設計等，SDXL-Lightning模型表現出一些應用潛力。這項技術也可以被運用於快速且高品質生成視訊、音訊以及其他多模態內容。

字節跳動智慧創作團隊對介面新聞回應稱，開源開放的浪潮已成為推動人工智慧迅猛發展的關鍵力量，SDXL-Lightning模型基於已有繁榮生態的文生圖開放模型SDXL，設計之初就考慮到與開放模型社群的相容。

SDXL-Lightning可以作為增速插件無縫整合到卡通、動漫等多樣風格的SDXL模型中，並支援當前流行的控制插件ControlNet、產生軟體ComfyUI，方便開發者、研究人員和創意從業者結合這些工具，助力整個產業的創新和協作。（界面新聞）