介面新聞從知情人士處獲悉,字節發布文生圖開放模型SDXL-Lightning。
從AI開源社群Hugging Face的最新名單上,介面新聞查詢到了這個模型。SDXL-Lightning 躋身模型趨勢榜,同時也成為Hugging Face Spaces上的熱門模型。
與SDXL-Lightning一同上榜的,是谷歌新推出的「最強開放大模型」Gemma系列,以及Stability AI的新一代文生圖模型Stable Cascade。
在影像生成領域,先進模型的生成技術依賴擴散過程,就是把雜訊逐步轉換為影像樣本的迭代。這個過程通常需要20到40次呼叫神經網絡,不僅會耗費龐大的運算資源,生成速度也比較慢。產生一張高品質影像,大約需要5秒。
知情人士透露,字節跳動的SDXL-Lightning透過漸進式對抗蒸餾的技術,實現前所未有的生成速度。此模型能夠在2步或4步內產生極高品質和解析度的影像,將產生速度加快十倍,是1024解析度下速度最快的文生圖模型,計算成本則降低為十分之一。
一位分析師表示,對於需要快速影像生成的應用程式場景,如即時廣告創意、遊戲角色設計等,SDXL-Lightning模型表現出一些應用潛力。這項技術也可以被運用於快速且高品質生成視訊、音訊以及其他多模態內容。
字節跳動智慧創作團隊對介面新聞回應稱,開源開放的浪潮已成為推動人工智慧迅猛發展的關鍵力量,SDXL-Lightning模型基於已有繁榮生態的文生圖開放模型SDXL,設計之初就考慮到與開放模型社群的相容。
SDXL-Lightning可以作為增速插件無縫整合到卡通、動漫等多樣風格的SDXL模型中,並支援當前流行的控制插件ControlNet、產生軟體ComfyUI,方便開發者、研究人員和創意從業者結合這些工具,助力整個產業的創新和協作。(界面新聞)