騰訊新動作

騰訊混元發佈開源大模型加速庫

證券時報記者從騰訊方面獲悉,6月6日,騰訊發佈針對騰訊混元文生圖開源大模型(以下簡稱為混元DiT模型)的加速庫,讓推理效率大幅提升,生圖時間縮短75%。

據騰訊方面介紹,混元DiT模型的使用門檻也大幅降低。使用者可以基於ComfyUI的圖形化介面,使用騰訊混元文生圖模型能力。同時,混元DiT模型已經部署至HuggingFaceDiffusers通用模型庫中,使用者僅用三行程式碼即可呼叫混元DiT模型,無需下載原始程式碼庫。

具體來看,項目組通過知識蒸餾和TensorRT高性能推理框架,實現了DiT模型的採樣步數壓縮與高效推理部署。蒸餾主要指降低擴散模型迭代的步數實現加速。模型整體結構和參數量不變,使用者在無需任何額外的操作和裝置要求下使用蒸餾權重,即可降低50%迭代步數,實現耗時減半。TensorRT推理加速方案通過工程最佳化,可以進一步降低耗時,並且和模型權重解耦。同時使用兩者進行推理部署,可將推理時間縮短75%。

騰訊官方還分享了兩個降低使用者使用門檻的最新消息:經過與社區的共同努力,使用者可以基於ComfyUI的圖形化介面使用騰訊混元文生圖模型能力。同時,通過與HuggingFace團隊合作,混元DiT模型已經部署到HuggingFace官方模型庫Diffusers中,並編寫了適配該模型庫的呼叫和生成程式碼,使用者可以直接通過該途徑呼叫混元DiT模型,大大簡化了使用者使用的成本。

據悉,ComfyUI是一款文生圖領域的WebUI介面設計,它將文生圖領域的擴散演算法模組化與圖形化,提升了生成效率與資源利用率,也大幅降低了開發者的使用門檻。使用者可以通過圖像化工作流使用混元DiT文生圖模型,實現與官方模型一樣的效果。


混元DiT文生圖模型的ComfyUI使用介面


騰訊文生圖負責人蘆清林表示:“騰訊混元文生圖模型開源之後得到了眾多開發者的支援和反饋,我們十分高興,也同時在針對開發者的反饋與社區一起完善和最佳化基於混元DiT的開源生態,讓更多開發者能更便利地享受到最新的研究成果。也歡迎大家跟我們一起共建下一代視覺生成開源生態,推動大模型行業加速發展。”

近期騰訊方面連續披露在大模型方面的新進展。

就在不久前的5月30日,騰訊宣佈旗下混元大模型全面升級,基於混元大模型的App“騰訊元寶”正式上線。相比此前測試階段的混元小程序版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,其玩法也更加豐富,提供了多個特色AI應用,並新增了建立個人智能體等玩法。

更早前的5月22日,騰訊雲公佈大模型升級方案。根據這一升級方案,主力模型之一混元—lite模型,API輸入輸出總長度計畫從4k升級到256k,價格從0.008元/千tokens調整為全面免費。混元—standardAPI輸入價格從0.01元/千tokens降至0.0045元/千tokens,下降55%,API輸出價格從0.01元/千tokens降至0.005元/千tokens,下降50%。據悉,新上線的混元—standard—256k,具備處理超過38萬字元的超長文字能力,API輸入價格下調至0.015元/千tokens,下降87.5%,API輸出價格下降至0.06元/千tokens,下降50%。最高組態萬億參數模型混元—pro,API輸入價格從0.1元/千tokens降至0.03元/千tokens,降幅達70%。

“百模大戰”競爭白熱化

今年以來,包括騰訊在內,中國各大廠商在大模型方面的動作不斷,“百模大戰”競爭日趨白熱化。

比如在價格競爭方面,科大訊飛近期宣佈對大模型價格進行調整,將訊飛星火LiteAPI永久免費開放,訊飛星火Pro/MaxAPI價格也低至0.21元/萬tokens。科大訊飛同時表示,通過將訊飛星火API能力正式免費開放,公司致力於攜手生態開發者加快大模型賦能剛需場景。

今年5月21日,阿里雲發佈通義千問降價公告,降價後,1塊錢最多可以買200萬tokens。

而在5月21日當天,百度方面也發佈消息表示,文心大模型兩大主力模型全面免費,並立即生效。 (證券時報)