剛剛,國際大模型競技場LMArena發來祝賀:
最新文生圖榜單顯示,混元圖像 3.0 在全球26個大模型中,高居第一位,超過nano-banana等頂尖閉源模型。
這一結果來自全球所有用戶的“盲測”,這也標誌著混元在多模態生成方面達到全球領先水平。
騰訊混元圖像 3.0 發佈僅僅一周,就開啟了全球“霸榜”模式。
不僅奪得文生圖全球第一,在Hugging Face開源社區也受到了開發者的喜愛,持續一周穩居開源模型熱榜第一。
LMArena是美國加州大學伯克利分校推出的創新AI模型評估平台,評測核心方法是基於人類真實偏好的“盲測”機制,讓使用者對不同AI模型的回答進行匿名投票,衡量模型的表現。
使用者輸入問題後,平台提供兩個模型的回答,使用者根據偏好選擇更優答案,投票結果直接塑造公共排行榜。由於該平台訪問量巨大,並且評測機制貼近實際體驗,是目前國際上最權威的競技場榜單。
混元圖像3.0是騰訊9月28日發佈並開源的原生多模態生圖模型。這是首個開源工業級原生多模態生圖模型,也是目前效果最好的開源生圖模型。
混元圖像3.0具備常識並能夠利用知識進行推理;同時語義理解精準度高,並具備極致美學質感,能生成真實的高質感圖片;支援中英文文字生成,長文字文字渲染。
使用者們也探索出了混元圖像3.0的多種玩法:
比如,科普漫畫@海辛和阿文
節日海報@優設AIGC
人物攝影@歸藏的AI工具箱
視覺設計@雪佬說
還有網友問混元:"Who are you? Could you please create a self-portrait and write a message for me?" (你是誰?能畫個自畫像,再給我寫句話嗎?)
這是混元圖像 3.0的答案:
以上這些生圖玩法,現在在混元官網和騰訊元寶都可以體驗。
體驗地址:https://hunyuan.tencent.com/modelSquare/home/play?from=modelSquare&modelId=289
混元圖像3.0目前的版本已開放了文生圖能力,圖生圖、圖像編輯、多輪互動等版本也將於後續發佈。
多模態正在成為混元大模型的核心競爭力之一,混元3D與圖像生成模型均處於行業頂尖水平。
在3D生成領域,8月上海人工智慧實驗室的全球3D生成模型評測榜單顯示,混元3D模型在圖生3D和文生3D任務中均位列第一;混元世界模型Voyager在史丹佛大學WorldScore基準測試中綜合能力排名首位。
混元目前已形成語言、圖像、視訊、3D模型的多尺寸、多模態開源矩陣,提供接近商業模型性能的開源基座。圖像、視訊衍生模型數量總數達到3000個,混元3D系列模型社區下載量超過260萬,是全球最受歡迎的3D開源模型。 (騰訊混元)