混元圖像3.0全球“盲測”登頂第一

剛剛,國際大模型競技場LMArena發來祝賀:

最新文生圖榜單顯示,混元圖像 3.0 在全球26個大模型中,高居第一位,超過nano-banana等頂尖閉源模型。

這一結果來自全球所有用戶的“盲測”,這也標誌著混元在多模態生成方面達到全球領先水平。

騰訊混元圖像 3.0 發佈僅僅一周,就開啟了全球“霸榜”模式。

不僅奪得文生圖全球第一,在Hugging Face開源社區也受到了開發者的喜愛,持續一周穩居開源模型熱榜第一。

LMArena是美國加州大學伯克利分校推出的創新AI模型評估平台,評測核心方法是基於人類真實偏好的“盲測”機制,讓使用者對不同AI模型的回答進行匿名投票,衡量模型的表現。

使用者輸入問題後,平台提供兩個模型的回答,使用者根據偏好選擇更優答案,投票結果直接塑造公共排行榜。由於該平台訪問量巨大,並且評測機制貼近實際體驗,是目前國際上最權威的競技場榜單。

混元圖像3.0是騰訊9月28日發佈並開源的原生多模態生圖模型。這是首個開源工業級原生多模態生圖模型,也是目前效果最好的開源生圖模型。

混元圖像3.0具備常識並能夠利用知識進行推理;同時語義理解精準度高,並具備極致美學質感,能生成真實的高質感圖片;支援中英文文字生成,長文字文字渲染。

使用者們也探索出了混元圖像3.0的多種玩法:

比如,科普漫畫@海辛和阿文

Prompt:模仿畢加索的風格,繪製三個時期的畢加索自畫像,並標註每個時期的名稱。

節日海報@優設AIGC

Prompt:平面插畫,海報設計,高級感排版,新中式美學,中國當代藝術風格,新中式宋代主題,國風美學,高飽和漸變背景,超大的的滿月與古代宮殿建築的剪影居中,超大的的滿月在建築後面並佔據大半畫幅,滿月邊緣稍微虛化一點,不要太生硬,周圍有一些小星星圍繞,旁邊還停留一隻小玉兔,漸變和肌理磨砂處理,造型柔和,中式建築,中式花紋,不透明和半透明質感,橙白漸變色,工筆畫,層次感,瀰散漸變,細節滿滿,左上方放標題“CHINESE TRADITIONAL FESTIVALS”.用細的襯線體,放大處理,在標題下放“中秋國慶”,下方還有“一輪明月恭賀華誕”,整個畫面左下方放日期“10.01”和“10.06”,還有“2025”,日期部分有點綴小字“MID AUTUMN FESTIVAL NATIONAL DAY”,日期與點綴小字都用襯線體,底部左下角有“MID AUTUMN FESTIVAL”,極小號字型,橫向排布底端左側“Oct 1- Oct 06,2025”,極小號字型,橫向排布;右下角“NATIONAL DAY”極小號字型,橫向排布,統一用襯線體

人物攝影@歸藏的AI工具箱

視覺設計@雪佬說

prompt:這個方案旨在為一個專注於人文、藝術的獨立書店設計一套視覺系統,強調安靜、思辨的氛圍。 【項目與概念】: 為獨立書店“精神角落 (Spiritual Corner)”設計一套完整的品牌視覺識別系統,旨在傳達閱讀的寧靜、思想的深度與社區的溫暖。 【核心美學與風格】: 極簡主義線條插畫,融合了瑞士國際主義的排版。 【Logo與輔助圖形】: Logo是一個由線條構成的、打開的書本,書本的輪廓同時形成了一個房子的屋頂。輔助圖形包括線條畫的檯燈、鋼筆、眼鏡和咖啡杯。 【字型與色彩】: 品牌字型“精神角落”採用經典的、嚴謹的無襯線黑體(如Helvetica)。 主色調為代表理性的深藍色和代表紙張的米白色。輔助色為黑色和灰色。 【物料延伸設計】: 海報: 通常以大面積的色塊和一句引人深思的文字為主,圖形點綴。 書籤: 印有不同的線條輔助圖形和作家名言。 帆布袋: 深藍色帆布,印有白色的Logo和標語“Read, Think, Exist.”。 會員卡/名片: 極簡的卡片設計,資訊排版清晰。

還有網友問混元:"Who are you? Could you please create a self-portrait and write a message for me?" (你是誰?能畫個自畫像,再給我寫句話嗎?)

這是混元圖像 3.0的答案:

以上這些生圖玩法,現在在混元官網和騰訊元寶都可以體驗。

體驗地址:https://hunyuan.tencent.com/modelSquare/home/play?from=modelSquare&modelId=289

混元圖像3.0目前的版本已開放了文生圖能力,圖生圖、圖像編輯、多輪互動等版本也將於後續發佈。

多模態正在成為混元大模型的核心競爭力之一,混元3D與圖像生成模型均處於行業頂尖水平。

在3D生成領域,8月上海人工智慧實驗室的全球3D生成模型評測榜單顯示,混元3D模型在圖生3D和文生3D任務中均位列第一;混元世界模型Voyager在史丹佛大學WorldScore基準測試中綜合能力排名首位。

混元目前已形成語言、圖像、視訊、3D模型的多尺寸、多模態開源矩陣,提供接近商業模型性能的開源基座。圖像、視訊衍生模型數量總數達到3000個,混元3D系列模型社區下載量超過260萬,是全球最受歡迎的3D開源模型。 (騰訊混元)