腾讯混元文生图大模型全面开源！Sora同架构，更懂中文，免费商用

AIGC动态2年前 (2024)发布智东西

AIGC动态欢迎阅读

原标题：腾讯混元文生图大模型全面开源！Sora同架构，更懂中文，免费商用
关键字：腾讯,模型,架构,中文,能力
文章来源：智东西
内容字数：9404字

内容摘要：

首个中文原生DiT架构，中文原生文生图大模型来了！
作者|ZeR0
编辑|漠影
智东西5月15日报道，腾讯文生图负责人芦清林周二宣布腾讯混元文生图大模型全面开源。
该模型已在Hugging Face平台及Github上发布，包含模型权重、推理代码、模型算法等完整模型，与腾讯混元文生图产品最新版本完全一致，基于腾讯海量应用场景训练，可供企业与个人开发者免费商用。
这是业内首个中文原生的DiT架构文生图开源模型，支持中英文双语输入及理解，参数量15亿。
跟其他业界开源模型对比，混元DiT在多个维度上无短板，并在美学和清晰度维度上具有一定优势。其综合指标在所有开源和闭源算法中排名第三，实现开源版本中的SOTA。
评测数据显示，腾讯混元文生图模型效果远超开源的Stable Diffusion模型及其他开源文生图模型，是目前效果最好的开源文生图模型；整体能力属于国际领先水平。
升级后的混元文生图大模型采用了与Sora、Stable Diffusion 3一致的DiT架构，可支持文生图，也可作为视频等多模态视觉生成的基础。
混元文生图整体模型主要由3个部分组成：a）多模态大语言模型，支持用户文本改

原文链接：腾讯混元文生图大模型全面开源！Sora同架构，更懂中文，免费商用