AIGC动态欢迎阅读
原标题:腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,免费商用
关键字:腾讯,模型,架构,中文,能力
文章来源:智东西
内容字数:9404字
内容摘要:
首个中文原生DiT架构,中文原生文生图大模型来了!
作者|ZeR0
编辑|漠影
智东西5月15日报道,腾讯文生图负责人芦清林周二宣布腾讯混元文生图大模型全面开源。
该模型已在Hugging Face平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,与腾讯混元文生图产品最新版本完全一致,基于腾讯海量应用场景训练,可供企业与个人开发者免费商用。
这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。
跟其他业界开源模型对比,混元DiT在多个维度上无短板,并在美学和清晰度维度上具有一定优势。其综合指标在所有开源和闭源算法中排名第三,实现开源版本中的SOTA。
评测数据显示,腾讯混元文生图模型效果远超开源的Stable Diffusion模型及其他开源文生图模型,是目前效果最好的开源文生图模型;整体能力属于国际领先水平。
升级后的混元文生图大模型采用了与Sora、Stable Diffusion 3一致的DiT架构,可支持文生图,也可作为视频等多模态视觉生成的基础。
混元文生图整体模型主要由3个部分组成:a)多模态大语言模型,支持用户文本改
原文链接:腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,免费商用
联系作者
文章来源:智东西
作者微信:zhidxcom
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...