AIGC动态欢迎阅读
原标题:首个中文原生DiT架构,已开源!大模型Hunyuan-DiT技术报告详解
关键字:报告,模型,图像,文本,数据
文章来源:算法邦
内容字数:20718字
内容摘要:
直播预告 | 5月23日晚7点,「智猩猩机器人新青年讲座」第6讲正式开讲,论文一作、清华大学在读博士郭旭东将直播讲解《大模型在具身多智能体合作中的研究进展与展望》,欢迎扫码报名~非常令人激动,腾讯混元文生图大模型已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型。
且不管是企业还是个人开发者,全部免费可用。
主页:https://dit.hunyuan.tencent.com/ 代码:https://github.com/Tencent/HunyuanDiT下面来详细介绍下混元大模型的技术细节,期待国内更多大模型能发布,让AIGC行业应用全面爆发:
Hunyuan-DiT,这是一种具备细粒度理解能力的文本到图像扩散transformer,能够处理中文和英文。为了构建Hunyuan-DiT,精心设计了transformer结构、文本编码器和位置编码。此外,还从头开始建立了完整的数据pipeline,以更新和评估数据,进行迭代的模型优化。
为了实现细粒度的语言理解,训练了一种多模态大语言模型,用于细化图像的标题描述。最终,Hunyuan
原文链接:首个中文原生DiT架构,已开源!大模型Hunyuan-DiT技术报告详解
联系作者
文章来源:算法邦
作者微信:allplusai
作者简介:智猩猩矩阵账号之一,聚焦生成式AI,重点关注模型与应用。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...