今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装

今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装

AIGC动态欢迎阅读

原标题:今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装
关键字:衣物,图像,特征,服装,细节
文章来源:夕小瑶科技说
内容字数:5362字

内容摘要:


夕小瑶科技说 原创作者 | 谢年年仅需上传模特图像,便可一键换装,极大提高了用户网购衣服的效率。
虚拟试衣(Virtual Try-On)作为图像生成中一个商业价值高、可以直接变现的子任务,研究热度随着图像生成技术的发展水涨船高。
但现有的一些方法生成的效果还差点意思,如下图所示:
基于GAN的方法换装后与模特不贴合,像是简单粗暴P上去的一样。扩散模型的出现使其可以生成逼真的试穿图像,但它们往往在细节上还原度不高,比如衣服的色彩版型与原始平装衣物不一致。
复旦团队认为扩散模型的随机性和潜在监督不足是导致问题的关键因素。为了缓解这些问题,作者为虚拟试衣(VTON)任务提出了一种新颖的忠实潜在扩散模型——FLDM-VTON。
该方法在传统的潜在扩散过程的训练中从两个主要方面进行了改进:(i) 通过利用变形后的衣物作为起点和局部条件,提供忠实的衣物先验,以减轻初始和过程中的随机性,(ii)通过一个新颖的衣物平坦化网络,从原始平装衣物引入额外的图像级约束。结果显示,FLDM-VTON在性能上超越了最先进的基线,能够生成具有真实照片级逼真度和忠实衣物细节的试穿图像。
论文标题:FLDM-VTON


原文链接:今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装

联系作者

文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员,覆盖500多家海内外机构投资人,互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备敏锐的行业嗅觉和洞察深度。商务合作:zym5189

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...