AIGC动态欢迎阅读
原标题:比Flux更强大的文生图模型来了!秘诀是“集百家之长”
关键字:模型,研究人员,图像,方面,框架
文章来源:量子位
内容字数:0字
内容摘要:
IterComp团队 投稿量子位 | 公众号 QbitAI打造更强大文生图模型新思路有——
面对Flux、stable diffusion、Omost等爆火模型,有人开始主打“集各家所长”。
具体来说,清北、牛津、普林斯顿等机构的研究者提出了⼀个全新文生图框架IterComp。
它能提取不同模型在各自领域的优势,同时不引入额外的复杂指令或增加计算开销。
论文一经发布,即在𝕏(前)获得AI论文领域大V转发,吸引大量关注。
那么,研究人员具体是如何实现的呢?
全新文生图框架:IterComp⾃2022年以来,基于diffusion的文生图模型取得了快速发展,尤其在复杂组合生成(complex/compositional generation)任务上取得了显著进展。
例如,今年8月发布的Flux展现出了十分震撼的复杂场景生成能力与美学质量;
RPG通过MLLM的辅助,将复杂的组合生成任务分解为简单子任务;
InstanceDiffusion通过布局控制(layoutbased),实现了与布局分布高度一致的精确图像生成。
然而,这些模型的优势仅限于某些特定的组合生成任务,且存在诸多局限。
原文链接:比Flux更强大的文生图模型来了!秘诀是“集百家之长”
联系作者
文章来源:量子位
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...