比Flux更强大的文生图模型来了！秘诀是“集百家之长”

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：比Flux更强大的文生图模型来了！秘诀是“集百家之长”
关键字：模型,研究人员,图像,方面,框架
文章来源：量子位
内容字数：0字

内容摘要：

IterComp团队投稿量子位 | 公众号 QbitAI打造更强大文生图模型新思路有——
面对Flux、stable diffusion、Omost等爆火模型，有人开始主打“集各家所长”。
具体来说，清北、牛津、普林斯顿等机构的研究者提出了⼀个全新文生图框架IterComp。
它能提取不同模型在各自领域的优势，同时不引入额外的复杂指令或增加计算开销。
论文一经发布，即在?（前）获得AI论文领域大V转发，吸引大量关注。
那么，研究人员具体是如何实现的呢？
全新文生图框架：IterComp⾃2022年以来，基于diffusion的文生图模型取得了快速发展，尤其在复杂组合生成（complex/compositional generation）任务上取得了显著进展。
例如，今年8月发布的Flux展现出了十分震撼的复杂场景生成能力与美学质量；
RPG通过MLLM的辅助，将复杂的组合生成任务分解为简单子任务；
InstanceDiffusion通过布局控制（layoutbased），实现了与布局分布高度一致的精确图像生成。
然而，这些模型的优势仅限于某些特定的组合生成任务，且存在诸多局限。

原文链接：比Flux更强大的文生图模型来了！秘诀是“集百家之长”