AIGC动态欢迎阅读
原标题:「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架
关键字:图像,概念,数据,研究人员,模型
文章来源:新智元
内容字数:7507字
内容摘要:
新智元报道编辑:LRS
【新智元导读】文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于文本来生成图像的扩散模型得到了飞速发展,生成能力有了显著的提升,可以很容易地生成逼真的肖像画,以及各种天马行空的奇幻画作。
近期的相关研究主要集中在控制模型生成「个性化」的内容,即用户先提供一个最小概念图像集,然后对预训练的文本转图像扩散模型进行增强,从而使模型可以生成包含个性化概念的新场景。
现有的一些工作可以增强用户对生成过程的控制,并衍生出许多量身定制的应用场景;但要同时对多个概念进行个性化处理,并控制图像生成以准确遵循给定的文本描述,仍然具有挑战性。
最近,来自加州大学伯克利分校、牛津大学、哈佛大学、卡内基梅隆大学、香港大学、加州大学戴维斯分校的研究人员联合发表了一篇论文,讨论了「图像生成个性化」领域下的两个关键问题。
论文链接:https://arxiv.org/abs/2402.15504
项目主页:https://danielc
原文链接:「个性化」图像生成时代来了!六大顶尖高校联手发布全新Gen4Gen框架
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...