ControlNet作者搞起大模型：让天下没有难写的生图提示词，一句话变构图小作文

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：ControlNet作者搞起大模型：让天下没有难写的生图提示词，一句话变构图小作文
关键字：提示,图像,位置,元素,注意力
文章来源：量子位
内容字数：0字

内容摘要：

梦晨西风发自凹非寺量子位 | 公众号 QbitAIControlNet作者新项目，居然也搞起大模型和Agent了。
当然还是和AI绘画相关：解决大伙不会写提示词的痛点。
现在只需一句超简单的提示词说明意图，Agent就会自己开始“构图”：
a funny cartoon batman fights joker（一幅有趣的卡通蝙蝠侠与小丑战斗的图画）
这就是ControlNet作者Lvmin Zhang的新玩具Omost。Omost这个名字有双层含义：
发音与英文单词almost（几乎）相似，意味着每次使用Omost后，用户所需的图像几乎就完成了；
“O”代表“omni”（全能的），“most”表示希望最大限度地利用它。
这个新项目让网友直呼：也太强了！
放大翻译成中文来看，用户简短的提示词会被拆解扩展，从图像全局描述到局部每个元素的都会详细说明，直观地指定图像中各个元素的位置和大小。
之后，特定图像生成器根据LLM描绘的“蓝图”创建最终的图像。
而且，已经完成的图像整体布局可以保留，想修改画面中的某个元素，也只需一句提示词。
原版是这样婶儿的：
generate an image

原文链接：ControlNet作者搞起大模型：让天下没有难写的生图提示词，一句话变构图小作文