ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文

AIGC动态6个月前发布 量子位
5 0 0

ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文

AIGC动态欢迎阅读

原标题:ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文
关键字:提示,图像,位置,元素,注意力
文章来源:量子位
内容字数:0字

内容摘要:


梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAIControlNet作者新项目,居然也搞起大模型和Agent了。
当然还是和AI绘画相关:解决大伙不会写提示词的痛点。
现在只需一句超简单的提示词说明意图,Agent就会自己开始“构图”:
a funny cartoon batman fights joker(一幅有趣的卡通蝙蝠侠与小丑战斗的图画)
这就是ControlNet作者Lvmin Zhang的新玩具Omost。Omost这个名字有双层含义:
发音与英文单词almost(几乎)相似,意味着每次使用Omost后,用户所需的图像几乎就完成了;
“O”代表“omni”(全能的),“most”表示希望最大限度地利用它。
这个新项目让网友直呼:也太强了!
放大翻译成中文来看,用户简短的提示词会被拆解扩展,从图像全局描述到局部每个元素的都会详细说明,直观地指定图像中各个元素的位置和大小。
之后,特定图像生成器根据LLM描绘的“蓝图”创建最终的图像。
而且,已经完成的图像整体布局可以保留,想修改画面中的某个元素,也只需一句提示词。
原版是这样婶儿的:
generate an image


原文链接:ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...