罕见!苹果开源图片编辑神器MGIE,要上iPhone?

AIGC动态11个月前发布 机器之心
15 0 0

罕见!苹果开源图片编辑神器MGIE,要上iPhone?

AIGC动态欢迎阅读

原标题:罕见!苹果开源图片编辑神器MGIE,要上iPhone?
关键字:指令,编辑,视觉,模型,图像
文章来源:机器之心
内容字数:6499字

内容摘要:


机器之心报道
编辑:蛋酱、陈萍拍张照片,输入文字指令,手机就开始自动修图?
这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。把背景中的人移除在桌子上添加披萨最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLLM)可以自然地将图像视为输入,并提供视觉感知响应。另一方面,基于指令的编辑技术可以不依赖于详细描述或区域掩码,而是允许人类下达指令,直接表达如何编辑以及编辑图像的哪个方面。这种方法极具实用性,因为这种引导更符合人类的直觉。
基于上述技术的启发,苹果提出了 MGIE(MLLM-Guided Image Editing),将 MLLM 用于解决指令引导不足的问题。论文标题:Guiding Instruction-based Image Editing via Multimodal Large Language Models
论文链接:https://openreview.net/pdf?id=S1RKWSyZ2Y
项目主页:https://mllm-ie.github.io/
如图 2 所示,MGIE 由 MLLM 和扩


原文链接:罕见!苹果开源图片编辑神器MGIE,要上iPhone?

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...