最强开源多模态生成模型MM-Interleaved:首创特征同步器

AIGC动态8个月前发布 机器之心
14 0 0

最强开源多模态生成模型MM-Interleaved:首创特征同步器

AIGC动态欢迎阅读

原标题:最强开源多模态生成模型MM-Interleaved:首创特征同步器
关键字:图像,模型,任务,框架,图文
文章来源:机器之心
内容字数:5655字

内容摘要:


机器之心专栏
机器之心编辑部过去几个月中,随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出,「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。
想象一下,AI 不仅会聊天,还长了「眼睛」,能看懂图片,甚至还会通过画画来表达自己!这意味着,你可以和它们谈天说地,分享图片或视频,它们也同样能用图文并茂的方式回应你。
最近,上海人工智能实验室联合香港中文大学多媒体实验室(MMLab)、清华大学、商汤科技、多伦多大学等多家高校、机构,共同发布了一个多才多艺的最强开源多模态生成模型 MM-Interleaved,借助全新提出的多模态特征同步器刷新多项任务 SOTA。它拥有对高分辨率图像细节和微妙语义的精准理解能力,支持任意穿插的图文输入和输出,带来了多模态生成大模型的崭新突破。论文地址:https://arxiv.org/pdf/2401.10208.pdf
项目地址:https://github.com/OpenGVLab/MM-Interleaved
模型地址:https://huggingface.co/OpenGVLab/MM-Interlea


原文链接:最强开源多模态生成模型MM-Interleaved:首创特征同步器

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...