多模态大模型综述:从专家到通用助手
AIGC动态欢迎阅读
原标题:多模态大模型综述:从专家到通用助手
文章来源:Founder Park
内容字数:5516字
内容摘要:文章转载自量子位,Founder Park 有所调整。多模态大模型最全综述来了!由微软 7 位华人研究员撰写,足足 119 页——它从目前已经完善的和还处于最前沿的两类多模态大模型研究方向出发,全面总结了五个具体研究主题:视觉理解视觉生成统一视觉模型LLM 加持的多模态大模型多模态 agent并重点关注到一个现象:多模态基础模型已经从专用走向通用。Ps. 这也是为什么论文开头作者就直接画了一个哆啦…
联系作者
文章来源:Founder Park
作者微信:Founder-Park
作者简介:来自极客公园,专注与科技创业者聊「真问题」。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...