AIGC动态欢迎阅读
原标题:贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数
关键字:模型,图像,图片,数据,地址
文章来源:新智元
内容字数:5573字
内容摘要:
新智元报道编辑:编辑部
【新智元导读】贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸组合,一上线就刷爆了多模态任务榜单!读得懂梗图,做得了学术,用代码就能复现数学函数图。刷爆多模态任务榜单,超强视觉语言模型Mini-Gemini来了!
效果堪称是开源社区版的GPT-4+DALL-E 3王炸组合。
不仅如此,这款由港中文终身教授贾佳亚团队提出的多模态模型,一经发布便登上了PaperWithCode热榜。
Demo地址: http://103.170.5.190:7860/
论文地址:https://arxiv.org/pdf/2403.18814.pdf
具体来说,Mini-Gemini提供了2B小杯到34B的超大杯的不同选择。
凭借超强的图文理解力,Mini-Gemini在多个指标上,直接媲美Gemini Pro,GPT-4V。
目前,研究团队将Mini-Gemini的代码、模型、数据全部开源。
更有意思的是,超会玩梗的Mini-Gemini线上Demo已经发布,人人皆可上手试玩。
Mini-Gemini Demo放出后受到广大网友关注,一番「尝
原文链接:贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...