爆打多模态王者 GPT-4V、Gemini Pro!这个小小端侧模型杀疯了!

爆打多模态王者 GPT-4V、Gemini Pro!这个小小端侧模型杀疯了!

AIGC动态欢迎阅读

原标题:爆打多模态王者 GPT-4V、Gemini Pro!这个小小端侧模型杀疯了!
关键字:模型,报告,能力,高效,图像
文章来源:夕小瑶科技说
内容字数:6676字

内容摘要:


夕小瑶科技说 分享多模态王者 GPT-4V、Gemini Pro ,竟然被一个端侧模型打爆了!而且这个模型还凭强劲实力拿下了全球最强端侧多模态模型王座!
有图有真相。比如输入一张充满繁密字迹的《三体》主体的建筑图, GPT-4V 压根答不上来。
但这个端侧模型却能一眼道破,甚至还能推理出该建筑对《三体》的纪念意义:
或许你会觉得要达到力压 GPT-4V 的效果,这个模型肯定得上千亿参数起步;
但如果我告诉你这个端侧模型只有8B参数,你敢信吗?笔者我最开始打死也是不信的,毕竟 GPT-4V 据说可是有几千上万亿参数。
然而事实摆在眼前,我却不得不信。
那么这背后究竟是什么模型?又是如何做到的呢?
不卖关子了,这背后就是由国内大模型研发头部公司面壁智能最新打造的最强端侧多模态模型——MiniCPM-Llama3-V 2.5。
据说内部叫做小钢炮 520 特别版,是送给开源社区的一份情人节礼物 🎁
啧啧啧,这浪漫的简直不像个科技公司。MiniCPM-Llama3-V 2.5的厉害之处在于,它不仅是最强端侧多模态模型,而且支持30多种语言,此外,它还同时具备:
最强端侧多模态综合性能:超越多


原文链接:爆打多模态王者 GPT-4V、Gemini Pro!这个小小端侧模型杀疯了!

联系作者

文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员,覆盖500多家海内外机构投资人,互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备敏锐的行业嗅觉和洞察深度。商务合作:zym5189

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...