多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开

多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开

AIGC动态欢迎阅读

原标题:多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
关键字:报告,模型,图像,性能,编码器
文章来源:新智元
内容字数:0字

内容摘要:


新智元报道编辑:alan
【新智元导读】以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。
端侧小模型端不出来,对比评测的结果又遭到质疑。
上个月震撼登场的自家首款多模态大模型Pixtral 12B,也疑似遇到了成绩不如人的窘境。
不过世间纷扰,留待时间之中去见分晓。
毕竟Mistral AI当年也是以开源极客之姿杀入江湖的,以后的以后,圈内人总会想起有个一言不合就甩出磁力链的公司吧。
按照惯例,在9月份甩出多模态Pixtral 12B的开源链接之后,Mistral会在一段时间后放出技术报告。
我们来看一下Mistral家的第一个MMLM有什么新花样。
论文地址:https://arxiv.org/abs/2410.07073
开源代码:https://github.com/mistralai
首先,许多开源模型一般有个问题,就是为了多模态的性能而牺牲了本身的自然语言性能,之前英伟达的NVLM 1.0也谈到了这点。
Pixtral本次也是成功


原文链接:多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开

联系作者

文章来源:新智元
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...