欧洲名将 Mistral 发布首个多模态模型,12B 开源下载,黄仁勋站台

欧洲名将 Mistral 发布首个多模态模型,12B 开源下载,黄仁勋站台

AIGC动态欢迎阅读

原标题:欧洲名将 Mistral 发布首个多模态模型,12B 开源下载,黄仁勋站台
关键字:报告,模型,图像,基准,图表
文章来源:Founder Park
内容字数:0字

内容摘要:


法国 AI 初创 Mistral AI,又扔出一条磁力链炸场了。
这次,与以往不同的是,他们发布了首个多模态模型 Pixtral 12B,集语言、视觉能力于一身。
这意味着,Mistral AI 正式跨界 MMML,开启多模态 AI 新时代,同时向 OpenAI、Anthropic 等劲敌发起挑战。
多模态 Pixtral 12B,是基于文本模型 Nemo 12B 完成训练。
GPT-4o、Claude 类似,只需上传一张图、提供一个链接,模型就能根据提示回答问题。它不仅能够识别复杂手写笔记,还能看懂数学公式、图表等等。
在多项基准测试(文本、指令跟随、多模态)中,新模型性能大幅超越 Qwen2 7B、Phi-3 Vision 开源模型。
Hugging Face 技术负责人发现此处列举的 Qwen 的数据问题很大
相较于闭源模型,Pixtral 12B 在图表问答、文档问答、视觉数学推理、大学水平多学科等基准中,性能碾压 Claude3 Haiku、Gemini 1.5 8B。
除了大约 24GB 的磁力链,模型代码还可在 HuggingFace、GitHub 下载。(由社区开发


原文链接:欧洲名将 Mistral 发布首个多模态模型,12B 开源下载,黄仁勋站台

联系作者

文章来源:Founder Park
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...