AIGC动态欢迎阅读
原标题:马斯克旗下xAI发布首个多模态大模型!
关键字:模型,基准,能力,图表,测试
文章来源:大数据文摘
内容字数:3857字
内容摘要:
大数据文摘受权转载自头部科技
文丨Congerry
3月中旬,马斯克旗下的 xAI 刚刚宣布开源 Grok-1 大模型!
一个月过去,xAI 又掏出了 Grok-1.5V。
Grok-1.5V是xAI开发的第一款多模态模型。
除了强大的文本处理能力,Grok现在还可以处理包括文档、图表、截图和照片在内的多种视觉信息。
xAI宣称Grok-1.5V能在多个领域与现有的前沿多模态模型竞争,包括跨学科推理、理解文档、科学图表、图表、截图和照片。特别强调了Grok在理解物理世界方面的能力。
而且所有数据集都是在零样本设置下评估的,没有使用思维链提示。这意味着在评估这些多模态模型的性能时,模型没有接受过任何特定于测试任务的训练或示例(即零样本),也没有通过一系列的逻辑推理步骤(即思维链提示)来辅助解决问题,完全依靠自身的能力来处理和回答问题,展示了它们的真实性能和泛化能力。
从这张图表中可以看出,Grok-1.5V在MMMU多学科、Mathvista数学、AI2D图表、TextVQA文本阅读、ChartQA图表、DocVQA文档等多项基准测试中,表现已经逼近头部模型。
浅试一下让Grok把这张图
原文链接:马斯克旗下xAI发布首个多模态大模型!
联系作者
文章来源:大数据文摘
作者微信:BigDataDigest
作者简介:普及数据思维,传播数据文化
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...