马斯克发布Grok-1.5V!xAI首款多模态大模型,能看图写代码、算热量

AIGC动态8个月前发布 智东西
8 0 0

马斯克发布Grok-1.5V!xAI首款多模态大模型,能看图写代码、算热量

AIGC动态欢迎阅读

原标题:马斯克发布Grok-1.5V!xAI首款多模态大模型,能看图写代码、算热量
关键字:甲板,模型,代码,团队,能力
文章来源:智东西
内容字数:5527字

内容摘要:


一个月内,马斯克三个大模型大招。
作者|ZeR0
编辑|漠影
智东西4月13日消息,刚刚,马斯克的大模型创企xAI推出了其首款多模态大模型Grok-1.5V。
这是OpenAI的大语言模型劲敌之一。如今,除了文本功能外,Grok现在还可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图、照片,并能进行多学科推理。
xAI重点展示了Grok-1.5V的7个示例,包括:将手绘图表转换成Python代码、看食品标签计算卡路里、根据孩子的绘画讲个睡前故事、解释梗图、将表格转换成csv格式、为生活日常问题答疑解惑、解决代码问题。
至此,xAI正式加入前沿多模态大模型的竞赛。
GPT-4V、Claude 3 Sonnet、Claude 3 Opus、Gemini Pro 1.5相比,Grok-1.5V的表现不相上下,在一些基准测试中略胜一筹。
尤其是在RealWorld,用于衡量真实世界空间理解能力的QA基准测试中,Grok明显优于同类模型。xAI团队对Grok理解物理世界的能力感到特别兴奋。对于上面的数据集,该团队在没有思维链提示的情况下在零样本设置中评估Grok。
xAI宣布向社区


原文链接:马斯克发布Grok-1.5V!xAI首款多模态大模型,能看图写代码、算热量

联系作者

文章来源:智东西
作者微信:zhidxcom
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...