AIGC动态欢迎阅读
原标题:马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合
关键字:模型,用户,世界,基准,代码
文章来源:新智元
内容字数:8824字
内容摘要:
新智元报道编辑:编辑部
【新智元导读】马斯克xAI的多模态模型Grok-1.5V横空出世了!不仅多项基准测试超越GPT-4V,而且看懂梗图写Python代码也都不在话下。并且,为了评估模型对于真实世界的空间理解,xAI此次还推出了新基准RealWorldQA。马斯克的第一代多模态模型Grok-1.5V,终于来了!
Grok 1.5V,号称是能连接数字世界和物理世界。
除了文本功能,它还能处理文档、图标、屏幕截图和照片之类的各种视觉信息。
很快,所有早期测试者和所有Grok用户就能用上Grok 1.5V了。
英伟达高级科学家Jim Fan发现了Grok-1.5V的「最大亮点」:在他看来,Grok-1.5V最令人感兴趣的,就是解决自动驾驶边缘案例的潜力。
如果使用语言进行「思维链」,帮助汽车分解复杂场景,用规则和反事实进行推理,解释其决策,Grok-1.5V就能将像素->动作映射提升为像素->语言->动作。
由此,特斯拉FSD V13就很有可能会理解语言Token!
特斯拉的优势是,具有高度成熟的数据管线,因此,就不难用高质量的人类解释痕迹来标记大量边缘案例,在多模态FSD推理上,微调G
原文链接:马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...