离世界模型更近一步！Meta开源OpenEQA，评估AI Agent情景理解能力

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：离世界模型更近一步！Meta开源OpenEQA，评估AI Agent情景理解能力
关键字：基准,问题,模型,世界,环境
文章来源：夕小瑶科技说
内容字数：4473字

内容摘要：

夕小瑶科技说原创作者 | 任同学Yann LeCun 朝着 “世界模型” 又近了一步。
Meta最新的开源工作OpenEQA：从文字模型到世界模型，可以像人一样记忆、推理的新基准，AI理解物理空间又近了一步。
场景1:
假设你正准备离开家，但找不到你的工牌。
现在，你可以询问你的智能眼镜，“我的工牌在哪里”，它会告诉你位置。作为智能体的眼镜可能会利用它的情景记忆来回答工牌在餐桌上。
场景2:
如果你在回家的路上饿了，你可以问问你家的机器人是否还有水果。它会像管家一样在房子里寻找，并可能回答说“水果篮里还有香蕉”。
想象一下，一个具身的人工智能代理充当家用机器人的大脑或一副时尚的智能眼镜，它们通过自然语言理解环境并回答有关问题的任务。
这样的智能体需要利用视觉等感官模式来了解周围环境，比如智能眼镜上的代理可以通过回忆来实现这种理解，而移动机器人则通过主动探索环境来实现。
这类似于构建一个“世界模型”：一个智能体对外部世界进行内部表示，并允许用户通过语言等方式对外部真实世界进行查询。
什么是 OpenEQA？Meta 刚刚推出的 OpenEQA，是第一个支持情景记忆和主动探索用例的开放词

原文链接：离世界模型更近一步！Meta开源OpenEQA，评估AI Agent情景理解能力

联系作者

文章来源：夕小瑶科技说
作者微信：xixiaoyaoQAQ
作者简介：专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员，覆盖500多家海内外机构投资人，互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂，兼备敏锐的行业嗅觉和洞察深度。商务合作：zym5189

阅读原文