CVPR 2024满分论文，英伟达开源BOP排行榜6D物体姿态第一名方法

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：CVPR 2024满分论文，英伟达开源BOP排行榜6D物体姿态第一名方法
关键字：姿态,模型,物体,数据,方法
文章来源：机器之心
内容字数：7521字

内容摘要：

机器之心专栏
机器之心编辑部物体姿态估计对于各种应用至关重要，例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据，并且不能应用于测试时未见过的新物体；而类别级方法消除了这些假设（实例训练和 CAD 模型），但获取类别级训练数据需要应用额外的姿态标准化和检查步骤。
为了解决这些问题，来自英伟达的研究团队提出了一个统一的框架，称为 FoundationPose，它在基于模型和无模型设置下，使用 RGBD 图像对新颖物体进行姿态估计和跟踪。如下图所示，FoundationPose优于现有专门针对这四项任务中每一项的 SOTA 方法。FoundationPose通过大规模合成训练实现了强大的泛化能力，辅以大型语言模型（LLM）、以及一种新颖的基于 Transformer 的架构和对比学习。该研究利用神经隐式表示填补了基于模型和无模型设置之间的差距，使得FoundationPose可以使用少量（约 16 张）参考图像进行有效的新颖视图合成，实现了比之前的渲染与比较方法 [32, 36, 67] 更快的渲染速度。研究论文被评为 CVPR 2024 满分论文，代码已开源。论

原文链接：CVPR 2024满分论文，英伟达开源BOP排行榜6D物体姿态第一名方法