清华大学研究团队荣膺X-Embodiment最佳论文奖,CoRL 2024机器人顶会获奖名单震撼揭晓!

清华大学高阳团队荣获CoRL 2024X-Embodiment Workshop最佳论文奖

清华大学研究团队荣膺X-Embodiment最佳论文奖,CoRL 2024机器人顶会获奖名单震撼揭晓!

原标题:清华大学获X-Embodiment最佳论文奖,机器人顶会CoRL 2024获奖名单出炉
文章来源:AI科技评论
内容字数:6335字

清华大学高阳团队荣获CoRL 2024最佳论文奖

在最新一届机器人顶级会议CoRL 2024(Conference on Robot Learning)中,来自清华大学的高阳团队荣获X-Embodiment Workshop最佳论文奖。他们的论文《Data Scaling Laws in Imitation Learning for Robotic Manipulation》探讨了数据规模定律在机器人操作中的模仿学习应用,尤其是如何通过适当的数据规模实现零样本泛化。

研究背景与方法

研究团队收集了超过40,000次人类演示,并进行了15,000多次实际机器人操作。他们发现,策略的泛化能力主要依赖于环境和对象的多样性,而不是单纯的演示数量。在此基础上,团队设计了一种高效的数据收集方案,仅需四个采集者在一个下午就能获取足够的数据,使两个任务在新环境和新对象上的成功率达到约90%。

实验设计

研究团队选择使用手持夹持器(UMI)在不同环境中收集人类演示数据,并采用扩散策略(Diffusion Policy)对数据进行建模。实验任务包括Pour Water(倒水)和Mouse Arrangement(鼠标移动),并扩展到Fold Towels(叠毛巾)和Unplug Charger(拔掉充电器)。实验结果表明,策略的泛化能力与训练环境和对象的数量密切相关,符合幂律分布。

研究结果

实验显示,随着训练物体和环境数量的增加,策略在未见物体和环境上的表现显著提高。特别是当训练物体数量达到32时,策略在未见物体上的表现超过0.9。这表明同时扩展环境和物体数量的效果更佳,并且额外的演示对性能的提升效果逐渐饱和。

团队成员介绍

论文的主要作者包括高阳教授和他的学生林凡淇、胡英东、盛平岳、Chuan Wen及游嘉诚。林凡淇及胡英东分别为博士生,研究重点为具身智能,旨在实现机器人在人类水平操作能力上的突破。

最佳论文奖及其他获奖论文

在CoRL 2024中,除了清华团队的获奖论文外,Kuo-Hao Zeng等人的《PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators》和Franck Djeumou等人的《One Model to Drift Them All》也获得最佳论文奖。这些研究展示了在机器人学习和自动驾驶领域的最新成果和技术进步。


联系作者

文章来源:AI科技评论
作者微信:
作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...