实现了34440cm³最大操作空间范围的高效覆盖
原标题:机器人空间泛化也有Scaling Law!清华新国大新算法框架让机器人操作更加鲁棒
文章来源:量子位
内容字数:5919字
清华新加坡国立大学团队提出ManiBox:机器人空间泛化新算法框架
清华大学和新加坡国立大学的研究团队在机器人空间泛化领域取得重大突破,发现了空间智能的泛化性规律,并基于此规律提出了一种新颖的机器人操作算法框架——ManiBox。该框架能够显著提升机器人在真实世界中应对多样化物置和复杂场景布置的能力。
1. 空间泛化难题与ManiBox的突破
传统的机器人操作实验通常在实验室的“完美摆放位置”进行,难以适应真实世界中物体的多样化位置和复杂场景。ManiBox则致力于解决这一空间泛化难题。通过在模拟器中生成大量数据,并结合低维视觉特征(如Bounding Box),ManiBox实现了在34440cm³最大操作空间范围内的高效覆盖,抓取成功率高达90%-100%。
2. ManiBox的泛化能力
ManiBox展现出强大的泛化能力,能够应对各种物体(苹果、钢杯、玻璃烧杯等)、背景(不同颜色桌布、复杂桌面、动态光源等)和操作任务(抓取半空中物体、杂乱桌面上的物体、倒水等)。即使在视觉遮挡率高达40%或Bounding Box识别噪音高达5%的情况下,ManiBox依然保持高鲁棒性和操作能力,甚至在黑暗环境下也能精准完成抓取任务。
3. ManiBox的核心思想
ManiBox的核心思想在于两点:一是利用规模化、自动化的action数据生成方式训练策略模块,缓解action模态数据稀缺的问题;二是充分利用互联网级别的数据量,在视觉、文本模态上构建通用模型,提供完成任务的重要指示信息。 这基于团队在空间泛化性上取得的理论突破:发现任务成功率与数据量呈现米氏-曼特恩动力学曲线,以及空间泛化所需数据量与空间体积呈现幂律关系。
4. ManiBox的技术细节
ManiBox通过policy generalization方法解决空间泛化问题,并结合YOLO-World等模型提取低维空间信息,简化状态建模。通过训练基于状态的策略,实现了从仿真到真实世界的高效迁移。随机掩码技术和历史轨迹信息进一步提升了策略的鲁棒性。在训练方面,采用高效数据生成与学生策略学习相结合的模式,实现了2小时强化学习策略训练和2分钟学生策略学习。
5. ManiBox的意义与应用前景
ManiBox不仅提供了一种高效可靠的机器人操作解决方案,更定义了一种“数据驱动的空间智能”方法,显著提升了机器人操作任务的鲁棒性和灵活性。其在工业和家庭应用中具有广泛的潜力,为机器人在复杂真实场景中的应用奠定了理论和技术基础。
6. 作者简介
该工作的共同一作是清华大学计算机系博士生谭恒楷和新加坡国立大学本科生徐学舟,两人均在具身智能和强化学习领域有深入研究,并发表过多篇论文。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破