通用人形机器人控制器HugWBC。
原标题:从扭秧歌到单脚跳,HugWBC让人形机器人天赋觉醒了
文章来源:机器之心
内容字数:5081字
上海交大与上海AI Lab研发出通用人形机器人控制器HugWBC
本文介绍了上海交通大学和上海人工智能实验室联合研发的通用人形机器人控制器HugWBC,该控制器赋予人形机器人多种步态及精细化控制能力,使其能够完成跑跳、拳击、搬箱等复杂动作。
HugWBC的核心功能与创新
不同于以往仅跟踪速度指令或关键点的控制器,HugWBC 创新性地引入了扩展指令空间,包含任务指令(速度)和行为指令(姿态、脚步、步态)。这种设计允许对机器人进行细粒度控制,充分发挥其硬件潜能。HugWBC默认控制全身,同时支持上肢外部控制器介入,以实现遥操作和精细控制,并支持后续的移动操作任务。
技术方案与设计
HugWBC结合了控制理论和强化学习。其扩展指令空间包含:1)任务指令(速度);2)行为指令(步频、最大摆动高度、机器人高度、前倾角、腰部转动角、双脚相位变量、相位差、占空比)。通过组合这些指令,可以产生丰富多样的步态。为了引导机器人学习细粒度步态,研究者提出了接触-摆动奖励和足端摆动奖励,并引入镜像函数和损失函数来鼓励对称自然的。
鲁棒性课程训练与上身介入
HugWBC旨在成为基础人形控制器,因此需要支持上半身外部控制介入。研究者通过设计上肢噪声课程,使机器人学习应对上肢介入,提高鲁棒性。整个训练框架使用非对称强化学习算法在模拟环境中进行训练,最终实现真实场景部署。
实验结果与评估
实验结果表明,HugWBC在四种步态(行走、站立、双脚跳跃、单脚跳跃)下的指令跟踪误差较小,且在不同介入训练方法中表现最佳。在站立状态下,HugWBC的足端移动距离最小,表明其能够支持精细的操作任务。干扰测试也显示,HugWBC的鲁棒性显著优于基线方法。指令组合分析的热力图矩阵显示了不同指令间的相互影响,揭示了控制器在不同速度和指令组合下的性能。
总结
HugWBC控制器在人形机器人控制方面取得了显著进展,实现了多种步态的灵活切换和精细化控制,为人形机器人的应用提供了坚实的基础。其扩展指令空间、强化学习训练方法以及鲁棒性设计,为未来人形机器人研究提供了重要的参考价值。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台