原标题:宇树G1人形机器人习得少林功夫?揭秘BeamDojo强化学习框架
文章来源:小夏聊AIGC
内容字数:2157字
人形机器人G1:少林功夫的现代诠释
近日,一款名为宇树G1的人形机器人凭借其令人惊叹的平衡能力引发广泛关注。它在梅花桩和平衡木上行走自如,动作流畅稳定,仿佛一位习得少林功夫的武林高手,在网络上掀起热议。
突破技术瓶颈:BeamDojo强化学习框架
G1的出色表现并非偶然,其背后是上海AI实验室、上海交通大学、浙江大学、香港大学和香港中文大合研发的BeamDojo强化学习框架的功劳。该框架是首个基于学习的方法,能够让人形机器人在落脚点稀疏的复杂地形上实现精细的落脚点控制,攻克了长期困扰人形机器人控制的技术难题。
传统方法难以直接应用于人形机器人,主要是因为四足机器人成功的经验难以直接移植到人形机器人上。四足机器人通常采用点状脚,而人形机器人的脚部是多边形,这使得为点状脚设计的落脚点奖励机制不再适用。此外,基于学习的人形机器人研究在复杂地形和精细落脚点上的灵活方面也存在问题,奖励信号稀疏导致学习效率低下。
G1的精彩演示:挑战极限,从容应对
在演示视频中,G1轻松穿越了多个宽度仅约20厘米、间距不一的踏脚石,甚至能够倒着走。面对宽度同样为20厘米的平衡木挑战,它也表现得游刃有余。更令人印象深刻的是,即使背负6千克重物或受到外部干扰,G1仍然能够保持平衡,稳定地完成任务。
网友纷纷评论,G1的表演宛如中国功夫片的场景再现,展现了科技与传统文化的奇妙融合。
BeamDojo框架的技术创新:高效学习,零样本泛化
BeamDojo框架的成功,离不开以下几个关键的技术创新:
- 两阶段强化学习训练策略:先在平地进行预学习,再切换到实际任务地形进行策略优化,显著提高了学习效率。
- 基于采样的落脚点奖励机制和“双评价器”架构:专门为多边形脚掌设计,有效平衡了密集移动奖励和稀疏落脚点奖励之间的学习过程。
- 基于激光雷达的高程地图系统:使机器人能够实时感知地形细节,为精准落脚提供数据支持。
- 零样本泛化能力:G1在训练过程中从未接触过稀疏地形与平衡木,却能够对各类稀疏落脚点地形做到零样本泛化。
实验结果表明,BeamDojo在模拟环境和现实世界中都实现了高效学习,让人形机器人在稀疏落脚点上精准落脚并灵活移动,即使受到较大的外部干扰,也能保持较高的成功率。这项技术未来还可应用于沟壑等更具挑战性的复杂地形。
结语:未来展望
G1的成功展示了人形机器人技术取得的重大突破,也预示着未来人形机器人将在更多领域发挥作用。BeamDojo框架的研发,为人形机器人在复杂环境下的控制提供了新的思路和方法,为人工智能和机器人技术的进一步发展奠定了坚实的基础。
联系作者
文章来源:小夏聊AIGC
作者微信:
作者简介:专注于人工智能生成内容的前沿信息与技术分享。我们提供AI生成艺术、文本、音乐、视频等领域的最新动态与应用案例。每日新闻速递、技术解读、行业分析、专家观点和创意展示。期待与您一起探索AI的无限潜力。欢迎关注并分享您的AI作品或宝贵意见。