强化学习训练一两个小时，100%自主完成任务：机器人ChatGPT时刻真来了？

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：强化学习训练一两个小时，100%自主完成任务：机器人 ChatGPT时刻真来了？
关键字：机器人,策略,任务,人类,缓存
文章来源：机器之心
内容字数：0字

内容摘要：

机器之心报道
编辑：Panda、佳琪把平均成功率从 50% 拉到了 100%。最近，AI 的进步有目共睹，现在这些进步已经开始传递到机器人领域。强大的 AI 技术也能帮助机器人更好地理解其所处的物理世界并采取更合理的行动。
近日，UC 伯克利 BAIR 实验室的 Sergey Levine 研究团队提出了一个强化学习框架 HIL-SERL，可直接在现实世界中训练通用的基于视觉的机器人操作策略。HIL-SERL 的表现堪称前所未有的卓越，仅需 1-2.5 小时的训练就能在所有任务上实现 100% 的成功率。要知道，基线方法的平均成功率还不到50%。就算有外部干扰，机器人也能取得很好的表现。论文一作 Jianlan Luo 的推文，他目前正在 UC 伯克利 BAIR 实验室从事博士后研究团队导师 Sergey Levine 也发了推文宣传这项研究，他是一位非常著名的 AI 和机器人研究科学家，曾是 2021 年发表相关论文最多的研究者，参阅机器之心报道《2021 年 ML 和 NLP 学术统计：谷歌断层第一，强化学牛 Sergey Levine 位居榜首》
空口无凭，眼见为实，那就先让

原文链接：强化学习训练一两个小时，100%自主完成任务：机器人ChatGPT时刻真来了？