TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析

TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析

AIGC动态欢迎阅读

原标题:TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析
关键字:环境,算法,智能,策略,基准
文章来源:机器之心
内容字数:0字

内容摘要:


AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本篇综述工作已被《IEEE 模式分析与机器智能汇刊》(IEEE TPAMI)接收,论文第一作者顾尚定博士来自慕尼黑工业大学、加州大学伯克利分校,论文通讯作者陈广教授来自同济大学计算机科学与技术学院。共同作者包括北京大学杨龙博士、伦敦国王大学杜雅丽教授、伦敦大学学院汪军教授、慕尼黑工业大学 Florian Walter 和 Alois Knoll 教授。
随着人工智能(AI)的飞速发展,强化学习(Reinforcement Learning,RL)在诸多复杂决策任务中取得了显著的成功。我们在自动驾驶、机器人控制和推荐系统等实际应用中,越来越依赖于这些智能系统。然而,现实世界中的强化学习在应用过程中也面临着巨大的挑战,尤其是如何保证系统的安全性。为了解决这一问题,


原文链接:TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析

联系作者

文章来源:机器之心
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...