如何解决智能体探索和利用行为之间的平衡问题?

AIGC动态2个月前发布 AI前线
15 0 0

如何解决智能体探索和利用行为之间的平衡问题?

AIGC动态欢迎阅读

原标题:如何解决智能体探索和利用行为之间的平衡问题?
关键字:状态,结构,动作,作者,智能
文章来源:AI前线
内容字数:0字

内容摘要:


作者|曾祥华 北京航空航天大学 博士生
本文介绍来自北京航空航天大学彭浩老师团队发表在 NeurlPS 2024 上的一篇文章“Effective Exploration Based on the Structural Information Principles”。为了解决当前基于传统信息论的探索方法由于忽略状态 – 动作空间内在结构而导致效率低下的问题,作者提出了一种基于结构信息原理的探索框架,即 SI2E。SI2E 通过定义结构互信息,提出一种新的状态动作表征原则,捕捉状态 – 动作对之间的动态关系,构建最优编码树。通过分析状态 – 动作对之间的价值差异,定义策略条件结构熵,构造内在奖励机制,实现对于状态 – 动作空间更为有效的覆盖。在 MiniGrid、MetaWorld 和 DeepMind Control Suite 等测试环境中,SI2E 在最终性能与采样效率等方面的表现遥遥领先,最大提升幅度分别达到了 37.63% 和 60.25%。
论文名称:Effective Exploration Based on the Structural Information Princ


原文链接:如何解决智能体探索和利用行为之间的平衡问题?

联系作者

文章来源:AI前线
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...