智能体自适应新环境的:浙大杭电框架荣登NeurIPS舞台

AIGC动态2个月前发布 量子位
3 0 0

任务成功率可达97%

智能体自适应新环境的革命:浙大杭电框架荣登NeurIPS舞台

原标题:一次示范让Agent适应各种新环境,浙大杭电智能体框架入选NeurIPS
文章来源:量子位
内容字数:5702字

研究背景

随着大语言模型(LLM Agents)在各个领域中的广泛应用,智能体在执行任务时的自主性和适应性受到关注。然而,现有的智能体往往过度依赖人类专家的知识,难以在新环境中学习和适应。

AutoManual框架的提出

为了解决这一问题,杭州电子科技大学和浙江大学的研究者提出了AutoManual框架。该框架通过模仿人类在新环境中“记笔记”的过程,使智能体能够通过一次人类示范适应新环境,成功率可达97%。

框架结构

AutoManual框架包含三个主要阶段:Building、Formulating和Testing。

  1. Building阶段:Planner Agent与Builder Agent合作,通过与环境互动构建规则。Builder Agent在此阶段使用规则系统更新环境规则。
  2. Formulating阶段:Formulator Agent将规则整理成Markdown格式的指导手册,增强规则的可读性和理解性。
  3. Testing阶段:使用生成的手册评估智能体的任务执行效果,确保其能有效指导较小模型。

实验结果

研究团队在ALFWorld和MiniWoB++等环境中进行实验,结果表明,只需一个人类示范,AutoManual就能显著提高智能体的成功率。在ALFWorld中,智能体成功率达97%,而在MiniWoB++中成功率达到98%。

总结与影响

AutoManual框架有效地减少了对人类专家知识的依赖,通过记录和更新环境理解,帮助智能体更好地适应新环境。这种方法不仅提升了智能体的自主性,也为其他智能体提供了规划指导,具有重要的应用前景。


联系作者

文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...
第五届
全国人工智能大赛

总奖金超 233 万!

报名即将截止