任务成功率可达97%
原标题:一次示范让Agent适应各种新环境,浙大杭电智能体框架入选NeurIPS
文章来源:量子位
内容字数:5702字
研究背景
随着大语言模型(LLM Agents)在各个领域中的广泛应用,智能体在执行任务时的自主性和适应性受到关注。然而,现有的智能体往往过度依赖人类专家的知识,难以在新环境中学习和适应。
AutoManual框架的提出
为了解决这一问题,杭州电子科技大学和浙江大学的研究者提出了AutoManual框架。该框架通过模仿人类在新环境中“记笔记”的过程,使智能体能够通过一次人类示范适应新环境,成功率可达97%。
框架结构
AutoManual框架包含三个主要阶段:Building、Formulating和Testing。
- Building阶段:Planner Agent与Builder Agent合作,通过与环境互动构建规则。Builder Agent在此阶段使用规则系统更新环境规则。
- Formulating阶段:Formulator Agent将规则整理成Markdown格式的指导手册,增强规则的可读性和理解性。
- Testing阶段:使用生成的手册评估智能体的任务执行效果,确保其能有效指导较小模型。
实验结果
研究团队在ALFWorld和MiniWoB++等环境中进行实验,结果表明,只需一个人类示范,AutoManual就能显著提高智能体的成功率。在ALFWorld中,智能体成功率达97%,而在MiniWoB++中成功率达到98%。
总结与影响
AutoManual框架有效地减少了对人类专家知识的依赖,通过记录和更新环境理解,帮助智能体更好地适应新环境。这种方法不仅提升了智能体的自主性,也为其他智能体提供了规划指导,具有重要的应用前景。
联系作者
文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...