今日arXiv最热NLP大模型论文:面向不确定性感知的Language Agent

今日arXiv最热NLP大模型论文:面向不确定性感知的Language Agent

AIGC动态欢迎阅读

原标题:今日arXiv最热NLP大模型论文:面向不确定性感知的Language Agent
关键字:不确定性,工具,方法,任务,数据
文章来源:夕小瑶科技说
内容字数:7776字

内容摘要:


夕小瑶科技说 原创作者 | UALA
引言:面向不确定性的感知的Language AgentLanguage Agent利用大型语言模型(如OpenAI发布的GPT系列、Meta的LLaMA2等)来与外部世界互动,例如通过工具和API收集观察结果,并处理这些信息以解决任务。这些Language Agent在改进先前具有挑战性的推理任务方面取得了显著进展,它们能够自主地从世界中获取新知识,并通过记忆或自我完善机制迭代地改进其推理路径。然而,当前的Language Agent设计主要将LLM视为观察和知识收集的规划者、协调者或聚合器,而忽视了在与外部世界交互时处理不确定性的能力。实际上,大量的研究工作已经集中在探索预训练语言模型中编码的知识类型,以及如何通过生成性任务(如机器翻译、摘要和数据到文本生成)来估计这些模型的不确定性。
我们的工作旨在通过集成不确定性估计来改进Language Agent的设计,以便更有效地管理与外部工具的互动。具体来说,我们的框架通过在决策过程中量化不确定性,来判断何时依赖LLM内部的隐含知识,何时寻求外部资源的帮助。这种方法旨在提高Language Agent


原文链接:今日arXiv最热NLP大模型论文:面向不确定性感知的Language Agent

联系作者

文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:专业、有趣、深度价值导向的科技媒体。聚集30万AI工程师、研究员,覆盖500多家海内外机构投资人,互联网大厂中高管和AI公司创始人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备敏锐的行业嗅觉和洞察深度。商务合作:zym5189

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...