浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!

浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!

AIGC动态欢迎阅读

原标题:浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!
关键字:模型,数据,工具,任务,智能
文章来源:夕小瑶科技说
内容字数:6431字

内容摘要:


‍夕小瑶科技说 原创作者 | 小戏、Python2023 年下半年,AI Agent 正式开启「大模型下半场」。
自“人工智能”这门学科创立之初,一种可以“观察世界”-“思考推理”-“做出行动”-“反思学习”的人造代理就是构建通用人工智能的终极目标之一。而基于大模型的 AI Agent 借助大模型强大的推理判断能力,为 AI Agent 的发展开启了一扇新的大门。
以 LangChain 的底层思想 ReACT 为例,大模型 Agent 在与外部环境互动时,经历“思考”-“行动”-“观察”三个步骤,通过将“行动”与“推理”结合,赋予大模型解决实际问题的能力。
但是,半年过去,直接使用类似 GPT-4 等闭源模型通过 Prompt 的方式构建 Agent 的思路尽管成绩斐然,但是不可避免的我们对这类 Agent 的掌控性往往并不高,一些结果不具有可解释性甚至不可复现。因此,一些工作开始在开源模型的基础上使用轨迹数据对模型进行微调,以使得 Agent 具备更强的解决问题的能力。
然而,微调这种思路面对着两大挑战,首先,微调需要数据,数据不可能完全由人工生成,那么不可避免的 Agent 进行


原文链接:浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!

联系作者

文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:更快的AI前沿,更深的行业洞见。聚集25万AI应用开发者、算法工程师和研究人员。一线作者均来自清北、国外顶级AI实验室和互联网大厂,兼备媒体sense与技术深度。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...