浙大发布Agent学习框架，13B 模型达到 ChatGPT 水平！

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：浙大发布Agent学习框架，13B 模型达到 ChatGPT 水平！
关键字：模型,数据,工具,任务,智能
文章来源：夕小瑶科技说
内容字数：6431字

内容摘要：

‍夕小瑶科技说原创作者 | 小戏、Python2023 年下半年，AI Agent 正式开启「大模型下半场」。
自“人工智能”这门学科创立之初，一种可以“观察世界”-“思考推理”-“做出行动”-“反思学习”的人造代理就是构建通用人工智能的终极目标之一。而基于大模型的 AI Agent 借助大模型强大的推理判断能力，为 AI Agent 的发展开启了一扇新的大门。
以 LangChain 的底层思想 ReACT 为例，大模型 Agent 在与外部环境互动时，经历“思考”-“行动”-“观察”三个步骤，通过将“行动”与“推理”结合，赋予大模型解决实际问题的能力。
但是，半年过去，直接使用类似 GPT-4 等闭源模型通过 Prompt 的方式构建 Agent 的思路尽管成绩斐然，但是不可避免的我们对这类 Agent 的掌控性往往并不高，一些结果不具有可解释性甚至不可复现。因此，一些工作开始在开源模型的基础上使用轨迹数据对模型进行微调，以使得 Agent 具备更强的解决问题的能力。
然而，微调这种思路面对着两大挑战，首先，微调需要数据，数据不可能完全由人工生成，那么不可避免的 Agent 进行

原文链接：浙大发布Agent学习框架，13B 模型达到 ChatGPT 水平！