单卡3小时训练专属大模型Agent

AIGC动态3年前 (2024)发布算法邦

单卡3小时训练专属大模型Agent

AIGC动态欢迎阅读

原标题：单卡3小时训练专属大模型Agent
关键字：模型,知乎,工具,数据,网页
文章来源：算法邦
内容字数：12837字

内容摘要：

今天给大家带来一篇Agent微调实战文章-《单卡 3 小时训练专属大模型 Agent：基于 LLaMA Factory 实战》，来自知乎@hiyouga。知乎：https://zhuanlan.zhihu.com/p/678989191Github：https://github.com/hiyouga/LLaMA-Factory
Agent（智能体）是当今 LLM（大模型）应用的热门话题 [1]，通过任务分解（task planning）、工具调用（tool using）和多智能体协作（multi-agent cooperation）等途径，LLM Agent 有望突破传统语言模型能力界限，体现出更强的智能水平。在这之中，调用外部工具解决问题成为 LLM Agent 必不可缺的一项技能，模型根据用户问题从工具列表中选择恰当的工具，同时生成工具调用参数，综合工具返回结果和上下文信息总结出答案。通过调用外部工具，LLM 能够获取到实时、准确的知识，大大降低了生成中的幻觉（hallucination）现象，使 LLM 的任务解决能力得到长足的提升。工具调用能力的获得离不开模型微调，尽管使用

原文链接：单卡3小时训练专属大模型Agent