单卡3小时训练专属大模型Agent

AIGC动态11个月前发布 算法邦
41 0 0

单卡3小时训练专属大模型Agent

AIGC动态欢迎阅读

原标题:单卡3小时训练专属大模型Agent
关键字:模型,知乎,工具,数据,网页
文章来源:算法邦
内容字数:12837字

内容摘要:


今天给大家带来一篇Agent微调实战文章-《单卡 3 小时训练专属大模型 Agent:基于 LLaMA Factory 实战》,来自知乎@hiyouga。知乎:https://zhuanlan.zhihu.com/p/678989191Github:https://github.com/hiyouga/LLaMA-Factory
Agent(智能体)是当今 LLM(大模型)应用的热门话题 [1],通过任务分解(task planning)、工具调用(tool using)和多智能体协作(multi-agent cooperation)等途径,LLM Agent 有望突破传统语言模型能力界限,体现出更强的智能水平。在这之中,调用外部工具解决问题成为 LLM Agent 必不可缺的一项技能,模型根据用户问题从工具列表中选择恰当的工具,同时生成工具调用参数,综合工具返回结果和上下文信息总结出答案。通过调用外部工具,LLM 能够获取到实时、准确的知识,大大降低了生成中的幻觉(hallucination)现象,使 LLM 的任务解决能力得到长足的提升。工具调用能力的获得离不开模型微调,尽管使用


原文链接:单卡3小时训练专属大模型Agent

联系作者

文章来源:算法邦
作者微信:allplusai
作者简介:「算法邦」,隶属于智猩猩,关注大模型、生成式AI、计算机视觉三大领域的研究与开发,提供技术文章、讲座、在线研讨会。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...