阿里Qwen2大模型微调入门实战（附完整代码）

AIGC动态2年前 (2024)发布算法邦

AIGC动态欢迎阅读

原标题：阿里Qwen2大模型微调入门实战（附完整代码）
关键字：模型,侵权,知乎,数据,指令
文章来源：算法邦
内容字数：0字

内容摘要：

直播预告 | 6月20日晚7点，「智猩猩机器人新青年讲座」第8讲正式开讲，清华大学THUNLP lab在读博士胡锦毅将直播讲解《面向多模态大模型的具身智能平台LEGENT》，欢迎扫名~导读本文来自知乎，作者为西安电子科技大学电子工程学院在读博士林泽毅。出于学术/技术分享进行转载，如有侵权，联系删文。
本文中，作者使用 Qwen2-1.5b-Instruct模型在复旦中文新闻数据集上做指令微调训练，同时使用SwanLab监控训练过程、评估模型效果。
原文链接：https://zhuanlan.zhihu.com/p/702491999Qwen2(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruct/summary)是通义千问团队最近开源的大语言模型，由阿里云通义实验室研发。
以Qwen2作为基座大模型，通过指令微调的方式做高精度文本分类，是学习LLM微调的入门任务。
在本文中，我们会使用 Qwen2-1.5b-Instruct(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruc

原文链接：阿里Qwen2大模型微调入门实战（附完整代码）