阿里Qwen2大模型微调入门实战(附完整代码)

AIGC动态3个月前发布 算法邦
29 0 0

阿里Qwen2大模型微调入门实战(附完整代码)

AIGC动态欢迎阅读

原标题:阿里Qwen2大模型微调入门实战(附完整代码)
关键字:模型,侵权,知乎,数据,指令
文章来源:算法邦
内容字数:0字

内容摘要:


直播预告 | 6月20日晚7点,「智猩猩机器人新青年讲座」第8讲正式开讲,清华大学THUNLP lab在读博士胡锦毅将直播讲解《面向多模态大模型的具身智能平台LEGENT》,欢迎扫码报名~导读本文来自知乎,作者为西安电子科技大学电子工程学院在读博士林泽毅。出于学术/技术分享进行转载,如有侵权,联系删文。
本文中,作者使用 Qwen2-1.5b-Instruct模型在复旦中文新闻数据集上做指令微调训练,同时使用SwanLab监控训练过程、评估模型效果。
原文链接:https://zhuanlan.zhihu.com/p/702491999Qwen2(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruct/summary)是通义千问团队最近开源的大语言模型,由阿里云通义实验室研发。
以Qwen2作为基座大模型,通过指令微调的方式做高精度文本分类,是学习LLM微调的入门任务。
在本文中,我们会使用 Qwen2-1.5b-Instruct(https://modelscope.cn/models/qwen/Qwen2-1.5B-Instruc


原文链接:阿里Qwen2大模型微调入门实战(附完整代码)

联系作者

文章来源:算法邦
作者微信:allplusai
作者简介:智猩猩矩阵账号之一,聚焦生成式AI,重点关注模型与应用。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...