全是细节!大模型SFT的100个关键点

全是细节!大模型SFT的100个关键点

AIGC动态欢迎阅读

原标题:全是细节!大模型SFT的100个关键点
关键字:模型,数据,报告,能力,语料
文章来源:智猩猩GenAI
内容字数:0字

内容摘要:


GTIC 2024中国AI PC创新峰会将于10月11日,在2024上海国际消费电子展TechG同期举办。联想集团首席研究员颜毅强、荣耀终端有限公司PC产品研发系统部部长席迎军等7位嘉宾,将分别围绕面向大模型的个人计算体系和交互、AI 重构PC、RISC-V AI芯片、AIGC在端侧产品的发展、操作系统与AI技术结合探索、联合模型和硬件的优化适配平台MLGuider、智能体个人助理等议题进行演讲,欢迎报名~导读原文来自知乎,作者为ybq,标题为《LLM训练-sft》。作者详细介绍了大模型的 sft 相关内容,包括背景知识、与 pretrain 的区别、幻觉问题、数据篇(数据多样性、生产、去重等)、训练篇(框架、炼丹技巧、拟合问题等)、评估篇等。原文地址:https://zhuanlan.zhihu.com/p/809229182
本文只做学术/技术分享,如有侵权,联系删文。这篇文章介绍一下大模型的 sft 如何去做。相比较于上一篇文章介绍的 pretrain,sft 实在没有太多的技术细节和琐碎工作需要科普。因此,我会默认读者们都知道 sft 是做什么的以及如何去做一些简单的 sft


原文链接:全是细节!大模型SFT的100个关键点

联系作者

文章来源:智猩猩GenAI
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...