仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：仅用250美元，Hugging Face技术主管手把手教你微调Llama 3
关键字：模型,数据,内存,作者,样本
文章来源：机器之心
内容字数：17202字

内容摘要：

机器之心报道
编辑：赵阳大语言模型的微调一直是说起来容易做起来难的事儿。近日 Hugging Face 技术主管 Philipp Schmid 发表了一篇博客，详细讲解了如何利用 Hugging Face 上的库和 fsdp 以及 Q-Lora 对大模型进行微调。我们知道，Meta 推出的 Llama 3、Mistral AI 推出的 Mistral 和 Mixtral 模型以及 AI21 实验室推出的 Jamba 等开源大语言模型已经成为 OpenAI 的竞争对手。
不过，大多数情况下，使用者需要根据自己的数据对这些开源模型进行微调，才能充分释放模型的潜力。
虽然在单个 GPU 上使用 Q-Lora 对较小的大语言模型（如 Mistral）进行微调不是难事，但对像 Llama 3 70b 或 Mixtral 这样的大模型的高效微调直到现在仍是一个难题。
因此，Hugging Face 技术主管 Philipp Schmid 介绍了如何使用 PyTorch FSDP 和 Q-Lora，并在 Hugging Face 的 TRL、Transformers、peft 和 datasets

原文链接：仅用250美元，Hugging Face技术主管手把手教你微调Llama 3