首批中文版Llama3模型来了，解释成语、答弱智吧问题

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：首批中文版Llama3模型来了，解释成语、答弱智吧问题
关键字：模型,知乎,清华大学,中文,基准
文章来源：机器之心
内容字数：8638字

内容摘要：

机器之心报道
编辑：小舟、张倩中文问题，中文回答。最近，Meta 推出了 Llama 3，为开源大模型树立了新的标杆。
和以往的原始 Llama 模型一样，Llama 3 对中文的支持效果欠佳，经常会出现你用中文提问，它用英文或中文+英文回复的现象。因此，要想让国内用户用上该模型，开发者还需对其进行微调。
最近，在 Github 以及 HuggingFace 平台上，我们已经陆陆续续地看到了一些这样的项目，比如 llama3-Chinese-chat 和 Llama3-8B-Chinese-Chat。这篇文章将逐一介绍。
llama3-Chinese-chat
llama3-Chinese-chat 是一个 Github 项目，由名为「Ke Bai」的开发者开发。项目链接：https://github.com/CrazyBoyM/llama3-Chinese-chat
该模型效果如下：作者表示，该模型使用 170k + 高质量多轮中文对话数据连夜训练得到。他还整理了一份可用的训练数据列表，里面包含弱智吧、小红书、知乎等网络数据和开发者自己制作的数据。模型推理成本如下：
fp16 模式大

原文链接：首批中文版Llama3模型来了，解释成语、答弱智吧问题