首批中文版Llama3模型来了,解释成语、答弱智吧问题

首批中文版Llama3模型来了,解释成语、答弱智吧问题

AIGC动态欢迎阅读

原标题:首批中文版Llama3模型来了,解释成语、答弱智吧问题
关键字:模型,知乎,清华大学,中文,基准
文章来源:机器之心
内容字数:8638字

内容摘要:


机器之心报道
编辑:小舟、张倩中文问题,中文回答。最近,Meta 推出了 Llama 3,为开源大模型树立了新的标杆。
和以往的原始 Llama 模型一样,Llama 3 对中文的支持效果欠佳,经常会出现你用中文提问,它用英文或中文+英文回复的现象。因此,要想让国内用户用上该模型,开发者还需对其进行微调。
最近,在 Github 以及 HuggingFace 平台上,我们已经陆陆续续地看到了一些这样的项目,比如 llama3-Chinese-chat 和 Llama3-8B-Chinese-Chat。这篇文章将逐一介绍。
llama3-Chinese-chat
llama3-Chinese-chat 是一个 Github 项目,由名为「Ke Bai」的开发者开发。项目链接:https://github.com/CrazyBoyM/llama3-Chinese-chat
该模型效果如下:作者表示,该模型使用 170k + 高质量多轮中文对话数据连夜训练得到。他还整理了一份可用的训练数据列表,里面包含弱智吧、小红书、知乎等网络数据和开发者自己制作的数据。模型推理成本如下:
fp16 模式大


原文链接:首批中文版Llama3模型来了,解释成语、答弱智吧问题

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...