AIGC动态欢迎阅读
原标题:首批中文版Llama3模型来了,解释成语、答弱智吧问题
关键字:模型,知乎,清华大学,中文,基准
文章来源:机器之心
内容字数:8638字
内容摘要:
机器之心报道
编辑:小舟、张倩中文问题,中文回答。最近,Meta 推出了 Llama 3,为开源大模型树立了新的标杆。
和以往的原始 Llama 模型一样,Llama 3 对中文的支持效果欠佳,经常会出现你用中文提问,它用英文或中文+英文回复的现象。因此,要想让国内用户用上该模型,开发者还需对其进行微调。
最近,在 Github 以及 HuggingFace 平台上,我们已经陆陆续续地看到了一些这样的项目,比如 llama3-Chinese-chat 和 Llama3-8B-Chinese-Chat。这篇文章将逐一介绍。
llama3-Chinese-chat
llama3-Chinese-chat 是一个 Github 项目,由名为「Ke Bai」的开发者开发。项目链接:https://github.com/CrazyBoyM/llama3-Chinese-chat
该模型效果如下:作者表示,该模型使用 170k + 高质量多轮中文对话数据连夜训练得到。他还整理了一份可用的训练数据列表,里面包含弱智吧、小红书、知乎等网络数据和开发者自己制作的数据。模型推理成本如下:
fp16 模式大
原文链接:首批中文版Llama3模型来了,解释成语、答弱智吧问题
联系作者
文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...