最强开源大模型Llama 3来了！4000亿参数GPT-4，训练数据达Llama 2七倍

AIGC动态2年前 (2024)发布智东西

最强开源大模型Llama 3来了！4000亿参数狙击GPT-4，训练数据达Llama 2七倍

AIGC动态欢迎阅读

原标题：最强开源大模型Llama 3来了！4000亿参数 GPT-4，训练数据达Llama 2七倍
关键字：模型,数据,性能,参数,效率
文章来源：智东西
内容字数：8329字

内容摘要：

开源大模型超闭源？Meta重回开源大模型铁王座。
编译|长颈鹿
编辑|李水青
智东西4月19日消息，昨夜，Meta推出迄今为止能力最强的开源大模型Llama 3系列，发布8B和70B两个版本。
Llama 3在一众榜单中取得开源SOTA（当前最优效果）。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma 7B和Mistral 7B Instruct。
▲Llama 3与Gemma、Mistral、Gemini、Claude 3的模型性能对比表
Llama 3 70B也在MMLU、HumanEval、GSM-8K等基准上超越了闭源的谷歌Gemini Pro 1.5、Claude 3 Sonnet。
Llama 3系列最大模型规模将超过4000亿参数，英伟达科学家Jim Fan认为，这一版本未来的推出将意味开源社区的一个分水岭，开源模型将一举翻越GPT-4这一高峰。
▲Jim Fan对Llama 3表示赞叹
Llama 3模型基于超过15T个token的公开数据预训练，其中数据量是Llama 2的七倍，代码量也增至四倍。此外，Llama

原文链接：最强开源大模型Llama 3来了！4000亿参数GPT-4，训练数据达Llama 2七倍