最强开源大模型 Llama 3震撼发布！开源模型将追上GPT-4，4000亿参数模型也在路上

AIGC动态2年前 (2024)发布人工智能学家

AIGC动态欢迎阅读

原标题：最强开源大模型 Llama 3震撼发布！开源模型将追上GPT-4，4000亿参数模型也在路上
关键字：模型,数据,求生欲,性能,版本
文章来源：人工智能学家
内容字数：3419字

内容摘要：

夕小瑶科技说原创作者 | Zicy就在昨晚，Meta官宣了开源的Llama 3 8B和70B版本。
8B模型在多项指标中超越了Gemma 7B和Mistral 7B Instruct，而70B模型则超越了闭源的Claude 3 Sonnet，和Gemini Pro 1.5。
此外Meta还有一个still training的400B+参数版本，它和GPT-4以及Claude 3的超大杯版本Opus性能差不多，最重要的是，它即将开源！
怪兽级性能由于预训练和训练方法的改进，Llama 3 8B和70B是当今同参数规模的SOTA模型。它大大降低了错误拒绝率，改善了一致性，并增加了模型响应的多样性。此外，在推理、代码生成和指令跟踪等功能的极大改进，使Llama 3更加易于操控。
在Llama 3的开发中，为了寻求对实际场景的优化。Meta开发了一套新的高质量人类评估集，包含1800个prompts，覆盖12个关键用例，如寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作等。为防止模型过度拟合，连模型开发团队也无法访问此评估集。下图展示了与Claude Sonnet、Mistral Med

原文链接：最强开源大模型 Llama 3震撼发布！开源模型将追上GPT-4，4000亿参数模型也在路上