苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果
关键字：模型,数据,基准,团队,苹果
文章来源：量子位
内容字数：0字

内容摘要：

一水发自凹非寺量子位 | 公众号 QbitAI苹果最新杀入开源大模型战场，而且比其他公司更开放。
推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。
要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评：
许多声称开源的AI模型，实际上在数据和训练方法上并不透明，无法满足真正的科学研究需求。
而苹果这次竟然来真的！！
就连NLP科学家、AutoAWQ创建者也发出惊叹：
Apple发布了一个击败Mistral 7B的模型，但更棒的是他们完全开源了所有内容，包括预训练数据集！
也引来网友在线调侃：
至于这次开源的意义，有热心网友也帮忙总结了：
对于任何想要从头开始训练模型或微调现有模型的人来说，数据管理过程是必须研究的。
当然，除了OpenAI和苹果，上周Mistral AI联合英伟达也发布了一个12B参数小模型。
HuggingFace创始人表示，「小模型周」来了！
卷！继续卷！所以苹果这次发布的小模型究竟有多能打？
效果直逼Llama 3 8B有多能打先不说，先来看Hugging Face技术主管刚“拆箱”的模型基础配置。

原文链接：苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果