苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果

AIGC动态2个月前发布 量子位
3 0 0

苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果

AIGC动态欢迎阅读

原标题:苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果
关键字:模型,数据,基准,团队,苹果
文章来源:量子位
内容字数:0字

内容摘要:


一水 发自 凹非寺量子位 | 公众号 QbitAI苹果最新杀入开源大模型战场,而且比其他公司更开放。
推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。
要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:
许多声称开源的AI模型,实际上在数据和训练方法上并不透明,无法满足真正的科学研究需求。
而苹果这次竟然来真的!!
就连NLP科学家、AutoAWQ创建者也发出惊叹:
Apple发布了一个击败Mistral 7B的模型,但更棒的是他们完全开源了所有内容,包括预训练数据集!
也引来网友在线调侃:
至于这次开源的意义,有热心网友也帮忙总结了:
对于任何想要从头开始训练模型或微调现有模型的人来说,数据管理过程是必须研究的。
当然,除了OpenAI和苹果,上周Mistral AI联合英伟达也发布了一个12B参数小模型。
HuggingFace创始人表示,「小模型周」来了!
卷!继续卷!所以苹果这次发布的小模型究竟有多能打?
效果直逼Llama 3 8B有多能打先不说,先来看Hugging Face技术主管刚“拆箱”的模型基础配置。


原文链接:苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...