AIGC动态欢迎阅读
原标题:iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
关键字:解读,模型,报告,编码器,特征
文章来源:新智元
内容字数:0字
内容摘要:
新智元报道编辑:编辑部
【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。谷歌DeepMind的小模型,又上新了!
就在刚刚,谷歌DeepMind发布Gemma 2 2B。它是从Gemma 2 27B中蒸馏而来。
虽然它的参数只有2.6B,但在LMSYS竞技场上的得分,已经超越了GPT-3.5和Mixtral 8x7B!
在MMLU和MBPP基准测试中,它分别取得了56.1和36.6的优异成绩;比起前代模型Gemma 1 2B,它的性能超过了10%。
小模型击败了大几个数量级的大模型,再一次印证了最近业界非常看好的小模型方向。
谷歌在今天,一共公布了Gemma 2家族的三个新成员:
Gemma 2 2B:轻量级2B模型,在性能和效率之间实现了最大的平衡
ShieldGemma:基于Gemma 2构建的安全内容分类器模型,用于过滤AI模型的输入和输出,确保用户安全
Gemma Scope:一种可
原文链接:iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
联系作者
文章来源:新智元
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...