iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微镜剖解LLM大脑

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微镜剖解LLM大脑
关键字：解读,模型,报告,编码器,特征
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：编辑部
【新智元导读】谷歌DeepMind的小模型来了，Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B！而同时发布的Gemma Scope，如显微镜一般打破LLM黑箱，让我们看清Gemma 2是如何决策的。谷歌DeepMind的小模型，又上新了！
就在刚刚，谷歌DeepMind发布Gemma 2 2B。它是从Gemma 2 27B中蒸馏而来。
虽然它的参数只有2.6B，但在LMSYS竞技场上的得分，已经超越了GPT-3.5和Mixtral 8x7B！
在MMLU和MBPP基准测试中，它分别取得了56.1和36.6的优异成绩；比起前代模型Gemma 1 2B，它的性能超过了10%。
小模型击败了大几个数量级的大模型，再一次印证了最近业界非常看好的小模型方向。
谷歌在今天，一共公布了Gemma 2家族的三个新成员：
Gemma 2 2B：轻量级2B模型，在性能和效率之间实现了最大的平衡
ShieldGemma：基于Gemma 2构建的安全内容分类器模型，用于过滤AI模型的输入和输出，确保用户安全
Gemma Scope：一种可

原文链接：iPhone可跑2B小钢炮！谷歌Gemma 2来袭，最强显微镜剖解LLM大脑