谷歌狂卷小模型，20亿参数Gemma 2赶超GPT-3.5，实测iPhone上跑得飞快

AIGC动态2年前 (2024)发布智东西

AIGC动态欢迎阅读

原标题：谷歌狂卷小模型，20亿参数Gemma 2赶超GPT-3.5，实测iPhone上跑得飞快
关键字：报告,模型,解读,内容,参数
文章来源：智东西
内容字数：0字

内容摘要：

每秒40 Token，谷歌开源20亿参数“小钢炮”。
编译 |香草
编辑|李水青
谷歌DeepMind的开源小模型家族，又迎来新成员！
智东西8月1日消息，今日凌晨，谷歌DeepMind开源了轻量级模型Gemma 2 2B，其在大模型竞技场上的分数超越了GPT-3.5、Llama 2 70B等更大参数的模型。
▲Gemma 2 2B
只有20亿参数使得Gemma 2 2B可以轻松在手机、PC等终端设备上快速运行。开发者实测在Google AI Studio上，其推理速度达到30~40 tokens/s。
▲开发者测试Gemma 2 2B
与Gemma 2 2B一起推出的，还有用于增强模型可解释性的工具Gemma Scope，以及用于过滤有害内容的安全分类模型ShieldGemma。
Gemma Scope基于稀疏自动编码器（SAE）放大模型中的特定点，并采用JumpReLU架构对其进行优化，从而帮助解析模型中处理的密集复杂信息，像一个显微镜一样让研究人员能“看到”模型内部。
ShieldGemma则针对仇恨、骚扰、内容、危险内容四个危害领域构建，在响应测试中超过GPT-4等基准

原文链接：谷歌狂卷小模型，20亿参数Gemma 2赶超GPT-3.5，实测iPhone上跑得飞快