谷歌狂卷小模型,20亿参数Gemma 2赶超GPT-3.5,实测iPhone上跑得飞快

AIGC动态5个月前发布 智东西
10 0 0

谷歌狂卷小模型,20亿参数Gemma 2赶超GPT-3.5,实测iPhone上跑得飞快

AIGC动态欢迎阅读

原标题:谷歌狂卷小模型,20亿参数Gemma 2赶超GPT-3.5,实测iPhone上跑得飞快
关键字:报告,模型,解读,内容,参数
文章来源:智东西
内容字数:0字

内容摘要:


每秒40 Token,谷歌开源20亿参数“小钢炮”。
编译 |香草
编辑|李水青
谷歌DeepMind的开源小模型家族,又迎来新成员!
智东西8月1日消息,今日凌晨,谷歌DeepMind开源了轻量级模型Gemma 2 2B,其在大模型竞技场上的分数超越了GPT-3.5、Llama 2 70B等更大参数的模型。
▲Gemma 2 2B
只有20亿参数使得Gemma 2 2B可以轻松在手机、PC等终端设备上快速运行。开发者实测在Google AI Studio上,其推理速度达到30~40 tokens/s。
▲开发者测试Gemma 2 2B
与Gemma 2 2B一起推出的,还有用于增强模型可解释性的工具Gemma Scope,以及用于过滤有害内容的安全分类模型ShieldGemma。
Gemma Scope基于稀疏自动编码器(SAE)放大模型中的特定点,并采用JumpReLU架构对其进行优化,从而帮助解析模型中处理的密集复杂信息,像一个显微镜一样让研究人员能“看到”模型内部。
ShieldGemma则针对仇恨、骚扰、内容、危险内容四个危害领域构建,在响应测试中超过GPT-4等基准


原文链接:谷歌狂卷小模型,20亿参数Gemma 2赶超GPT-3.5,实测iPhone上跑得飞快

联系作者

文章来源:智东西
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...