8张3090，1天压缩万亿参数大模型！3.2TB骤降至160GB，压缩率高达20倍

AIGC动态2年前 (2023)发布新智元

AIGC动态欢迎阅读

原标题：8张3090，1天压缩万亿参数大模型！3.2TB骤降至160GB，压缩率高达20倍

文章来源：新智元

内容字数：5479字

内容摘要：新智元报道编辑：好困【新智元导读】最近，来自ISTA的研究人员提出了一种全新的模型量化方法QMoE，可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下（每个参数0.8位），且精度损失很小。随着GPT-4的架构被知名业内大佬「开源」，混合专家架构（MoE）再次成为了研究的重点。GPT-4拥有16个专家模型，总共包含1.8万亿个参数。每生成一个token需要使用大约2800…

原文链接：点此阅读原文：8张3090，1天压缩万亿参数大模型！3.2TB骤降至160GB，压缩率高达20倍