70倍极致压缩！大模型的检查点再多也不怕

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：70倍极致压缩！大模型的检查点再多也不怕
关键字：华为,检查点,权重,动量,模型
文章来源：机器之心
内容字数：0字

内容摘要：

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com该论文的作者均来自于华为诺亚实验室，第一作者为李文硕，通讯作者为王云鹤和陈醒濠。相关团队团队近年来在ICML、CVPR、NeurIPS、ICCV、ECCV等顶会上有多项代表性工作发表，在高效大语言模型、视觉模型等领域都有丰富的成果产出，和知名高校和科研机构合作广泛。
大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」，吸引了大批学者和企业投入资源去研究与训练。随着规模越做越大，系统和工程问题已经成了大模型训练中绕不开的难题。例如在 Llama3.1 54 天的训练里，系统会崩溃 466 次，平均 2.78 小时一次！那么，频繁存储检查点就显得十分必要。但存储检查点本身也是一个大工程。Meta 做了很多努力来加速存储检查点时间和增加存储频率，来对抗频繁出

原文链接：70倍极致压缩！大模型的检查点再多也不怕