标签:大模型ScalingLaws

大模型量化训练极限在哪?腾讯混元提出低比特浮点数训练Scaling Laws

这项研究为大模型训练中的浮点数量化提供了重要的理论指导。
阅读原文