标签:分布式训练

大模型MLSYS学习随笔- 训推框架总览

本篇以mapping 为主)主要是了解大模型mlsys的一些核心组成
阅读原文

谈谈DeepSeek-v3提到的基础设施演进

DeepSeek-v3将算法与基础设施融合,推动硬件架构创新。
阅读原文