标签:专家模型调度

关于 MoE 大模型负载均衡策略演进的回顾:坑点与经验教训

带着大家依次走过几个标志性的MoE系统,从GShard到DeepSeek-V3。
阅读原文