HPN 7.0:阿里云新一代万卡集群网络架构

HPN 7.0:阿里云新一代万卡集群网络架构

AIGC动态欢迎阅读

原标题:HPN 7.0:阿里云新一代万卡集群网络架构
关键字:腾讯,报告,阿里,拓扑,通信
文章来源:智猩猩AGI
内容字数:0字

内容摘要:


9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创始人兼CEO李原,“吴文俊2023人工智能芯片专项奖”第一完成人、锋行致远创始人兼CEO孙唐等嘉宾已确认出席。欢迎报名或购票参会~01背景本文中,我们简单介绍 C4 底层的阿里云新一代智算集群网络架构 HPN 7.0。阿里在最近的智源大会上也有介绍,可以参考 https://event.baai.ac.cn/live/795,其提到了几个关键词:双上联,双平面,多轨,以及单层千卡,两层万卡。上面提到的几个介绍可以参考:
万卡 GPU 集群互联:硬件配置和网络设计
万卡 GPU 集群实战:探索 LLM 预训练的挑战
阿里 C4:通信驱动加速大规模并行训练效率
剖析大规模 GPU 集群:针对 LLM 场景的挑战和优化
02拓扑如下图所示(图片来自 星融元针对LLM大模型承载网发布星智AI网络解决方案)为常见的三层无阻塞 Fat-Tree 拓扑(SuperSpine-Spine-Leaf),可以将两层的 Spine-Leaf 看做一个


原文链接:HPN 7.0:阿里云新一代万卡集群网络架构

联系作者

文章来源:智猩猩AGI
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...