AIGC动态欢迎阅读
原标题:公开课预告:智算集群网络互连技术创新应用与展望|云脉芯联产品总监孙伟主讲
关键字:集群,腾讯,网络,猩猩,技术
文章来源:智猩猩GenAI
内容字数:0字
内容摘要:
10月起,智猩猩芯片与算力教研组全新策划推出「智猩猩智算集群公开课」,聚焦集群构建、互联网络、算力调度、存储等关键技术。
目前,「智猩猩智算集群公开课」前两期已顺利完结。腾讯专有云首席架构师方天戟、矩向科技CEO黄朝波分别以《智算集群技术概述》、《智算中心融合算力调度》为主题,进行了直播讲解。
11月8日19:30,「智猩猩智算集群公开课」第3期将开讲,由云脉芯联产品总监孙伟主讲,主题为《智算集群网络互连技术创新应用与展望》。
模型参数规模的不断提升,导致在单个芯片上完成大模型的训练和推理变得不太现实,需要将多个芯片或多台服务器互连起来组成智算集群,才能完成大模型的训练和推理工作。智算集群规模也正在从千卡、万卡向10万卡演进。
而智算集群中芯片与芯片、机柜与机柜之间的互连,并不是简单的“手拉手”,因为面对百亿、千亿乃至万亿级别的大模型,智算集群要处理海量的数据,因此需要超高带宽、超低延迟的网络互连技术,来确保集群内数据的高效传输。
同时,集群规模越大,网络结构也会越复杂,如何根据不同的计算任务和数据传输需求,动态地调整网络带宽和路由策略,优化数据传输路径,确保数据在最短的时间内到达目的
原文链接:公开课预告:智算集群网络互连技术创新应用与展望|云脉芯联产品总监孙伟主讲
联系作者
文章来源:智猩猩GenAI
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...