华为王辉:超大规模集群训推和网络自动驾驶,是AI在网络中深度应用的发展方向 | MEET 2025

AIGC动态5个月前发布 量子位
287 0 0

Network for AI,AI训练和推理需要新一代的高速网络;AI for Network,新一代的智能网络也需要AI,让网络更加安全可靠。

华为王辉:超大规模集群训推和网络自动驾驶,是AI在网络中深度应用的发展方向 | MEET 2025

原标题:华为王辉:超大规模集群训推和网络自动驾驶,是AI在网络中深度应用的发展方向 | MEET 2025
文章来源:量子位
内容字数:6024字

AI与通信网络:Network for AI和AI for Network

本文总结了华为NCE数据通信领域总裁王辉在MEET2025智能未来大会上关于AI与通信网络关系的演讲。演讲的核心观点是AI与网络密不可分,呈现出“Network for AI”和“AI for Network”两层关系:前者利用网络加速AI训练和推理;后者则利用AI提升网络的智能化、安全性和可靠性。

1. Network for AI:加速AI训练与推理

AI训练对算力需求日益增长,从万卡集群到百万卡集群,需要整合远距离分散的算力资源。这需要解决两个关键挑战:确保大模型训练长时间稳定,以及实现跨远距离的算力协同。

为了解决第一个挑战,华为利用先进算法(如NLSB算法)维持网络负载均衡,并通过故障预测算法提前排除潜在故障,提升训练效率。对于第二个挑战,华为通过AI DC内网络与DC间网络的算法协同,以及业界首个跨上千公里的无损网络,实现远距离数据中心协同训练。

2. AI for Network:构建更智能、更安全、更可靠的网络

许多垂直行业都在探索如何利用AI,面临决策实时性、推理严谨性和场景泛化性等挑战。王辉提出,解决这些问题的关键在于大模型推理能力与领域机理模型和工具的深度结合,构建一个AI Native的智能网络系统,即“一网一图一脑”。

“一网”指智能网元,提供精准数据和控制;“一图”指网络数字地图,构建网络的数字孪生,提供精准的上下文信息;“一脑”指通信大模型,融合领域知识和强推理能力,实现网络的“自动驾驶”。 该大模型需要具备类O(1)的强推理能力,并融合领域专有模型和高质量的领域知识治理,才能满足工业领域的严苛要求。

3. 垂直行业AI落地的挑战与解决方案

演讲中指出了垂直行业应用AI和大模型时面临的三个主要挑战:决策实时性、推理严谨性和场景泛化性。 这需要一个系统性的解决方案,将智能网元、网络数字地图和通信大模型相结合,最终实现网络的L4级“自动驾驶”。

4. 总结

王辉的演讲强调了AI与网络的紧密联系,并针对Network for AI和AI for Network分别提出了相应的解决方案。 他认为,只有将大模型的强推理能力与领域知识、工具深度结合,才能真正推动AI在垂直行业的落地,并最终实现网络的智能化升级。


联系作者

文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明
Trae官网

相关文章

Trae官网

暂无评论

暂无评论...