AIGC动态欢迎阅读
原标题:清程极智 CEO 汤雄超:训推一体机并非 AI Infra 的未来
关键字:模型,芯片,厂商,集群,科技
文章来源:AI科技评论
内容字数:0字
内容摘要:
较小的一体机难承载巨大的训练业务,训推「对症下药」才有机会。作者|朱可轩
编辑|陈彩娴
早在超算时代,清华大学高性能计算研究中心便一直是解决算力需求相关软件问题的行家。
“目前 AI Infra 赛道几家国内厂商中,只有我们有过十万台服务器的超大规模国产算力集群的使用和调优经验。”汤雄超向 AI 科技评论介绍道。
而“大规模”会是算力发展最难解的“题”——
从汤雄超观察来看,当前业内多有提及的不同品牌 GPU 异构混训,是芯片产能不足现状下的一种妥协,未来智算中心可能会回归同一型号 GPU 的架构以获得更高的效率,AI 大模型训练核心归根到底还是落点在大规模算力系统本身。
基于前述思考,去年年底,这支来自清华大学计算机系的团队创办了清程极智,汤雄超博士担任公司 CEO,翟季冬教授为公司首席科学家。
除了 AI 训练面临的挑战,成立之初,清程极智也看到了推理侧的机会。
在一段时期内,训推一体机是业内较为流行的产品形态。但在汤雄超的观点中,训推一体机是很难满足未来的 AI 业务全部需求的。
论及其中原因,他认为,“训练和推理两种业务对算力系统的需求区别较大,很难想象出有一个比较小的一体机能
原文链接:清程极智 CEO 汤雄超:训推一体机并非 AI Infra 的未来
联系作者
文章来源:AI科技评论
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...