AI辅助内部研发效率提升,昇腾大模型推理的最佳实践

AIGC动态4个月前发布 AI前线
10 0 0

AI辅助内部研发效率提升,昇腾大模型推理的最佳实践

AIGC动态欢迎阅读

原标题:AI辅助内部研发效率提升,昇腾大模型推理的最佳实践
关键字:华为,模型,硬件,算子,字节跳动
文章来源:AI前线
内容字数:0字

内容摘要:


演讲嘉宾 | 王建辉
以大模型为代表的 AI 技术高速发展,目前 Scaling Law 依然生效,模型参数持续增大,序列不断增长,响应速度越来越快,但大模型商业闭环依赖推理的规模落地,如何在不断提升用户体验的基础上不断降低推理成本,以满足大模型规模落地的诉求,成为大模型推理技术研究的核心关键。为了满足大模型推理规模落地对客户体验和成本的诉求,昇腾推出高性能大模型推理软硬件解决方案,满足客户多样性开发诉求,助力大模型规模落地。
本文整理自华为昇腾计算首席架构师王建辉在 AICon 2024 北京的演讲《昇腾大模型推理最佳实践》,内容经 InfoQ 进行不改变原意的编辑。
华为昇腾计算首席架构师赵英俊将在 6 月 14-15 日即将举办的 ArchSummit 深圳上进一步分享《超大规模 AI 算力集群优化与实践》。此外,阿里巴巴研究员 / 阿里云云原生应用平台负责人丁宇(叔同)将带来《AI 编程如何颠覆生产力》 的 Keynote 主题演讲,在《低代码与 AI 结合》专题上,来自腾讯、网易、蚂蚁集团等企业等技术专家也将深入探讨在低代码环境中集成智能决策、自动化流程,以及构建灵活、高效的


原文链接:AI辅助内部研发效率提升,昇腾大模型推理的最佳实践

联系作者

文章来源:AI前线
作者微信:ai-front
作者简介:面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...