老黄给H100“打鸡血”:英伟达推出大模型加速包,Llama2推理速度翻倍

AIGC动态1年前 (2023)发布 量子位
12 0 0

老黄给H100“打鸡血”:英伟达推出大模型加速包,Llama2推理速度翻倍

AIGC动态欢迎阅读

原标题:老黄给H100“打鸡血”:英伟达推出大模型加速包,Llama2推理速度翻倍

关键字:模型,公告,速度,批处理,量子

文章来源:量子位

内容字数:3838字

内容摘要:克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型的推理速度,仅仅一个月就提高了一倍!英伟达近日官宣给H100推出了“鸡血包”——专用于LLM推理的加速程序。或许这下可以不用空等明年才能交付的GH200了。GPU的运算能力一直影响着大模型的表现,无论是硬件提供者还是使用者都希望能算得更快些。而作为大模型背后硬件的最大供应商,英伟达一直在研究怎么给大模型硬件加速。通过与多家AI公司合作,英伟…

原文链接:点此阅读原文:老黄给H100“打鸡血”:英伟达推出大模型加速包,Llama2推理速度翻倍

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...