架构创新×模型创新！清微智能全面适配DeepSeek模型推理和训练

原标题：架构创新×模型创新！清微智能全面适配DeepSeek模型推理和训练
文章来源：新智元
内容字数：1652字

国产AI芯片新突破：清微智能RPU助力大模型高效运行

近年来，大模型技术飞速发展，对算力的需求也日益增长，呈现出大规模、高弹性、低成本等特点。面对这一挑战，国产AI芯片厂商清微智能基于可重构计算架构（CGRA）推出了RPU（Reconfigurable Processing Unit）芯片，为大模型的运行提供了更高效、更经济的解决方案。

1. **RPU芯片：高效应对大模型算力需求**

清微智能的RPU芯片采用全球领先的可重构计算架构，能够实现单机高效运行千亿级参数模型的推理和训练。其核心优势在于动态硬件重构、全栈优化及高能效比，这使得它在性价比方面具有显著优势，重新定义了国产AI芯片的标杆。

2. **DeepSeek模型适配与部署：国产方案的完美结合**

近期备受关注的DeepSeek系列大模型，其惊艳表现推动了AI产业的快速发展。清微智能积极响应，已完成DeepSeek-R1系列模型的适配和部署运行。RPU芯片通过可重构计算架构映射和数据流控制技术，实现计算资源的动态调度分配，摒弃了传统指令处理流程和共享存储数据交换机制，从而更专注于核心计算任务。

3. **算力服务器：训推一体，提升资源利用率**

清微智能的算力服务器支持无交换机自组网调度，显著提升了计算资源利用率和能效比。它能够支持从1.5B到六千亿参数的DeepSeek全量模型，为国产大模型提供了高性价比的算力支持，是国产算力支持国产大模型的独特方案。更重要的是，该服务器具有训推一体的特点，不仅能高效进行推理，还能支持基于DeepSeek模型对其他模型进行蒸馏训练，例如使用DeepSeek-R1模型对NuminaMath-TIR等数据集进行推理解答，并将结果用于Qwen2-7B模型的蒸馏训练，极大地方便了用户实现大模型本地私有化部署。

4. **强强联合：计算架构创新与模型路径创新**

DeepSeek系列模型的火爆，凸显了国产大模型的创新实力。清微智能RPU芯片的计算架构创新，与国产模型路径创新相结合，实现了1+1>2的效果，为AI用户提供了更具经济性的选择，推动了国产AI产业的蓬勃发展。

总而言之，清微智能RPU芯片及其算力服务器为大模型时代提供了高效、经济的算力解决方案，为国产AI产业发展注入了新的活力，也为AI应用的普及提供了坚实的基础。

联系作者

文章来源：新智元
作者微信：
作者简介：智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人对人类社会与文明进化的影响，领航中国新智能时代。

阅读原文

# AIGC动态 # DeepSeek模型 # 架构创新 # 模型推理 # 模型训练 # 清微智能

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

架构创新×模型创新！清微智能全面适配DeepSeek模型推理和训练

国产AI芯片新突破：清微智能RPU助力大模型高效运行

联系作者

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑，上海交大本科生新“低成本推理”或成新宠！

相关文章

暂无评论

ChatGPT

玩虚拟模特？