刚刚!ASP-DAC 2025最佳论文出炉,无问芯穹上交大论文获奖

让 AI 视频生成更快更省

刚刚!ASP-DAC 2025最佳论文出炉,无问芯穹上交大论文获奖

原标题:刚刚!ASP-DAC 2025最佳论文出炉,无问芯穹上交大论文获奖
文章来源:机器之心
内容字数:11295字

AI视频生成加速器ViDA:将推理速度提升16倍

近日,上海交通大学与无问芯穹联合研究团队在ASP-DAC会议上获得前端最佳论文奖,其研发的视频生成软硬一体加速器ViDA,实现了视频扩散Transformer(VDiT)推理速度的显著提升。

1. 背景:AI视频生成市场蓬勃发展,但面临速度瓶颈

AI视频生成市场规模迅速扩张,但现有模型计算复杂度极高,尤其在高分辨率、长时序场景下,计算资源消耗巨大,成为产业发展的瓶颈。即使是大型影视制作团队也难以承受高昂的时间和计算成本。

2. 挑战:VDiT模型的帧间冗余和算子计算强度差异

VDiT模型虽然提升了视频生成质量,但推理速度仍然缓慢。主要挑战在于:帧间计算存在大量冗余,以及不同算子的计算强度差异巨大,导致硬件利用率低。

3. ViDA的核心思想:差分近似和自适应数据流

ViDA创新性地结合了帧间预测的差分计算与帧内稀疏特性分析,提出差分近似方法和自适应数据流架构,实现软硬件协同优化。其核心思想在于利用视频帧间的相似性减少冗余计算。

4. 技术要点:

  1. 差分近似方法:减少Act-Act算子的计算量,降低了51.67%。通过忽略数值较小的项,简化了计算过程,同时保持了较高的精度。

  2. 列聚集处理单元:利用激活矩阵的列稀疏性,提高面积效率1.47倍。通过将稀疏列和稠密列分开处理,优化了硬件资源利用。

  3. 计算强度自适应数据流架构:动态分配资源,提升计算效率1.76倍。通过路由控制器,根据不同算子的计算强度动态调整资源分配,提高硬件利用率。

5. 实验结果:显著的加速比和面积效率提升

实验结果显示,与NVIDIA A100 GPU和现有最先进加速器相比,ViDA分别实现了平均16.44倍/2.18倍的加速比和18.39倍/2.35倍的面积效率提升。这表明ViDA能够有效降低视频生成模型对计算资源的消耗。

6. 结论:推动AI视频生成技术产业化落地

ViDA的成功,为AI视频生成模型的推理加速提供了有效的解决方案,有望显著降低计算成本和时间成本,推动AI视频生成技术更快、更广泛地应用于内容创作、虚拟现实等产业。


联系作者

文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...
第五届
全国人工智能大赛

总奖金超 233 万!

报名即将截止