腾讯版Sora开源提速8倍！官方预告下月惊艳新图生视频来袭！

网友：最强开源视频模型

原标题：腾讯版Sora开源后，被提速8倍！官方点赞并预告：下月上新图生视频
文章来源：量子位
内容字数：2363字

最近，FastHunyuan混元视频模型的发布引起了广泛关注。该模型的速度提升达到8倍，仅需1分钟即可生成5秒长的视频，显著缩短了生成过程的步数，从原先的50步减少到6步，同时画面细节也更加逼真。

与普通速度的混元模型相比，FastHunyuan在相同的时间内可以生成8条视频，这一效率的提升使得视频制作更加高效。此外，FastHunyuan与Sora模型的效果对比显示，前者在物理细节理解方面表现更优，尤其在处理诸如柠檬取用等细节时，FastHunyuan展现出了更强的能力。

FastHunyuan的技术创新主要源于其全新的视频DiT蒸馏配方，基于阶段一致性模型（PCM）。团队发现多阶段蒸馏效果不佳，最终选择了与原始PCM配置类似的单阶段设置。同时，使用MixKit数据集进行蒸馏，并在训练前对数据进行了预处理以优化效果。

在推理阶段，FastHunyuan支持通过FSDP、序列并行及选择性激活检查点进行可扩展训练，能够在64个GPU上近乎线性扩展。最低硬件要求为40GB GPU内存，另外支持LoRA微调和全微调两种方式，适应不同用户的硬件条件。

FastHunyuan的v0.1版本于2024年12月17日发布，未来计划包括增加更多蒸馏方法、支持更多模型以及代码更新等。同时，混元团队还预告了备受期待的图像到视频生成功能，预计在1月份发布。

FastHunyuan的代码已开源，用户可以通过以下链接获取相关资源：
GitHub: https://github.com/hao-ai-lab/FastVideo
HuggingFace: https://huggingface.co/FastVideo/FastHunyuan

此次模型的革新无疑为视频生成领域带来了新的可能，值得持续关注。

文章来源：量子位
作者微信：
作者简介：追踪人工智能新趋势，关注科技行业新突破

文章版权归作者所有，未经允许请勿转载。

暂无评论...