最懂表演的视频大模型开源!AI短剧迎来“DeepSeek时刻”|甲子光年

AIGC动态1个月前发布 甲子光年
283 0 0

昆仑万维发布国内首个面向AI短剧的开源视频大模型

最懂表演的视频大模型开源!AI短剧迎来“DeepSeek时刻”|甲子光年

原标题:最懂表演的视频大模型开源!AI短剧迎来“DeepSeek时刻”|甲子光年
文章来源:甲子光年
内容字数:10774字

昆仑万维开源AI短剧大模型:开启视频创作新时代

本文总结了昆仑万维发布的国内首个面向AI短剧创作的开源视频大模型SkyReels-V1及其配套算法SkyReels-A1 的核心要点。该模型的开源,有望推动AI短剧市场迎来新的发展高峰。

1. “最懂表演”的AI短剧大模型

SkyReels-V1是基于腾讯HunYuan-Video大模型进行微调和优化的垂直领域模型,专注于AI短剧创作。它最大的特点是“最懂表演”,在人物微表情、动作细节、场景、画面构图、运镜等方面表现出色,生成效果媲美专业影视作品。 这得益于昆仑万维基于千万级高质量影视数据进行训练,并自研Human-Centric视频理解多模态大模型,提升了对人物表演的理解能力。SkyReels-V1支持文生视频和图生视频,生成效果与闭源模型海螺AI、可灵AI不相上下,甚至在细节处理上更胜一筹。

2. 高效易用的自研推理框架SkyReels-Infer

为了解决开源模型推理效率低下的问题,昆仑万维自研了推理框架SkyReels-Infer。该框架在单卡RTX 4090上生成544P视频仅需80秒,并支持分布式多卡并行计算和低显存优化,极大降低了使用门槛和成本,让更多用户能够轻松使用AI视频生成技术。 与腾讯HunYuan-Video相比,SkyReels-V1在速度和延迟方面均有显著提升,并支持多种显卡,满足不同用户的需求。

3. SOT表情动作可控算法SkyReels-A1

除了视频生成模型,昆仑万维还开源了表情动作可控算法SkyReels-A1。该算法能够实现电影级别的表情捕捉和“AI换脸”,将人物B的表情、动作、台词等移植到人物A上,效果接近甚至超越闭源的Runway Act-One。SkyReels-A1在表情还原、动作捕捉、人脸保持等方面都表现出色,为创作者提供了高效、灵活且低成本的视频制作方案。

4. 开源精神与AI短剧市场展望

昆仑万维长期以来坚持开源理念,SkyReels-V1和SkyReels-A1的开源是其在AIGC领域的又一重要举措。 公司计划未来继续开源更多技术,进一步降低AI视频创作门槛。 AI短剧市场潜力巨大,预计未来将迎来高速增长。昆仑万维的开源模型,将极大降低AI短剧创作门槛,推动“一人一剧”时代到来,并促进全球文化平权。

总而言之,昆仑万维开源的SkyReels-V1和SkyReels-A1,为AI短剧创作提供了强大的工具,有望推动AI短剧市场迎来类似DeepSeek R1对文本大模型带来的影响,开启视频创作新时代。


联系作者

文章来源:甲子光年
作者微信:
作者简介:甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。

阅读原文
© 版权声明
Trae官网

相关文章

Trae官网

暂无评论

暂无评论...