AIGC动态欢迎阅读
原标题:短剧时代即将来临?AI自动生成剧本和多场景长视频
关键字:视频,模型,事件,文本,背景
文章来源:大数据文摘
内容字数:4432字
内容摘要:
大数据文摘授权转载自将门创投
作者:HiDream.ai
近年来随着扩散模型(diffusion models)的进步和发展,给定文本提示进行高质量视频生成技术有着显著的提升。这些技术方案大多针对已有的二维图像扩散模型进行拓展,将图像二维神经网络修正为视频三维神经网络,并基于扩散概率模型进行视频帧序列的去噪,完成视频生成。然而,这些现有方法依然围绕着单个场景的视频生成,对于多场景视频生成并未考虑,并且生成的视频长度也仅为2秒到4秒。
基于这样的问题,来自HiDream.ai公司的算法研究人员提出利用大语言模型针对输入的文本提示进行多场景事件描述的拓展,保证不同事件之间的逻辑性和场景中前景背景描述的一致性。其后,针对大语言模型提供的每一个事件所对应的前景背景描述,以及动作描述,利用视频扩散模型生成具有内容一致的视频片段,从而构建一个多场景的长视频。论文链接:
https://arxiv.org/abs/2401.01256
项目主页:
https://videodrafter.github.io/
视频链接:
https://www.youtube.com/watch?v=_aIrobr
联系作者
文章来源:大数据文摘
作者微信:BigDataDigest
作者简介:普及数据思维,传播数据文化
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...