在线可玩!智谱开源图生视频模型,网友直呼Amazing!

AIGC动态3个月前发布 量子位
6 0 0

在线可玩!智谱开源图生视频模型,网友直呼Amazing!

AIGC动态欢迎阅读

原标题:在线可玩!智谱开源图生视频模型,网友直呼Amazing!
关键字:视频,模型,字幕,团队,提示
文章来源:量子位
内容字数:0字

内容摘要:


叨乐 发自 凹非寺量子位 | 公众号 QbitAI刚刚,智谱把清影背后的图生视频模型CogVideoX-5B-I2V给开源了!(在线可玩)
一起开源的还有它的标注模型cogvlm2-llama3-caption。在实际应用中,CogVideoX-5B-I2V支持「一张图」+「提示词」生成视频。
而cogvlm2-llama3-caption则是负责将视频内容转换成文本描述。
不过用过的网友却对它的表现褒贬不一:
有人在用过之后直呼Amazing。
也有人试了半天,最后还是选择了CogVideoX之前的版本,还夸夸说:我最看好这个型号!
所以到底效果如何,咱们来实测一波!
实测CogVideoX-5B-I2V测试开始~输入提示词:咖啡店员握住双手笑着对客人表示欢迎,说话时身体自然活动(依旧是老生常谈的“手部”问题)
第二次实测,试了一下简短提示词:吗喽颠着二郎腿打电话(效果不理想,主体还是静态的没有动起来)
第三次的提示词是:“明月圆圆,几个人坐在河边谈心说话,举杯高歌。”显示生成完成,但是到最后显示环节却直接NAN了(呜呜呜)
整体效果有些一言难尽,而且生成速度有些慢。
咱们还是来看一


原文链接:在线可玩!智谱开源图生视频模型,网友直呼Amazing!

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...