香港大学发布组合性文生视频基准,7大类20项指标,让20个大模型一决雌雄

香港大学发布组合性文生视频基准,7大类20项指标,让20个大模型一决雌雄

AIGC动态欢迎阅读

原标题:香港大学发布组合性文生视频基准,7大类20项指标,让20个大模型一决雌雄
关键字:模型,视频,腾讯,提示,绑定
文章来源:夕小瑶科技说
内容字数:0字

内容摘要:


夕小瑶科技说 原创作者 | Richard相较于文本生成、文生图等领域而言,文生视频领域发展相对较慢。当年一段“史密斯吃面”的视频意外走红网络,可谓相当魔幻。
然而进入 2024 年,OpenAI 再一次给 AI界人了一个重磅 —— 文本视频大模型 Sora 横空出世,将 AI 创作的最后一块拼图也补上了。
此后,腾讯、Show Lab 等争相发布了自己的文生视频大模型。但是还没有一个基准测试全面评估这些模型的能力。
为此,香港大学的研究团队发布了名为 T2V-CompBench 的基准测试,并且首次将“组合性”这个概念引入视频生成评估中。
T2V-CompBench 通过 7 个精心设计的类别全面评估文生视频模型的组合性能力,包括一致属性绑定、动态属性绑定、空间关系、动作绑定、绑定、对象交互和生成数字。每个类别都针对视频生成中的特定组合性挑战,从静态属性的一致性到复杂的动态交互。
研究使用 T2V-CompBench 对 20 个主流视频生成模型进行全面测评。结果显示虽然文生视频技术突飞猛进,但是在处理复杂动态场景时仍然“力不从心”。
有了这个基准,文生视频可以针对现如今的一


原文链接:香港大学发布组合性文生视频基准,7大类20项指标,让20个大模型一决雌雄

联系作者

文章来源:夕小瑶科技说
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...