香港大学发布组合性文生视频基准，7大类20项指标，让20个大模型一决雌雄

AIGC动态1年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：香港大学发布组合性文生视频基准，7大类20项指标，让20个大模型一决雌雄
关键字：模型,视频,腾讯,提示,绑定
文章来源：夕小瑶科技说
内容字数：0字

内容摘要：

夕小瑶科技说原创作者 | Richard相较于文本生成、文生图等领域而言，文生视频领域发展相对较慢。当年一段“史密斯吃面”的视频意外走红网络，可谓相当魔幻。
然而进入 2024 年，OpenAI 再一次给 AI界人了一个重磅 —— 文本视频大模型 Sora 横空出世，将 AI 创作的最后一块拼图也补上了。
此后，腾讯、Show Lab 等争相发布了自己的文生视频大模型。但是还没有一个基准测试全面评估这些模型的能力。
为此，香港大学的研究团队发布了名为 T2V-CompBench 的基准测试，并且首次将“组合性”这个概念引入视频生成评估中。
T2V-CompBench 通过 7 个精心设计的类别全面评估文生视频模型的组合性能力，包括一致属性绑定、动态属性绑定、空间关系、动作绑定、绑定、对象交互和生成数字。每个类别都针对视频生成中的特定组合性挑战，从静态属性的一致性到复杂的动态交互。
研究使用 T2V-CompBench 对 20 个主流视频生成模型进行全面测评。结果显示虽然文生视频技术突飞猛进，但是在处理复杂动态场景时仍然“力不从心”。
有了这个基准，文生视频可以针对现如今的一

原文链接：香港大学发布组合性文生视频基准，7大类20项指标，让20个大模型一决雌雄