阿里云通义万相2.1视频生成模型推出:登顶VBench榜单,支持中文文字生成

阿里云通义万相2.1视频生成模型推出:登顶VBench榜单,支持中文文字生成

原标题:阿里云通义万相2.1视频生成模型推出:登顶VBench榜单,支持中文文字生成
文章来源:小夏聊AIGC
内容字数:2135字

阿里云通义万相2.1:AI视频生成技术的新里程碑

近日,阿里云旗下的AI视频生成模型通义万相迎来了2.1版本的重大升级,引发了业界广泛关注。此次升级不仅在技术性能上取得了显著突破,更拓展了应用场景,为AI视频生成领域树立了新的标杆。

性能大幅提升,逼真效果惊艳

通义万相2.1版本推出了极速版和专业版两个版本,分别针对不同需求进行优化。极速版注重效率,专业版则追求卓越的表现力。在技术层面,该版本在处理复杂、还原真实物理规律、提升电影质感以及优化指令遵循等方面取得了重大进展。通过先进的算法和海量数据训练,模型能够生成更加逼真、生动的视频内容,细节处理精细入微,极大地提升了视觉观感。

例如,“切牛排”这一经典测试场景中,通义万相2.1生成的画面展现了清晰的牛排纹理、逼真的刀锋切入效果以及Q弹的肉质质感。在人物特写方面,模型能够精准捕捉人物表情、手部和肢体动作,使其自然协调,符合规律,展现出令人惊艳的细节还原能力。

登顶VBench榜单,实力雄厚

通义万相2.1的强大实力也得到了权威评测的认可。它在权威视频生成评测榜单VBench上以84.7%的总分夺得榜首,超越了Gen3、Pika、CausVid等国内外知名模型,充分展现了其在该领域的领先地位。(榜单链接:https://huggingface.co/spaces/Vchitect/VBench_Leaderboard)

创新功能,拓展应用场景

除了性能提升,通义万相2.1还带来了诸多创新功能,极大拓展了应用场景。它成为首个支持中文文字生成,并同时支持中英文文字特效生成的AI视频生成模型,为视频内容创作增添了更多趣味性和互动性。例如,可以轻松生成一个橘黄色的正方体小盒子里跳出英文单词“Synced”的动画效果。

此外,通义万相2.1还支持多种艺术风格的视频生成,包括卡通、电影色、3D风格、油画、古典等,满足不同用户的创作需求。它还支持不同长宽比的视频输出,方便用户在不同终端设备上播放。

未来展望,引领行业发展

通义万相2.1的升级不仅提升了模型的性能,更开拓了AI视频生成技术的应用前景。随着人工智能技术的不断发展,通义万相有望继续引领行业潮流,为用户带来更多精彩的视觉体验。目前,用户可以在通义万相官网体验最新版本,开发者也可以在阿里云百炼平台上调用大模型API进行开发和应用。

通义万相2.1的推出标志着AI视频生成技术迈向了新的阶段,我们期待它在未来带来更多惊喜和突破。


联系作者

文章来源:小夏聊AIGC
作者微信:
作者简介:专注于人工智能生成内容的前沿信息与技术分享。我们提供AI生成艺术、文本、音乐、视频等领域的最新动态与应用案例。每日新闻速递、技术解读、行业分析、专家观点和创意展示。期待与您一起探索AI的无限潜力。欢迎关注并分享您的AI作品或宝贵意见。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...