锤爆Sora，尺度最大，谷歌发布最强视频模型Veo2，叫板海螺可灵

AIGC动态2年前 (2024)发布夕小瑶科技说

原标题：锤爆Sora，尺度最大，谷歌发布最强视频模型Veo2，叫板海螺可灵
文章来源：夕小瑶科技说
内容字数：10917字

谷歌AI反击战：Veo 2和Imagen 3强势来袭，OpenAI的Sora黯然失色

近期，谷歌DeepMind强势发布了两个重量级AI模型，直接挑战OpenAI的领先地位。其中，视频生成模型Veo 2以其卓越的性能，引发业界广泛关注，而文生图模型Imagen 3也展现出令人惊艳的细节和光照效果。此举被视为谷歌对OpenAI近期一系列产品发布的强力反击。

Veo 2：年度最佳视频生成模型？
Veo 2在视频生成时长、分辨率和质量上全面超越OpenAI的Sora。Sora 20美元版本仅能生成5秒720p视频，而200美元版本也只有20秒1080p。相比之下，Veo 2可生成约2分钟4K高清视频。在第三方评测中，Veo 2在整体满意度和指令遵循度上均优于Sora、Meta Movie Gen、Kling v1.5和Minimax等模型。Veo 2的显著改进体现在保真度（细节真实，减少伪影）、准确度（理解物理世界，精准遵循指令）和相机控制（掌握电影摄影技巧，可创建各种拍摄风格）等方面。众多官方演示视频展示了Veo 2在模拟真实场景（如切西红柿、早餐场景、动物游泳等）和虚构场景（如梦境般的光影效果）方面的出色表现，其生成的视频质量已达到以假乱真的程度。
Imagen 3：细节更胜一筹的文生图模型
除了Veo 2，谷歌还同步发布了Imagen 3文生图模型。该模型在图像细节、光照效果和减少干扰方面均有显著提升，其benchmark得分也远超其他同类模型。Imagen 3目前已开放使用，用户可直接体验其强大的生成能力。
谷歌与OpenAI的AI竞赛：级更新vs.炒作过度？
谷歌此次发布的Veo 2和Imagen 3，与OpenAI近期持续发布新产品形成鲜明对比。谷歌的更新更侧重于技术实力的展现，每次发布都具有“级”的影响力，例如Gemini 2.0和这次的Veo 2都抢占了OpenAI的风头。而OpenAI则被部分评论认为存在过度炒作的情况，预告的12天直播虽然吸引了大量关注，但实际发布内容未能完全满足用户的期待。 Veo 2目前仅通过VideoFX平台提供版（8秒720p视频），完整版将于未来几个月陆续推出。尽管如此，其性能仍远超Sora。

总而言之，谷歌此次AI反击战可谓声势浩大，Veo 2和Imagen 3的惊艳表现为AI技术发展树立了新的标杆，也为这场AI巨头之间的竞争增添了更多看点。未来，谷歌和OpenAI之间的较量将持续引发关注。