原标题:锤爆Sora,尺度最大,谷歌发布最强视频模型Veo2,叫板海螺可灵
文章来源:夕小瑶科技说
内容字数:10917字
谷歌AI反击战:Veo 2和Imagen 3强势来袭,OpenAI的Sora黯然失色
近期,谷歌DeepMind强势发布了两个重量级AI模型,直接挑战OpenAI的领先地位。其中,视频生成模型Veo 2以其卓越的性能,引发业界广泛关注,而文生图模型Imagen 3也展现出令人惊艳的细节和光照效果。此举被视为谷歌对OpenAI近期一系列产品发布的强力反击。
Veo 2:年度最佳视频生成模型?
Veo 2在视频生成时长、分辨率和质量上全面超越OpenAI的Sora。Sora 20美元版本仅能生成5秒720p视频,而200美元版本也只有20秒1080p。相比之下,Veo 2可生成约2分钟4K高清视频。在第三方评测中,Veo 2在整体满意度和指令遵循度上均优于Sora、Meta Movie Gen、Kling v1.5和Minimax等模型。Veo 2的显著改进体现在保真度(细节真实,减少伪影)、准确度(理解物理世界,精准遵循指令)和相机控制(掌握电影摄影技巧,可创建各种拍摄风格)等方面。众多官方演示视频展示了Veo 2在模拟真实场景(如切西红柿、早餐场景、动物游泳等)和虚构场景(如梦境般的光影效果)方面的出色表现,其生成的视频质量已达到以假乱真的程度。
Imagen 3:细节更胜一筹的文生图模型
除了Veo 2,谷歌还同步发布了Imagen 3文生图模型。该模型在图像细节、光照效果和减少干扰方面均有显著提升,其benchmark得分也远超其他同类模型。Imagen 3目前已开放使用,用户可直接体验其强大的生成能力。
谷歌与OpenAI的AI竞赛:级更新vs.炒作过度?
谷歌此次发布的Veo 2和Imagen 3,与OpenAI近期持续发布新产品形成鲜明对比。谷歌的更新更侧重于技术实力的展现,每次发布都具有“级”的影响力,例如Gemini 2.0和这次的Veo 2都抢占了OpenAI的风头。而OpenAI则被部分评论认为存在过度炒作的情况,预告的12天直播虽然吸引了大量关注,但实际发布内容未能完全满足用户的期待。 Veo 2目前仅通过VideoFX平台提供版(8秒720p视频),完整版将于未来几个月陆续推出。尽管如此,其性能仍远超Sora。
总而言之,谷歌此次AI反击战可谓声势浩大,Veo 2和Imagen 3的惊艳表现为AI技术发展树立了新的标杆,也为这场AI巨头之间的竞争增添了更多看点。未来,谷歌和OpenAI之间的较量将持续引发关注。
联系作者
文章来源:夕小瑶科技说
作者微信:
作者简介:低负担解码AI世界,硬核也可爱!聚集35万AI发烧友、开发者和从业者,广泛覆盖互联网大厂中高管、AI公司创始人和机构投资人。一线作者来自清北、国内外顶级AI实验室和大厂,兼备敏锐的行业嗅觉和洞察深度。商务合作:zym5189