OpenAI被偷家，谷歌Veo 2反超Sora

AIGC动态2年前 (2024)发布机器之心

562 0 0

视频生成领先 OpenAI 了？

原标题：OpenAI被偷家，谷歌Veo 2反超Sora
文章来源：机器之心
内容字数：4389字

谷歌AI强势反击：Veo 2视频生成模型超越OpenAI Sora

近日，谷歌发布了三款重磅AI模型：Veo 2视频生成模型、Imagen 3文生图模型和Whisk图生图工具，其中Veo 2尤为引人注目，其生成质量被认为超越了当前最佳的视频生成模型OpenAI Sora，引发了业内广泛关注。

Veo 2：惊艳的视频生成能力
Veo 2能够生成高质量的4K分辨率视频，时长可超过2分钟。它不仅能理解文本和图像提示词，还能理解相机控制指令（如广角镜头、POV等），并能准确重建真实世界的物理交互和人脸表情。虽然目前在谷歌的实验性工具VideoFX中，Veo 2仅提供720p分辨率、8秒长视频的生成服务，但其现有表现已足够惊艳，甚至获得了马斯克的赞扬。
人类评估：Veo 2胜率超高
谷歌进行的人类评估显示，Veo 2在整体偏好和指令遵从度上均大幅领先Meta Movie Gen、可灵1.5、Minimax和Sora Turbo等模型。其被其他模型胜过的概率不超过33%。而Sora Turbo的表现则令人意外地逊色。
Veo 2的突出优势：真实感与细节
Veo 2在物理世界的理解力上表现出色，生成的视频画面真实度极高，例如水波纹、光影、人物动作等细节都处理得非常到位，几乎难以分辨是AI生成。它还能生成自然细腻的人类表情，以及复杂的场景（如蜜蜂群飞），避免了以往AI生成视频中常见的“AI味”和不自然感。DeepMind也指出Veo 2减少了“幻觉”的出现，输出更加逼真。
强大的功能和未来规划
Veo 2不仅能生成逼真的现实场景，也能胜任幻想和动画内容的创作。它还能轻松实现复杂的视觉效果，例如实时追踪物体并精准置换材质，保证画面流畅自然。谷歌计划明年将Veo 2扩展到YouTube Shorts和其他产品上。
与OpenAI的竞争
Veo 2的出现被视为谷歌对OpenAI的强势反击。OpenAI近期直播活动干货不足，而Sora项目负责人又跳槽至DeepMind，这都对OpenAI造成了一定的压力。Veo 2的领先优势，使得谷歌在AI视频生成领域占据了有利地位。

目前Veo 2尚未正式开放，需要用户填表排队申请。虽然仍处于测试阶段，但Veo 2展现出的强大能力已足以让人期待其未来的发展和应用。