视频生成领先 OpenAI 了?
原标题:OpenAI被偷家,谷歌Veo 2反超Sora
文章来源:机器之心
内容字数:4389字
谷歌AI强势反击:Veo 2视频生成模型超越OpenAI Sora
近日,谷歌发布了三款重磅AI模型:Veo 2视频生成模型、Imagen 3文生图模型和Whisk图生图工具,其中Veo 2尤为引人注目,其生成质量被认为超越了当前最佳的视频生成模型OpenAI Sora,引发了业内广泛关注。
Veo 2:惊艳的视频生成能力
Veo 2能够生成高质量的4K分辨率视频,时长可超过2分钟。它不仅能理解文本和图像提示词,还能理解相机控制指令(如广角镜头、POV等),并能准确重建真实世界的物理交互和人脸表情。虽然目前在谷歌的实验性工具VideoFX中,Veo 2仅提供720p分辨率、8秒长视频的生成服务,但其现有表现已足够惊艳,甚至获得了马斯克的赞扬。
人类评估:Veo 2胜率超高
谷歌进行的人类评估显示,Veo 2在整体偏好和指令遵从度上均大幅领先Meta Movie Gen、可灵1.5、Minimax和Sora Turbo等模型。其被其他模型胜过的概率不超过33%。而Sora Turbo的表现则令人意外地逊色。
Veo 2的突出优势:真实感与细节
Veo 2在物理世界的理解力上表现出色,生成的视频画面真实度极高,例如水波纹、光影、人物动作等细节都处理得非常到位,几乎难以分辨是AI生成。它还能生成自然细腻的人类表情,以及复杂的场景(如蜜蜂群飞),避免了以往AI生成视频中常见的“AI味”和不自然感。DeepMind也指出Veo 2减少了“幻觉”的出现,输出更加逼真。
强大的功能和未来规划
Veo 2不仅能生成逼真的现实场景,也能胜任幻想和动画内容的创作。它还能轻松实现复杂的视觉效果,例如实时追踪物体并精准置换材质,保证画面流畅自然。谷歌计划明年将Veo 2扩展到YouTube Shorts和其他产品上。
与OpenAI的竞争
Veo 2的出现被视为谷歌对OpenAI的强势反击。OpenAI近期直播活动干货不足,而Sora项目负责人又跳槽至DeepMind,这都对OpenAI造成了一定的压力。Veo 2的领先优势,使得谷歌在AI视频生成领域占据了有利地位。
目前Veo 2尚未正式开放,需要用户填表排队申请。虽然仍处于测试阶段,但Veo 2展现出的强大能力已足以让人期待其未来的发展和应用。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台