从\x26quot;神话\x26quot;到\x26quot;笑话\x26quot;,Sora只用了短短10个月,Google veo来得正当时
原标题:Sora翻车后,Google王炸降临:AI视频迎来真正的实力派
文章来源:AI范儿
内容字数:3857字
Google Veo 2:AI视频生成领域的“真玩家”
本文总结了Google近期发布的Veo 2、Imagen 3和Whisk三个AI工具,并分析了Google在AI创意领域的战略布局。
Sora的滑铁卢与Veo 2的崛起
文章开篇以OpenAI的Sora模型为例,对比了其发布初期的高期待和后期用户反馈的巨大落差。 Google Veo 2的发布,正是在这种背景下显得尤为重要。虽然起初作者也抱有怀疑态度,但深入研究后发现Veo 2在4K高清视频输出、对专业摄影语言的理解以及对物理世界的还原度上都有显著提升,在MovieGenBench测试中也表现出色,优于Sora Turbo。
Veo 2的技术实力与优势
Veo 2的技术亮点在于其对专业摄影知识的掌握,例如低角度推轨、广角镜头效果、浅景深虚化等,甚至连资深摄影师都对其技术水平表示赞赏。 此外,Veo 2在处理物理世界的合理性方面也比其他AI模型有显著进步,减少了“鬼畜”场景的出现。 文章也客观地指出了Veo 2在处理复杂场景和长时间动作连贯性方面仍需改进。
Imagen 3:全能艺术家级的图像生成
除了Veo 2,Google还推出了Imagen 3,一个能够驾驭多种艺术风格(从写实到抽象)的图像生成模型。Imagen 3更精准地理解用户提示词,生成细节更丰富、纹理更逼真的图像,在人工评测中表现优异。
Whisk:创意实验的数字炼金术
Whisk是一个创意实验平台,允许用户输入灵感图片,系统利用Gemini的视觉理解能力解读图片,并通过Imagen 3将创意转化为现实,例如毛绒玩具或珐琅别针等。它为创作者提供了一个进行创意转化和重组的“数字炼金术实验室”。
Google的AI创意生态系统战略
Google的战略并非局限于单个AI工具的竞争,而是构建一个完整的AI创意生态系统。Veo 2、Imagen 3和Whisk三个工具协同工作,覆盖从灵感获取到作品创作的全过程。Google采用Google Labs平台进行全球同步发布,并为所有AI生成内容添加SynthID水印,体现了其对用户反馈和内容安全的重视。
未来展望:AI创意产业的新巨头?
文章最后探讨了Google在AI创意领域的领先地位及其对未来创意产业的影响,暗示Google可能成为AI创意平台的新巨头。
联系作者
文章来源:AI范儿
作者微信:
作者简介:专注于探索 AIGC,发掘人工智能的乐趣。