颠覆视界：谷歌Sora深夜发布，4K视频生成新时代震撼来袭！

原标题：再度OpenAI！“谷歌版”Sora深夜上线，4k视频生成时代来了
文章来源：人工智能学家
内容字数：7502字

在今日凌晨，谷歌正式宣布推出其最新的生成模型——Veo 2和Imagen 3，旨在进一步提升视频与图像的生成质量，称其已达到当前的最高标准(SOTA)。这两款模型的发布，标志着谷歌在生成技术领域的一次重大进展，意在与OpenAI等竞争对手形成竞争。

Veo 2是谷歌新推出的视频生成模型，表现出色。根据人类评价者的测试，Veo 2在画质、细节和真实性方面均达到SOTA水准。该模型对现实物理、人体动作和表情的理解更加深入，生成的视频内容更加真实。用户可以通过提示词来定制场景效果，包括镜头类型和画面风格，生成高达4K分辨率、时长数分钟的视频。

Veo 2的技术能力包括减少生成视频中不必要的细节（如多余的手指）的问题，增强输出内容的真实性。此外，为了确保生成技术的安全性，Veo 2采用了无形水印技术SynthID，以识别AI生成内容，从而降低误导信息传播的风险。

谷歌还对其图像生成模型Imagen进行了全面升级。升级后的Imagen 3在生成质量上超过多个竞争对手，支持更丰富的艺术风格，从写实主义到动漫风格，用户可以获得更高质量和多样化的图像生成体验。

此外，谷歌还推出了Whisk，一个基于图像的创意可视化工具。Whisk允许用户输入或创建图像，并结合Imagen 3的技术能力，自动生成详细描述，以实现对场景和风格的灵活组合，满足各种创意需求。

谷歌的Veo 2和Imagen 3模型的推出，不仅展示了其在视频和图像生成领域的技术实力，也为用户提供了更高质量的创作工具。随着这些技术的逐步开放，未来用户在创作方面将有更多的可能性。

联系作者

文章来源：人工智能学家
作者微信：
作者简介：致力成为权威的人工智能科技媒体和前沿科技研究机构

文章版权归作者所有，未经允许请勿转载。

暂无评论...