颠覆视界:谷歌Sora深夜发布,4K视频生成新时代震撼来袭!

颠覆视界:谷歌Sora深夜发布,4K视频生成新时代震撼来袭!

原标题:再度OpenAI!“谷歌版”Sora深夜上线,4k视频生成时代来了
文章来源:人工智能学家
内容字数:7502字

谷歌推出全新视频与图像生成模型

在今日凌晨,谷歌正式宣布推出其最新的生成模型——Veo 2和Imagen 3,旨在进一步提升视频与图像的生成质量,称其已达到当前的最高标准(SOTA)。这两款模型的发布,标志着谷歌在生成技术领域的一次重大进展,意在与OpenAI等竞争对手形成竞争。

1. Veo 2:SOTA视频生成

Veo 2是谷歌新推出的视频生成模型,表现出色。根据人类评价者的测试,Veo 2在画质、细节和真实性方面均达到SOTA水准。该模型对现实物理、人体动作和表情的理解更加深入,生成的视频内容更加真实。用户可以通过提示词来定制场景效果,包括镜头类型和画面风格,生成高达4K分辨率、时长数分钟的视频。

2. Veo 2的技术特点

Veo 2的技术能力包括减少生成视频中不必要的细节(如多余的手指)的问题,增强输出内容的真实性。此外,为了确保生成技术的安全性,Veo 2采用了无形水印技术SynthID,以识别AI生成内容,从而降低误导信息传播的风险。

3. Imagen 3:图像生成模型再升级

谷歌还对其图像生成模型Imagen进行了全面升级。升级后的Imagen 3在生成质量上超过多个竞争对手,支持更丰富的艺术风格,从写实主义到动漫风格,用户可以获得更高质量和多样化的图像生成体验。

4. Whisk:基于图像的创意工具

此外,谷歌还推出了Whisk,一个基于图像的创意可视化工具。Whisk允许用户输入或创建图像,并结合Imagen 3的技术能力,自动生成详细描述,以实现对场景和风格的灵活组合,满足各种创意需求。

总结

谷歌的Veo 2和Imagen 3模型的推出,不仅展示了其在视频和图像生成领域的技术实力,也为用户提供了更高质量的创作工具。随着这些技术的逐步开放,未来用户在创作方面将有更多的可能性。


联系作者

文章来源:人工智能学家
作者微信:
作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...