谷歌推出全新视频与图像生成模型
在今日凌晨,谷歌正式宣布推出其最新的生成模型——Veo 2和Imagen 3,旨在进一步提升视频与图像的生成质量,称其已达到当前的最高标准(SOTA)。这两款模型的发布,标志着谷歌在生成技术领域的一次重大进展,意在与OpenAI等竞争对手形成竞争。
1. Veo 2:SOTA视频生成
Veo 2是谷歌新推出的视频生成模型,表现出色。根据人类评价者的测试,Veo 2在画质、细节和真实性方面均达到SOTA水准。该模型对现实物理、人体动作和表情的理解更加深入,生成的视频内容更加真实。用户可以通过提示词来定制场景效果,包括镜头类型和画面风格,生成高达4K分辨率、时长数分钟的视频。
2. Veo 2的技术特点
Veo 2的技术能力包括减少生成视频中不必要的细节(如多余的手指)的问题,增强输出内容的真实性。此外,为了确保生成技术的安全性,Veo 2采用了无形水印技术SynthID,以识别AI生成内容,从而降低误导信息传播的风险。
3. Imagen 3:图像生成模型再升级
谷歌还对其图像生成模型Imagen进行了全面升级。升级后的Imagen 3在生成质量上超过多个竞争对手,支持更丰富的艺术风格,从写实主义到动漫风格,用户可以获得更高质量和多样化的图像生成体验。
4. Whisk:基于图像的创意工具
此外,谷歌还推出了Whisk,一个基于图像的创意可视化工具。Whisk允许用户输入或创建图像,并结合Imagen 3的技术能力,自动生成详细描述,以实现对场景和风格的灵活组合,满足各种创意需求。
总结
谷歌的Veo 2和Imagen 3模型的推出,不仅展示了其在视频和图像生成领域的技术实力,也为用户提供了更高质量的创作工具。随着这些技术的逐步开放,未来用户在创作方面将有更多的可能性。
联系作者
文章来源:人工智能学家
作者微信:
作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...