原标题:再度OpenAI!“谷歌版”Sora深夜上线,4k视频生成时代来了
文章来源:人工智能学家
内容字数:7502字
谷歌强势推出Veo 2和Imagen 3,AI图像视频生成再升级
近日,谷歌发布了全新视频生成模型Veo 2和图像生成模型Imagen 3的升级版本,在图像和视频生成领域取得了显著突破,并宣称达到了当前最佳水平(SOTA)。 此举被解读为谷歌对OpenAI的直接,标志着AI生成内容领域的竞争进一步加剧。
1. Veo 2:高质量视频生成的里程碑
Veo 2是谷歌最新研发的视频生成模型,其生成视频在画质、细节和真实性方面均达到SOTA水平。它对物理规律、人体动作和表情的理解更深入,生成的视频更加逼真。Veo 2支持用户通过提示词自定义场景效果,例如指定镜头类型、画面风格或电影特效,甚至可以生成分辨率高达4K、时长达数分钟的视频。 此外,Veo 2还采用了SynthID无形水印技术,以确保生成内容的安全性和负责任的使用,降低虚假信息传播的风险。未来,Veo 2的功能将逐步集成到VideoFX、YouTube、Vertex AI等谷歌产品中。
2. Imagen 3:图像生成能力全面提升
Imagen 3进行了全面升级,图像生成效果更明亮、构图更精美,并支持更多艺术风格,从写实到抽象,涵盖范围更广。 升级后的模型在细节和材质表现上更为丰富,对提示词的响应也更加准确,在人类评价测试中超过多个领先的图像生成模型,同样达到了SOTA水平。Imagen 3已通过ImageFX工具在全球100多个国家开放使用。
3. Whisk:创意可视化工具,赋能用户创造力
谷歌还推出了基于Imagen 3和Gemini模型的创意可视化工具Whisk。用户可以通过输入或创建图像,并结合Whisk的功能,将不同的图像组合、重新混合,创造出独一无二的作品。Gemini模型能够自动为用户上传的图像生成详细描述,并将其输入Imagen 3,从而实现对场景、风格和主体的灵活控制,极大拓展了用户的创作空间。
4. 未来展望与行业竞争
谷歌此次发布的Veo 2和Imagen 3,以及创意工具Whisk,展示了其在AI图像和视频生成领域的领先地位,并预示着未来AI生成内容将更加高质量、更易于使用,并应用于更广泛的领域。 同时,这也加剧了谷歌与OpenAI等公司在AI领域的竞争,未来将呈现更多创新和突破。
文章最后还列举了欧米伽未来研究所“未来知识库”中收录的100多篇关于前沿科技趋势的报告,涵盖人工智能、能源、经济、生物科技等多个领域,体现了对未来科技发展趋势的持续关注。
联系作者
文章来源:人工智能学家
作者微信:
作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构