再度OpenAI！“谷歌版”Sora深夜上线，4k视频生成时代来了

AIGC动态2年前 (2024)发布人工智能学家

再度狙击OpenAI！“谷歌版”Sora深夜上线，4k视频生成时代来了

原标题：再度OpenAI！“谷歌版”Sora深夜上线，4k视频生成时代来了
文章来源：人工智能学家
内容字数：7502字

谷歌强势推出Veo 2和Imagen 3，AI图像视频生成再升级

近日，谷歌发布了全新视频生成模型Veo 2和图像生成模型Imagen 3的升级版本，在图像和视频生成领域取得了显著突破，并宣称达到了当前最佳水平（SOTA）。此举被解读为谷歌对OpenAI的直接，标志着AI生成内容领域的竞争进一步加剧。

1. Veo 2：高质量视频生成的里程碑

Veo 2是谷歌最新研发的视频生成模型，其生成视频在画质、细节和真实性方面均达到SOTA水平。它对物理规律、人体动作和表情的理解更深入，生成的视频更加逼真。Veo 2支持用户通过提示词自定义场景效果，例如指定镜头类型、画面风格或电影特效，甚至可以生成分辨率高达4K、时长达数分钟的视频。此外，Veo 2还采用了SynthID无形水印技术，以确保生成内容的安全性和负责任的使用，降低虚假信息传播的风险。未来，Veo 2的功能将逐步集成到VideoFX、YouTube、Vertex AI等谷歌产品中。

2. Imagen 3：图像生成能力全面提升

Imagen 3进行了全面升级，图像生成效果更明亮、构图更精美，并支持更多艺术风格，从写实到抽象，涵盖范围更广。升级后的模型在细节和材质表现上更为丰富，对提示词的响应也更加准确，在人类评价测试中超过多个领先的图像生成模型，同样达到了SOTA水平。Imagen 3已通过ImageFX工具在全球100多个国家开放使用。

3. Whisk：创意可视化工具，赋能用户创造力

谷歌还推出了基于Imagen 3和Gemini模型的创意可视化工具Whisk。用户可以通过输入或创建图像，并结合Whisk的功能，将不同的图像组合、重新混合，创造出独一无二的作品。Gemini模型能够自动为用户上传的图像生成详细描述，并将其输入Imagen 3，从而实现对场景、风格和主体的灵活控制，极大拓展了用户的创作空间。

4. 未来展望与行业竞争

谷歌此次发布的Veo 2和Imagen 3，以及创意工具Whisk，展示了其在AI图像和视频生成领域的领先地位，并预示着未来AI生成内容将更加高质量、更易于使用，并应用于更广泛的领域。同时，这也加剧了谷歌与OpenAI等公司在AI领域的竞争，未来将呈现更多创新和突破。

文章最后还列举了欧米伽未来研究所“未来知识库”中收录的100多篇关于前沿科技趋势的报告，涵盖人工智能、能源、经济、生物科技等多个领域，体现了对未来科技发展趋势的持续关注。

联系作者

文章来源：人工智能学家
作者微信：
作者简介：致力成为权威的人工智能科技媒体和前沿科技研究机构

阅读原文

# AIGC动态 # 4K视频AI生成 # AI视频生成模型 # Sora视频生成 # 谷歌AI视频生成技术 # 高分辨率AI视频生成

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...