标签:视频生成

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

ImmerseGen

ImmerseGen是字节跳动的PICO团队和浙江大学联合推出的创新3D世界生成框架。框架根据用户输入的文字提示,基于Agent引导的资产设计和排列,生成带有alpha纹理...
阅读原文

Next-Frame Diffusion

Next-Frame Diffusion(NFD)是北京大学和微软研究院联合推出的自回归视频生成模型,结合扩散模型的高保真生成能力和自回归模型的因果性和可控性。Next-Frame...
阅读原文

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型,基于视频数据实现对物理世界的理解、预测和规划。V-JEPA 2 用于 12 亿参数的联合嵌入预测架构(JEPA),基于自监督学习...
阅读原文

MiMo-VL

MiMo-VL 是小米开源的多模态大模型,由视觉编码器、跨模态投影层和语言模型构成,视觉编码器基于Qwen2.5-ViT,语言模型是小米自研的MiMo-7B。
阅读原文

Vid2World

Vid2World是清华大学联合重庆大学推出的创新框架,支持将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。模型基于视...
阅读原文

Runway Gen-4

Runway Gen-4 是 AI 初创公司 Runway推出的高保真AI视频生成模型。支持在多个场景中保持人物、物体和环境的一致性,无需额外精调或训练。用户提供一张参考图...
阅读原文

什么是视频扩散模型(Video Diffusion Models, VDM)

视频扩散模型(Video Diffusion Models, VDM)是一种结合了变分自编码器(VAE)和扩散模型优势的生成模型。VDM的核心思想是在潜在空间中进行扩散过程,而不是...
阅读原文

VideoVAE+

VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE),通过引入新的时空分离压缩机制和文本指导,实现了对大幅运...
阅读原文

颠覆视界:谷歌Sora深夜发布,4K视频生成新时代震撼来袭!

原标题:再度狙击OpenAI!“谷歌版”Sora深夜上线,4k视频生成时代来了 文章来源:人工智能学家 内容字数:7502字谷歌推出全新视频与图像生成模型 在今日凌晨,...
阅读原文

谷歌发布AI视频模型Veo2,王者归来

突破AI理解现实世界物理和运动瓶颈
阅读原文

Runway发布Gen-3 Alpha:开启视频生成新纪元,挑战Sora成为行业领先者

原标题:Runway发布Gen-3 Alpha:开启视频生成新纪元,挑战Sora成为行业领先者 文章来源:小夏聊AIGC 内容字数:2607字Runway推出Gen-3 Alpha:生成式AI视频...
阅读原文

OpenAI Sora引爆热潮:每段视频仅需2.9元,Altman预言视频生成的新时代来临!

原标题:OpenAI Sora上线即炸服、1条视频约2.9元,Altman:视频生成的GPT-1时刻来了! 文章来源:人工智能学家 内容字数:12174字OpenAI推出Sora Turbo,视频...
阅读原文
1234