视频生成 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

HunyuanVideo 1.5

HunyuanVideo 1.5 是腾讯混元团队开源的轻量级视频生成模型，参数规模为8.3B。模型基于Diffusion Transformer架构，支持通过文字描述或图片生成5-10秒的高清...

阅读原文

AI工具

8个月前

KAT-V1

KAT-V1是快手开源的自动思考（AutoThink）大模型，包含40B和200B两个版本。模型融合思考与非思考能力，能根据问题难度自动切换思考模式。40B版本性能逼近Deep...

阅读原文

AI工具

1年前 (2025)

WorldVLA

WorldVLA是阿里巴巴达摩院和浙江大学联合推出的自回归动作世界模型，模型将视觉-语言-动作（VLA）模型与世界模型整合到一个单一框架中。模型基于动作和图像理...

阅读原文

AI工具

1年前 (2025)

Qwen VLo

Qwen VLo 是通义千问团队推出的多模态统一理解与生成模型。在多模态大模型的基础上进行了全面升级，能“看懂”世界，能基于理解进行高质量的再创造，实现了从感...

阅读原文

AI工具

1年前 (2025)

Kwai Keye-VL

Kwai Keye-VL 是快手自主研发的多模态大语言模型，基于 Qwen3-8B 语言模型整合SigLIP初始化的视觉编码器，支持动态分辨率输入。模型能深度融合和处理文本、图...

阅读原文

AI工具

1年前 (2025)

ImmerseGen

ImmerseGen是字节跳动的PICO团队和浙江大学联合推出的创新3D世界生成框架。框架根据用户输入的文字提示，基于Agent引导的资产设计和排列，生成带有alpha纹理...

阅读原文

AI工具

1年前 (2025)

Next-Frame Diffusion

Next-Frame Diffusion（NFD）是北京大学和微软研究院联合推出的自回归视频生成模型，结合扩散模型的高保真生成能力和自回归模型的因果性和可控性。Next-Frame...

阅读原文

AI工具

1年前 (2025)

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型，基于视频数据实现对物理世界的理解、预测和规划。V-JEPA 2 用于 12 亿参数的联合嵌入预测架构（JEPA），基于自监督学习...

阅读原文

AI工具

1年前 (2025)

MiMo-VL

MiMo-VL 是小米开源的多模态大模型，由视觉编码器、跨模态投影层和语言模型构成，视觉编码器基于Qwen2.5-ViT，语言模型是小米自研的MiMo-7B。

阅读原文

AI工具

1年前 (2025)

Vid2World

Vid2World是清华大学联合重庆大学推出的创新框架，支持将全序列、非因果的被动视频扩散模型（VDM）转换为自回归、交互式、动作条件化的世界模型。模型基于视...

阅读原文

AI工具

1年前 (2025)

Runway Gen-4

Runway Gen-4 是 AI 初创公司 Runway推出的高保真AI视频生成模型。支持在多个场景中保持人物、物体和环境的一致性，无需额外精调或训练。用户提供一张参考图...

阅读原文

AI工具

1年前 (2025)

什么是视频扩散模型（Video Diffusion Models, VDM）

视频扩散模型（Video Diffusion Models, VDM）是一种结合了变分自编码器（VAE）和扩散模型优势的生成模型。VDM的核心思想是在潜在空间中进行扩散过程，而不是...

阅读原文

AI百科

2年前 (2025)

VideoVAE+

VideoVAE+（VideoVAE Plus）是香港科技大学团队推出的先进的跨模态视频变分自编码器（Video VAE），通过引入新的时空分离压缩机制和文本指导，实现了对大幅运...

阅读原文

AI工具

2年前 (2024)

颠覆未来出行：港中文、港科大与华为联手揭晓MagicDriveDiT的惊艳之旅

基于DiT架构设计

阅读原文

AIGC动态

2年前 (2024)

突破自动驾驶新纪元：港中文、港科大与华为携手推出MagicDriveDiT！

基于DiT架构设计

阅读原文

AIGC动态

2年前 (2024)

标签：视频生成