一种新的文本条件高分辨率生成模型
视频到音频生成模型,增强同步性
StemGen: 一款聆听音乐生成模型
盲图像恢复技术,利用即时生成参考图像恢复破损图像
SVD 1.1 Image-to-Video 模型生成短视频
生成多视角视频的模型
基于文本生成图像的多模态扩散变换器模型
长文本问答增强型检索生成模型
PixelCNN++是一种基于PixelCNN的生成模型,具有可计算的似然函数和易于采样的特点,适用于图像生成和数据增强等应用场景。,PixelCNN官网入口网址
Musenet (OpenAI)是一个基于深度神经网络的生成模型,可生成长度为4分钟,包含10种不同乐器和多种风格的音乐作品。该模型使用了类似于GPT-2的无监督学习方法,通过学习预测数十万...