一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。TokenFlow官网入口网址
MMTryon是一款多模态多参考虚拟试衣框架,能够生成高质量的组合试穿结果,支持多种试穿物品和穿衣风格定制,MMTryon官网入口网址
HoloDreamer是一款基于文本描述生成全景式3D场景的创新框架,支持多种风格的场景生成,视觉一致性强,重建质量高,HoloDreamer官网入口网址
腾讯和上交大出的,具有置信度感知姿势指导的高质量人体运动视频生成,MimicMotion可以生成任意长度、具有任何动作指导的高质量视频生成框架。MimicMotion官网入口网址
在多轮交互式图像生成中制作一致的主题,AutoStudio官网入口网址
PixArt-Σ是一款基于Diffusion Transformer的图文生成模型,能够直接生成4K分辨率的高保真图像,满足用户对高质量视觉内容的需求。,PixArt-Σ官网入口网址
文生3D数字人工具,借助 Make-A-Character,您可以毫不费力地从文本描述中生成可控、逼真、可动画的3D数字人角色。Make-A-Character官网入口网址