Parler-TTS
Parler-TTS是由Hugging Face推出的一款开源的文本到语音(TTS)模型,能够通过输入提示描述模仿特定说话者的风格(性别、音调、说话风格等),生成高质量、听...
ID-Animator
ID-Animator是由来自腾讯光子工作室、中科大和中科院合肥物质科学研究院的研究人员推出的一种零样本(zero-shot)人类视频生成技术,能够根据单张参考面部图...
VideoGigaGAN
VideoGigaGAN是由Adobe和马里兰大学的研究人员提出的一种新型的生成式视频超分辨率(VSR)模型,最高可将视频分辨率提升8倍,将模糊的视频放大为具有丰富细节...
Stable Artisan
Stable Artisan是Stability AI推出的一款基于Discord平台的机器人服务,利用其强大的AI技术和模型,如 Stable Diffusion 3 (SD3) 图像生成和 Stable Video Di...