实现灵活且高保真度的图像生成,同时保持身份特征。
生成高质量 SVG 代码的基础模型。
免费 AI 创作工具,生成图像、视频及 4K 增强。
WHAM 是微软开发的一种生成式游戏模型,用于生成游戏视觉和控制器动作。
用于衡量设备 AI 加速器推理性能的基准测试工具。
朱雀大模型检测,精准识别AI生成图像,助力内容真实性鉴别。
FLUX Pro Finetuning API 是一款用于定制化生成式图像模型的高级工具。
X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。
VideoLLaMA3是前沿的多模态基础模型,专注于图像和视频理解。
TokenVerse 是一种基于预训练文本到图像扩散模型的多概念个性化方法。
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。
Genime AI 是一款专注于动画生成与编辑的工具,提供图像到 3D、补间动画等功能。
Qwen2.5-VL 是一款强大的视觉语言模型,能够理解图像和视频内容并生成相应文本。
一个基于语音交互的故事创作聊天机器人,提供沉浸式的“选择你自己的冒险”体验。
Janus Pro 是一款先进的 AI 图像生成与理解平台,提供高质量的视觉智能服务。
OmniParser 是一款通用屏幕解析工具,可将 UI 截图转换为结构化格式,提升基于 LLM 的 UI 代理性能。
VisionAgent是一个用于生成代码以解决视觉任务的库,支持多种LLM提供商。
SigLIP2 是谷歌推出的一种多语言视觉语言编码器,用于零样本图像分类。
Adobe 推出全新 Photoshop iPhone 应用,为移动创作者重新定义图像编辑体验。
UniTok是一个用于视觉生成和理解的统一视觉分词器。
微软Copilot是您的AI助手,支持聊天、图像生成、文本编辑等功能,助力日常工作和生活。
Aya Vision 32B 是一个支持多语言的视觉语言模型,适用于OCR、图像描述、视觉推理等多种用途。
由 Google 训练的 AI 模型,用于对野生动物相机陷阱图像中的物种进行分类。
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
使用先进 AI 技术快速去除图片背景,无需手动编辑,提升工作效率。
即时匹配任何图像中的颜色
Inductive Moment Matching 是一种新型的生成模型,用于高质量图像生成。
一种无混叠的任意尺度超分辨率方法。
一个由moondream创建的Hugging Face Space,用于展示注视点相关技术
下一代AI创意工作室,支持视频和图像生成及编辑。
一种从2D图像学习3D人体生成的结构化潜在扩散模型。