InstantCharacter 是一种基于扩散变换器的角色个性化框架。
Pusa 是一个新颖的视频扩散模型,支持多种视频生成任务。
InternVL3开源:7种尺寸覆盖文、图、视频处理,多模态能力扩展至工业图像分析
HiPixel 是一款用于 AI 驱动的图像超分辨处理的 macOS 桌面客户端应用。
基于扩散模型的多草图上色工具。
EVEAI XYZ提供便捷的AI图像生成服务,支持多种模型,高效创作个性化图像。
Graydient AI提供强大的AI图像和视频生成工具,支持无限创作并提供优质客户支持和云存储。
Dreamlike Art提供免费AI绘画服务,支持多种模型,快速生成高质量艺术作品。
生成高质量 SVG 代码的基础模型。
AI虚拟试衣间,试穿圣诞服装
将您的图片变成游戏
一种新颖的图像到视频采样技术,基于Hunyuan模型实现高质量视频生成。
Genime AI 是一款专注于动画生成与编辑的工具,提供图像到 3D、补间动画等功能。
VisionAgent是一个用于生成代码以解决视觉任务的库,支持多种LLM提供商。
UniTok是一个用于视觉生成和理解的统一视觉分词器。
HunyuanVideo-I2V 是腾讯推出的基于 HunyuanVideo 的图像到视频生成框架。
一种无混叠的任意尺度超分辨率方法。
SmolVLM-256M 是世界上最小的多模态模型,可高效处理图像和文本输入并生成文本输出。
olmOCR-7B-0225-preview 是一个基于 Qwen2-VL-7B-Instruct 微调的文档图像识别模型,用于高效转换文档为纯文本。
免费的在线图像分割工具,轻松将您的图像分割成多个部分。无论是用于设计、教学还是个人项目,我们的工具都提供简单易用的界面,让您快速完成任务。无需下载软件,随时随地在线使用,让图像处理变得高效又便捷。
免费领取1亿tokens,体验基于千亿级模型的AI开发新范式,高效便捷构建AI应用。
智谱清言:遵循中国社会主义价值观,提供AI赋能的多领域知识问答及文本生成服务。
开源自回归视觉生成模型项目
视频生成的前沿模型
为ComfyUI提供Luma AI API的自定义节点。
AI驱动的开发工作台
AI模型拖拽构建工具
解锁AI潜力,让应用更智能
一种从2D图像学习3D人体生成的结构化潜在扩散模型。
将图像转换为3D模型,可用于渲染、动画或3D打印。
一个基于Google Gemini 2.0的高精度OCR文字识别应用。
MangaNinja 是一种基于参考的线稿上色方法,可实现精确匹配和细粒度交互控制。