标签:图像生成

PhotoMaker V2

PhotoMaker V2是腾讯推出的AI图像生成框架,能在极短的时间内生成逼真的人物照片。与初代相比,V2版本在角色的一致性和可控性上实现了显著提升,用户可以通过...
阅读原文

FlashFace

FlashFace是阿里联合香港大学推出的高保真AI写真工具。能基于用户提供的面部图像和文本提示,快速生成个性化的高保真人像写真图。FlashFace具备高保真度身份...
阅读原文

Imagen 3

Imagen 3是Google推出的AI图像生成模型,可以生成高质量、逼真的图像。Imagen 3对提示词理解更好,可捕捉更多细节,生成更广泛的视觉风格。基于谷歌的文生图...
阅读原文

Pixel Studio

Pixel Studio是谷歌推出的一款AI图像生成应用,专为Pixel 9系列手机预装设计。Pixel Studio基于Imagen 3模型,擅长快速生成艺术风格图片,仅需2秒即可创作出...
阅读原文

ControlNeXt

ControlNeXt是一种新型的AI图像和视频可控生成框架,由香港中文大学和商汤科技联合开发。采用轻量化控制模块和创新的交叉归一化技术,大幅降低计算资源和训练...
阅读原文

Fotographer AI

Fotographer AI是AI图像生成工具,快速生成专业产品图。通过AI技术,帮助用户节省摄影成本,快速生成专业级产品图像,同时提供广告模特图像。支持文本和模板...
阅读原文

DistriFusion

DistriFusion是高分辨率扩散模型的分布式并行推理框架,通过分布式并行推理显著加速了扩散模型在多个GPU上生成高分辨率图像的过程。DistriFusion利用patch pa...
阅读原文

mPLUG-Owl3

mPLUG-Owl3是阿里巴巴推出的先进通用多模态大模型,专为理解和处理多图及长视频设计。在保持准确性的同时,显著提升了推理效率,能在4秒内分析完2小时电影。
阅读原文

Freepik Mystic

Freepik Mystic是Magnific AI和Freepik联合推出的AI图像生成工具,能直接生成全高清图像,号称目前最先进的 AI 图像生成器。Freepik Mystic结合了Flux基础模...
阅读原文

CogView-3-Plus

CogView-3-Plus是智谱AI最新推出的AI文生图模型,采用Transformer架构替代传统UNet,优化了扩散模型的噪声规划。CogView-3-Plus在图像生成方面表现出色,能根...
阅读原文

Shutterstock AI

Shutterstock AI是Shutterstock与OpenAI合作推出的 AI 图像生成与编辑工具,为用户提供创意编辑和图像生成服务。用户可通过简单描述或文本提示,快速生成高质...
阅读原文

什么是生成模型(Generative Model)

生成模型(Generative Model)是一类能学习数据分布并生成新样本的机器学习模型。通过捕捉训练数据集中的模式,创建出与真实数据相似但从未出现过的新实例。...
阅读原文

什么是序列生成模型(Sequence Generation Models)

序列生成模型(Sequence Generation Models)是一类深度学习模型,专注于处理输入和输出均为序列数据的问题。通过学习序列中的时间依赖性和模式,用于生成新...
阅读原文

Stable Diffusion整合包

Stable Diffusion整合包是B站UP主秋葉aaaki发布的SD绘画本地部署解决方案,包含了Stable Diffusion WebUI、必要的运行环境、预装模型以及一些常用插件的集合...
阅读原文

Pixtral 12B

Pixtral 12B 是法国AI初创公司Mistral推出的首款多模态AI模型,能同时处理图像和文本。模型拥有 120 亿参数,模型大小约为 24GB,基于文本模型 Nemo 12B构建...
阅读原文