标签:图像生成

WPS接入DeepSeek,秒变办公神器!

WPS 大家经常用来日常写作,虽然本身提供了AI功能,但可惜需要会员,本文教你三分钟接入最火的DeepSeek,让WPS秒变办公神器。 DeepSeek API申请地址:http:/...
阅读原文

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

PlayDiffusion

PlayDiffusion是PlayAI推出的新型音频编辑模型,基于扩散模型技术,专门用在音频的精细编辑和修复。模型将音频编码为离散的标记序列,对需要修改的部分进行掩...

DGM

DGM(Darwin Gödel Machine)是自改进人工智能系统,通过迭代修改自身代码来提升性能。DGM从其维护的编码代理档案中选择一个代理,基于基础模型生成新版本,...
阅读原文

SignGemma

SignGemma 是谷歌 DeepMind 团队推出的全球最强大的手语翻译AI模型。专注于将美国手语(ASL)翻译成英语文本,通过多模态训练方法,结合视觉数据和文本数据,...
阅读原文

MiMo-VL

MiMo-VL 是小米开源的多模态大模型,由视觉编码器、跨模态投影层和语言模型构成,视觉编码器基于Qwen2.5-ViT,语言模型是小米自研的MiMo-7B。
阅读原文

Gemini Diffusion

Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini Diffusion...
阅读原文

Imagen 4

Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染方面...
阅读原文

BLIP3-o

BLIP3-o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像...
阅读原文

混元图像2.0

混元图像2.0(Hunyuan Image 2.0)是腾讯推出的业内首个毫秒级响应的实时生图大模型。混元图像2.0支持文本、语音、草图等多种交互方式,用户输入指令后,图像...
阅读原文

Pablo

Pablo是帮助用户快速创建品牌化网页的AI工具,用户只需上传SVG、PNG或JPG格式的Logo,Pablo能基于Logo的风格和元素,快速生成与品牌高度契合的网站设计。
阅读原文

Image-AI.pro

Image-AI.pro 是专业级的 AI 图像生成平台,基于强大的 img-v2 Pro 引擎驱动,能生成高质量、多风格的图像作品。具备高级语义理解能力,能精准捕捉用户的创作...
阅读原文

Pixelfox

Pixelfox 是免费的在线图片编辑工具,基于AI技术简化图片编辑过程。Pixelfox 提供多种功能,如背景移除、对象移除、图片增强、AI 修复、换脸、图片扩展和图像...
阅读原文

T2I-R1

T2I-R1 是香港中文大学和上海AI Lab联合推出的新型文本生成图像模型。基于引入双层推理机制,语义级链式思维(CoT)和 Token 级 CoT,实现高层次图像规划与低...
阅读原文

Firefly Image Model 4

Firefly Image Model 4 是 Adobe 最新推出的图像生成模型,是目前最快、最具控制性和最逼真的 Firefly 图像模型,支持生成逼真的图像,提供更高的分辨率(最...
阅读原文

GPT-image-1

GPT-image-1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功能...
阅读原文

PixelFlow

PixelFlow 是香港大学和Adobe联合推出的图像生成模型,支持直接在像素空间中生成图像。PixelFlow基于高效的级联流建模,从低分辨率逐步提升到高分辨率,显著...
阅读原文
1238