标签:图像生成

Fractal Generative Models

Fractal Generative Models(分形生成模型)是麻省理工学院计算机科学与人工智能实验室和Google DeepMind团队推出的新型图像生成方法。Fractal Generative Mo...
阅读原文

CogView4

CogView4 是智谱推出的开源文生图模型,具有60亿参数,支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一,达到开源文生图模型...
阅读原文

LCVD

LCVD(Lighting Controllable Video Diffusion Model)是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征(如身份和外观)与...
阅读原文

Bild AI

Bild AI 是专注于建筑行业的智能工具,基于人工智能技术读取和理解建筑蓝图,快速估算材料成本确保蓝图准确性。通过计算机视觉和自然语言处理技术,自动解析...
阅读原文

厦门大学《大模型概念、技术与应用实践》(PPT文件)

《大模型概念、技术与应用实践》由厦门大学大数据教学团队制作,科普大模型技术及其在各领域的应用。强调其在大数据教学领域的影响力。回顾人工智能发展简史...
阅读原文

图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和inference scaling新范式!

首次系统性地探讨了CoT在自回归图像生成中的适用性和潜在优势。
阅读原文

CogView-3-Flash

CogView-3-Flash 是智谱推出的首个免费AI图像生成模型,能根据文本描述生成高审美分数的图像,支持多种分辨率,满足专业领域需求。模型具备创意多样性,基于...
阅读原文

moonshot-v1-vision-preview

moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型,模型完善了 moonshot-v1 模型系列的多模态能力,具备强大的图像识别能力,能精准区分复杂...
阅读原文

EverArt

EverArt - AI绘画平台,支持训练自己的AI模型
阅读原文

TransPixar

TransPixar是香港中文大学、Adobe研究院 、香港科技大学和智能摩尔联合开源的,先进的文本到视频生成方法,扩展预训练的RGB视频模型生成包含透明度信息的RGBA...
阅读原文

何恺明团队新作Fluid:文生图质量刷新纪录

本文对自回归模型在文本生成图像任务中的扩展行为进行了实证研究。
阅读原文

PixVerse V3.5

PixVerse V3.5是爱诗科技推出的AI视频生成工具的最新版本,在性能和功能上都有显著提升。能在最快5秒内生成视频,显著增强了运动控制力,提供了更加流畅和精...
阅读原文

Poetry2Image

Poetry2Image是一个专为中文古诗词图像生成设计的迭代校正框架,哈尔滨工业大学提出。框架通过自动化的反馈和校正循环,增强了诗歌与图像之间的一致性,有效...
阅读原文

HelloMeme:面部表情与姿态迁移技术驱动的Stable Diffusion 1.5模型实现全新创作体验

HelloMeme是基于最新的Diffusion生成技术的框架,实现表情与姿态的迁移,HelloMeme集成空间编织注意力(Spatial Knitting Attentions)机制,基于Stable Diff...
阅读原文
12345610