标签：图像

深入解读Transformer扩散模型的先驱之作：DiT、PixArt、HDiT

智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场；分会场将进行具身...

阅读原文

AIGC动态

2年前 (2024)

微软Copilot生成暴力图且拒不更改，内部工程师绝望举报至！

不久前，Gemini 因为图像生成问题而关闭了文生图功能，现在微软也出现了“同样”的问题。在微软供职六年的微软 AI 工程主管 Shane Jones 一直利用空闲时间测试...

阅读原文

AIGC动态

2年前 (2024)

一文看尽297篇文献！中科院领衔发表首篇「基于扩散模型的图像编辑」综述

新智元报道编辑：LRS 【新智元导读】AIGC大模型最火热的任务之一——基于Diffusion Model的图像编辑（editing）领域的首篇综述，长达26页，涵盖297篇文献！本文...

阅读原文

AIGC动态

2年前 (2024)

Midjourney封禁Stability AI：恶意爬取数据，致服务器瘫痪24小时

机器之心报道机器之心编辑部Stability AI CEO Emad 表示他并不知情。Midjourney 把 Stability AI 拉入黑名单了，禁止后者所有员工使用其软件，直至另行通知...

阅读原文

AIGC动态

2年前 (2024)

中科院等万字详解：最前沿图像扩散模型综述

黄健成投稿量子位 | 公众号 QbitAI针对图像编辑中的扩散模型，中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。全文长达26页，共1.5万余词，涵盖2...

阅读原文

AIGC动态

2年前 (2024)

Stable Diffusion 3技术报告出炉：揭露Sora同款架构细节

丰色发自凹非寺量子位 | 公众号 QbitAI很快啊，“文生图新王”Stable Diffusion 3的技术报告，这就来了。全文一共28页，诚意满满。 “老规矩”，宣传海报（⬇️...

阅读原文

AIGC动态

2年前 (2024)

Stable Diffusion 3技术报告流出，Sora构架再立大功！生图圈开源暴打Midjourney和DALL·E 3？

新智元报道编辑：润【新智元导读】Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告，采用DiT构架的新模型在灵活性和性能上都达到了新...

阅读原文

AIGC动态

2年前 (2024)

Stable Diffusion 3 技术论文解读：开源能赢得文生图竞赛吗？｜甲子光年

文生图模型的下一步是什么？作者｜赵健在大语言模型领域，闭源模型正在赢得比赛，无论是 OpenAI 还是刚刚发布新模型的 Anthropic，都是闭源模型的代表。但...

阅读原文

AIGC动态

2年前 (2024)

Stable Diffusion 3论文终于发布，架构细节大揭秘，对复现Sora有帮助？

机器之心报道编辑：张倩在众多前沿成果都不再透露技术细节之际，Stable Diffusion 3 论文的发布显得相当珍贵。Stable Diffusion 3 的论文终于来了！这个模...

阅读原文

AIGC动态

2年前 (2024)

最强文生图模型架构曝光！28页论文详解技术细节，与Sora“师出同门”

消费级显卡可训，模型权重将开源。作者|香草编辑|李水青智东西3月6日报道，昨天下午，明星创企Stability AI发布Stable Diffusion 3（SD3）论文，首度披露...

阅读原文

AIGC动态

2年前 (2024)

单图0.5秒生成3D模型！Stability AI&华人团队VAST出品

允中发自凹非寺量子位 | 公众号 QbitAI无需GPU即可部署，0.5秒就能通过单张图片生成3D模型。大语言模型风暴再起的一晚，3D生成领域也有新开源模型引发关注...

阅读原文

AIGC动态

2年前 (2024)

0.5秒，无需GPU，Stability AI与华人团队VAST开源单图生成3D模型TripoSR

机器之心报道机器之心编辑部最近，文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮，模型的多模态能力引起广泛关注。现在，AI 模型在 3D 内容生成方面又...

阅读原文

AIGC动态

2年前 (2024)

揭秘美图AI局部重绘技术

作者| 美图影像研究院最近，靠着出其不意的扩图效果，“AI 扩图”功能凭借搞笑的补全结果频频出圈，火爆全网。网友们踊跃尝试，180 度的大反转也让网友们直呼...

阅读原文

AIGC动态

2年前 (2024)

谷歌发布最新「读屏」AI！PaLM 2-S自动生成数据，多项理解任务刷新SOTA

新智元报道编辑：桃子【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型，能够完成各种屏幕QA问答、总结摘...

阅读原文

AIGC动态

2年前 (2024)

2张图2秒钟3D重建！这款AI工具火爆GitHub，网友：忘掉Sora

丰色发自凹非寺量子位 | 公众号 QbitAI只需2张图片，无需测量任何额外数据—— 当当，一个完整的3D小熊就有了：这个名为DUSt3R的新工具，火得一塌糊涂，才上...

阅读原文

AIGC动态

2年前 (2024)

1…24 252627 28…48