标签:图像
基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了
机器之心报道 机器之心编辑部这个模型和 Sora 一样采用了 DiT 框架。众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不...
深入解读Transformer扩散模型的先驱之作:DiT、PixArt、HDiT
智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场;分会场将进行具身...
微软Copilot生成暴力色情图且拒不更改,内部工程师绝望举报至政府!
不久前,Gemini 因为图像生成问题而关闭了文生图功能,现在微软也出现了“同样”的问题。 在微软供职六年的微软 AI 工程主管 Shane Jones 一直利用空闲时间测试...
一文看尽297篇文献!中科院领衔发表首篇「基于扩散模型的图像编辑」综述
新智元报道编辑:LRS 【新智元导读】AIGC大模型最火热的任务之一——基于Diffusion Model的图像编辑(editing)领域的首篇综述,长达26页,涵盖297篇文献!本文...
Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时
机器之心报道 机器之心编辑部Stability AI CEO Emad 表示他并不知情。Midjourney 把 Stability AI 拉入黑名单了,禁止后者所有员工使用其软件,直至另行通知...
中科院等万字详解:最前沿图像扩散模型综述
黄健成 投稿量子位 | 公众号 QbitAI针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。 全文长达26页,共1.5万余词,涵盖2...
Stable Diffusion 3技术报告出炉:揭露Sora同款架构细节
丰色 发自 凹非寺量子位 | 公众号 QbitAI很快啊,“文生图新王”Stable Diffusion 3的技术报告,这就来了。 全文一共28页,诚意满满。 “老规矩”,宣传海报(⬇️...
Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?
新智元报道编辑:润 【新智元导读】Stability AI放出了号称能暴打闭源模型的Stable Diffusion 3的技术报告,采用DiT构架的新模型在灵活性和性能上都达到了新...
Stable Diffusion 3 技术论文解读:开源能赢得文生图竞赛吗?|甲子光年
文生图模型的下一步是什么?作者|赵健 在大语言模型领域,闭源模型正在赢得比赛,无论是 OpenAI 还是刚刚发布新模型的 Anthropic,都是闭源模型的代表。 但...
Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?
机器之心报道 编辑:张倩在众多前沿成果都不再透露技术细节之际,Stable Diffusion 3 论文的发布显得相当珍贵。Stable Diffusion 3 的论文终于来了! 这个模...
最强文生图模型架构曝光!28页论文详解技术细节,与Sora“师出同门”
消费级显卡可训,模型权重将开源。 作者|香草 编辑|李水青 智东西3月6日报道,昨天下午,明星创企Stability AI发布Stable Diffusion 3(SD3)论文,首度披露...
单图0.5秒生成3D模型!Stability AI&华人团队VAST出品
允中 发自 凹非寺量子位 | 公众号 QbitAI无需GPU即可部署,0.5秒就能通过单张图片生成3D模型。 大语言模型风暴再起的一晚,3D生成领域也有新开源模型引发关注...
0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR
机器之心报道 机器之心编辑部最近,文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮,模型的多模态能力引起广泛关注。 现在,AI 模型在 3D 内容生成方面又...
揭秘美图AI局部重绘技术
作者| 美图影像研究院 最近,靠着出其不意的扩图效果,“AI 扩图”功能凭借搞笑的补全结果频频出圈,火爆全网。网友们踊跃尝试,180 度的大反转也让网友们直呼...
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
新智元报道编辑:桃子 【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘...