标签：图像

AI画家的「滑铁卢」：为什么冰可乐不愿意住进茶杯里？

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

阿里发“神笔马良版Sora”，轻轻一抹让猫咪转向，20个演示视频+10页技术报告解读

视频生成告别“抽卡”。作者|香草编辑|李水青 AI视频生成赛道风起云涌，国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下，当下的视频生成模...

阅读原文

AIGC动态

2年前 (2024)

Stable Diffusion原班人马官宣创业，最强开源文生图模型来了

今天，Stable Diffusion 原班人马官宣创业新公司。创始人是3月宣布从 Stability AI 出走的 Robin Rombach，Stable Diffusion 的两个主要作者之一。他和十多个...

阅读原文

AIGC动态

2年前 (2024)

Stable Diffusion原班人马新公司官宣！新模型一夜刷新AI绘画格局，已获2.3亿元融资

衡宇发自凹非寺量子位 | 公众号 QbitAI刚刚，Stable Diffusion原班人马官宣创业新公司！ 3月宣布从Stability AI出走的Robin Rombach，就是Stable Diffusion...

阅读原文

AIGC动态

2年前 (2024)

全员离开老东家，Stable Diffusion一作带团创业，出手即击败MJ v6、SD3，还开源

机器之心报道编辑：杜伟、佳琪AI 图像和视频生成领域又加入了一个颇有实力的玩家。还记得今年 3 月底，从 AI 初创公司 Stability AI 离职的研究科学家 Robin...

阅读原文

AIGC动态

2年前 (2024)

最强开源文生图模型一夜易主！SD原班人马打造，要发SOTA视频生成模型

干翻SD3和MJ6！AI绘画黑马横空出世。作者|香草编辑|李水青最强开源文生图模型一夜易主！智东西8月2日报道，昨日晚间，开源文生图模型霸主Stable Diffusio...

阅读原文

AIGC动态

2年前 (2024)

开放域检测新SOTA！中山大学美团出品，开源性能最强

王豪投稿自凹非寺量子位 | 公众号 QbitAI开放域检测领域，迎来新进展—— 中山大学联合美团提出新模型OV-DINO，实现开放域检测开源新SOTA！比Grounding DINO...

阅读原文

AIGC动态

2年前 (2024)

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 | ACM MM2024

新智元报道编辑：LRST 好困【新智元导读】研究人员提出了一种新颖的多步误差最小化（MEM）方法，用于生成多模态不可学习样本，以保护个人数据不被多模态对比...

阅读原文

AIGC动态

2年前 (2024)

Diffusion 反馈强势助力 CLIP 秒变火眼金睛：北京智源研究院、中科院自动化所联合推出 DIVA

本文分享论文Diffusion Feedback Helps CLIP See Better，专注于通过自监督学习范式解决CLIP无法区分细粒度视觉细节的问题。作者：王文轩（中科院自动化所-...

阅读原文

AIGC动态

2年前 (2024)

教程上新 | 文生图、图生图、图像修复三合一神器， HiDiffusion 一键启动教程现已上线！

扩散模型已成为高分辨率图像合成的主流方法，传统的扩散模型虽然在图像合成方面取得了显著进展，但在扩展到更高分辨率时往往面临对象重复和计算成本增加的问...

阅读原文

AIGC动态

2年前 (2024)

Midjourney新版本上线即爆火！网友已玩疯：和摄影几乎没区别

明敏发自凹非寺量子位 | 公众号 QbitAIMidjourney v6.1刚刚发布立刻爆火！各种人像大片，一气呵成。画面、光线、人物表情动作……都更加逼近现实。雕像的...

阅读原文

AIGC动态

2年前 (2024)

国产多模态卷上下文长度：原生支持24K图文输入输出，图像视频理解对标GPT4V

陈林投稿自凹非寺量子位 | 公众号 QbitAI国产多模态大模型，也开始卷上下文长度。书生·浦语灵笔（InternLM-XComposer）多模态大模型升级2.5版本—— 原生支...

阅读原文

AIGC动态

2年前 (2024)

AI 视频生成器 Runway 推出新的图像转视频功能

点击上方蓝字关注我们Runway 现在利用其最新的 Gen-3 Alpha 模型支持图像转视频。用户可以使用任何图像作为创建视频的起点。图像可以单独使用，也可以与文本...

阅读原文

AIGC动态

2年前 (2024)

Meta「分割一切」进化2.0！一键跟踪物体，代码权重数据集全开源，网友：真正的OpenAI

明敏发自凹非寺量子位 | 公众号 QbitAI又是发布即开源！ Meta“分割一切AI”二代SAM2在SIGGRAPH上刚刚亮相。相较于上一代，它的能力从图像分割拓展到视频分...

阅读原文

AIGC动态

2年前 (2024)

防不胜防！AI几米外隔空窥屏，HDMI线把信号泄露到空气里了

一水发自凹非寺量子位 | 公众号 QbitAI防不胜防！黑客通过显示器数据线泄露的信号，就能偷窥你的屏幕内容。具体来说，是HDMI数据线的电磁辐射，会把一些显...

阅读原文

AIGC动态

2年前 (2024)

1…8 91011 12…48