标签:图像

AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读

视频生成告别“抽卡”。 作者|香草 编辑|李水青 AI视频生成赛道风起云涌,国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下,当下的视频生成模...
阅读原文

Stable Diffusion原班人马官宣创业,最强开源文生图模型来了

今天,Stable Diffusion 原班人马官宣创业新公司。创始人是3月宣布从 Stability AI 出走的 Robin Rombach,Stable Diffusion 的两个主要作者之一。他和十多个...
阅读原文

Stable Diffusion原班人马新公司官宣!新模型一夜刷新AI绘画格局,已获2.3亿元融资

衡宇 发自 凹非寺量子位 | 公众号 QbitAI刚刚,Stable Diffusion原班人马官宣创业新公司! 3月宣布从Stability AI出走的Robin Rombach,就是Stable Diffusion...
阅读原文

全员离开老东家,Stable Diffusion一作带团创业,出手即击败MJ v6、SD3,还开源

机器之心报道 编辑:杜伟、佳琪AI 图像和视频生成领域又加入了一个颇有实力的玩家。还记得今年 3 月底,从 AI 初创公司 Stability AI 离职的研究科学家 Robin...
阅读原文

最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型

干翻SD3和MJ6!AI绘画黑马横空出世。 作者|香草 编辑|李水青 最强开源文生图模型一夜易主! 智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusio...
阅读原文

开放域检测新SOTA!中山大学美团出品,开源性能最强

王豪 投稿自 凹非寺量子位 | 公众号 QbitAI开放域检测领域,迎来新进展—— 中山大学联合美团提出新模型OV-DINO,实现开放域检测开源新SOTA! 比Grounding DINO...
阅读原文

对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024

新智元报道编辑:LRST 好困 【新智元导读】研究人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比...
阅读原文

Diffusion 反馈强势助力 CLIP 秒变火眼金睛:北京智源研究院、中科院自动化所联合推出 DIVA

本文分享论文Diffusion Feedback Helps CLIP See Better,专注于通过自监督学习范式解决CLIP无法区分细粒度视觉细节的问题。 作者:王文轩(中科院自动化所-...
阅读原文

教程上新 | 文生图、图生图、图像修复三合一神器, HiDiffusion 一键启动教程现已上线!

扩散模型已成为高分辨率图像合成的主流方法,传统的扩散模型虽然在图像合成方面取得了显著进展,但在扩展到更高分辨率时往往面临对象重复和计算成本增加的问...
阅读原文

Midjourney新版本上线即爆火!网友已玩疯:和摄影几乎没区别

明敏 发自 凹非寺量子位 | 公众号 QbitAIMidjourney v6.1刚刚发布立刻爆火! 各种人像大片,一气呵成。 画面、光线、人物表情动作……都更加逼近现实。 雕像的...
阅读原文

国产多模态卷上下文长度:原生支持24K图文输入输出,图像视频理解对标GPT4V

陈林 投稿自 凹非寺量子位 | 公众号 QbitAI国产多模态大模型,也开始卷上下文长度。 书生·浦语灵笔(InternLM-XComposer)多模态大模型升级2.5版本—— 原生支...
阅读原文

AI 视频生成器 Runway 推出新的图像转视频功能

点击上方蓝字关注我们Runway 现在利用其最新的 Gen-3 Alpha 模型支持图像转视频。用户可以使用任何图像作为创建视频的起点。图像可以单独使用,也可以与文本...
阅读原文

Meta「分割一切」进化2.0!一键跟踪物体,代码权重数据集全开源,网友:真正的OpenAI

明敏 发自 凹非寺量子位 | 公众号 QbitAI又是发布即开源! Meta“分割一切AI”二代SAM2在SIGGRAPH上刚刚亮相。 相较于上一代,它的能力从图像分割拓展到视频分...
阅读原文

防不胜防!AI几米外隔空窥屏,HDMI线把信号泄露到空气里了

一水 发自 凹非寺量子位 | 公众号 QbitAI防不胜防!黑客通过显示器数据线泄露的信号,就能偷窥你的屏幕内容。 具体来说,是HDMI数据线的电磁辐射,会把一些显...
阅读原文
18910111248