标签:图像
AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
视频生成告别“抽卡”。 作者|香草 编辑|李水青 AI视频生成赛道风起云涌,国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下,当下的视频生成模...
Stable Diffusion原班人马官宣创业,最强开源文生图模型来了
今天,Stable Diffusion 原班人马官宣创业新公司。创始人是3月宣布从 Stability AI 出走的 Robin Rombach,Stable Diffusion 的两个主要作者之一。他和十多个...
Stable Diffusion原班人马新公司官宣!新模型一夜刷新AI绘画格局,已获2.3亿元融资
衡宇 发自 凹非寺量子位 | 公众号 QbitAI刚刚,Stable Diffusion原班人马官宣创业新公司! 3月宣布从Stability AI出走的Robin Rombach,就是Stable Diffusion...
全员离开老东家,Stable Diffusion一作带团创业,出手即击败MJ v6、SD3,还开源
机器之心报道 编辑:杜伟、佳琪AI 图像和视频生成领域又加入了一个颇有实力的玩家。还记得今年 3 月底,从 AI 初创公司 Stability AI 离职的研究科学家 Robin...
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
干翻SD3和MJ6!AI绘画黑马横空出世。 作者|香草 编辑|李水青 最强开源文生图模型一夜易主! 智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusio...
开放域检测新SOTA!中山大学美团出品,开源性能最强
王豪 投稿自 凹非寺量子位 | 公众号 QbitAI开放域检测领域,迎来新进展—— 中山大学联合美团提出新模型OV-DINO,实现开放域检测开源新SOTA! 比Grounding DINO...
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
新智元报道编辑:LRST 好困 【新智元导读】研究人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比...
Diffusion 反馈强势助力 CLIP 秒变火眼金睛:北京智源研究院、中科院自动化所联合推出 DIVA
本文分享论文Diffusion Feedback Helps CLIP See Better,专注于通过自监督学习范式解决CLIP无法区分细粒度视觉细节的问题。 作者:王文轩(中科院自动化所-...
教程上新 | 文生图、图生图、图像修复三合一神器, HiDiffusion 一键启动教程现已上线!
扩散模型已成为高分辨率图像合成的主流方法,传统的扩散模型虽然在图像合成方面取得了显著进展,但在扩展到更高分辨率时往往面临对象重复和计算成本增加的问...
Midjourney新版本上线即爆火!网友已玩疯:和摄影几乎没区别
明敏 发自 凹非寺量子位 | 公众号 QbitAIMidjourney v6.1刚刚发布立刻爆火! 各种人像大片,一气呵成。 画面、光线、人物表情动作……都更加逼近现实。 雕像的...
国产多模态卷上下文长度:原生支持24K图文输入输出,图像视频理解对标GPT4V
陈林 投稿自 凹非寺量子位 | 公众号 QbitAI国产多模态大模型,也开始卷上下文长度。 书生·浦语灵笔(InternLM-XComposer)多模态大模型升级2.5版本—— 原生支...
AI 视频生成器 Runway 推出新的图像转视频功能
点击上方蓝字关注我们Runway 现在利用其最新的 Gen-3 Alpha 模型支持图像转视频。用户可以使用任何图像作为创建视频的起点。图像可以单独使用,也可以与文本...
Meta「分割一切」进化2.0!一键跟踪物体,代码权重数据集全开源,网友:真正的OpenAI
明敏 发自 凹非寺量子位 | 公众号 QbitAI又是发布即开源! Meta“分割一切AI”二代SAM2在SIGGRAPH上刚刚亮相。 相较于上一代,它的能力从图像分割拓展到视频分...
防不胜防!AI几米外隔空窥屏,HDMI线把信号泄露到空气里了
一水 发自 凹非寺量子位 | 公众号 QbitAI防不胜防!黑客通过显示器数据线泄露的信号,就能偷窥你的屏幕内容。 具体来说,是HDMI数据线的电磁辐射,会把一些显...