标签:图像

浙江大学发布全能多模态大模型OmniBind,刷榜13大benchmark

夕小瑶科技说 原创作者 | Richard在人工智能快速发展的今天,多模态大模型成为了研究的热点。近日,浙江大学的研究团队在这一领域取得了重大突破,发布了名为...
阅读原文

马斯克化身「超市大盗」?AI监控画面流出惊呆网友,Grok 2恶搞无限脑洞

新智元报道编辑:编辑部 【新智元导读】惊爆!马斯克在某超市做「小偷」,当场被摄像头拍下,是真还是假,没人说得清。Grok被发现没有护栏后,网友们直接冲爆...
阅读原文

玩疯了,NSFW、毫无底线,FLUX 成为图片生成新王者

昨天马斯克的 Grok-2 发布,加入了 FLUX 模型提供的文生图能力。一夜之间,FLUX 毫无底线的图片血洗 X(推特)。 自从 Google 把美国开国总统和印第安人都画...
阅读原文

在线教程 | 仅需 1 张图片即可生成完整绘画过程,Lvmin Zhang 新作 Paints-Undo 上线!

作者:小贝 编辑:十九 ControlNet 作者张吕敏 (Lvmin Zhang) 开发了名为 Paints-Undo 的新项目,能够快速拆解任意图像的绘画过程,帮助初学者更好地理解不同...
阅读原文

首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策

新智元报道编辑:alan 【新智元导读】近日,来自佐治亚理工学院的研究人员开发了RTNet,首次表明其「思考方式」与人类非常相似。从能力上来讲,当前AI的专业...
阅读原文

AI出图更快、更美、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?

随着大模型的落地按下加速键,文生图无疑是最火热的应用方向之一。 自从 Stable Diffusion 诞生以来,海内外的文生图大模型层出不穷,一时有「神仙打架」之感...
阅读原文

比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型

新智元报道编辑:alan 【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美...
阅读原文

2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症

新智元报道编辑:LRST 好困 【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有...
阅读原文

AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图

明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAI赛博照妖镜下,AI美女全变鬼。 来看它的牙。 把图像饱和度拉满,AI人像的牙齿就会变得非常诡异,边界模糊不清...
阅读原文

超越恐怖谷!全球500万网友被骗,爆火TEDx演讲者没一个是真人?

新智元报道编辑:Aeneas 好困 【新智元导读】最近,这几位TED演讲者,在外网形成了病毒式传播,然而,他们竟然全都不是真人?!答案揭晓后,五百万网友简直惊...
阅读原文

这个开源文生图只需要在笔记本上运行,但效果超过了Midjourney

点击上方蓝字关注我们“摘要:Flux AI图像生成模型由Black Forest Labs推出,开源且性能优越,与市场领导者Midjourney竞争,支持多平台使用,提供专业版、Dev...
阅读原文

两篇论文同时获最佳论文荣誉提名,SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界

机器之心报道 机器之心编辑部专注于计算机图形学的全球学术顶会 SIGGRAPH,正在出现新的趋势。 在上周举行的 SIGGRAPH 2024 大会上,最佳论文等奖项中,来自...
阅读原文

AI顶会KDD’24今日截稿!Llama 3.1中文微调数据集已上线,超大模型一键部署

7 月的 AI 圈真是卷完小模型卷大模型,精彩不停!大多数同学都能体验 GPT-4o、Mistral-Nemo 这样的小模型,但 Llama-3.1-405B 和 Mistral-Large-2 这样的超大...
阅读原文

ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准

新智元报道编辑:乔杨 【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足...
阅读原文
1789101148