标签:图像

5秒完成3D生成,真香合成数据集已开源,上交港中文新框架超越Instant3D

陈林 投稿自 凹非寺量子位 | 公众号 QbitAI使用大模型合成的数据,就能显著提升3D生成能力? 来自上海交大、香港中文大学等团队还真做到了。 他们推出Bootstr...
阅读原文

中山大学和字节发布「视频虚拟试穿」扩散模型VITON-DiT,一键生成换装后视频!

夕小瑶科技说 原创作者 | 任同学 视频虚拟试穿技术日益受到关注,然而现有的工作局限于将服装图像转移到姿势和背景简单的视频上,对于随意拍摄的视频则效果不...
阅读原文

倒计时 3 天!立即预约苹果 WWDC24 直播;RLAIF-V 大规模多模态偏好数据集上线,有效减少不同 MLLMs 幻觉现象

Apple WWDC24 主题演讲将在北京时间 6 月 11 日(下周二)凌晨 1 点举行,HyperAI超神经将会在视频号和 B 站实时转播,立即预约不错过👇🏻 👀不想熬夜的小伙伴可...
阅读原文

ICML 2024 Oral|外部引导的深度聚类新范式

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

把整个地球装进神经网络,北航团队推出全球遥感图像生成模型

克雷西 发自 凹非寺量子位 | 公众号 QbitAI北航的研究团队,用扩散模型“复刻”了一个地球? 在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富...
阅读原文

CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院

K君 投稿量子位 | 公众号 QbitAI循环调用CLIP,无需额外训练就有效分割无数概念。 包括电影动漫人物,地标,品牌,和普通类别在内的任意短语。 牛津大学与谷...
阅读原文

多模态视觉-语言大模型的架构演进

直播预告 | 6月6日晚7点,「智猩猩AI新青年讲座」第238讲正式开讲,香港大学CVMI Lab在读博士 杨霁晗将直播讲解《V-IRL:根植于真实世界的AI Agents》,欢迎...
阅读原文

黄仁勋自曝英伟达最强Rubin架构;优必选人形机器人进入东风柳汽开展造车工作;马斯克称将购买30万块AI芯片丨AI情报局

01 融资快报Firefly.ai获2300万美元A轮融资:Firefly 开发了一个与 IaC 无关的代码生成引擎,利用AI技术来生成代码。本轮融资由祥峰投资Vertex、Hanaco Ventu...
阅读原文

北大、腾讯等联合发布!DynamiCrafter:任意图像秒变动态视频,超高清无缝衔接

作者:十九 编辑:李宝珠,三羊 由北大、腾讯 AI Lab 强强联手推出的 DynamiCrafter 能够模拟真实世界的运动模式,处理包括风景、人物、动物、交通工具、雕塑...
阅读原文

AI究竟是什么?这篇文章终于用大白话全说清楚了!

点击上方蓝字关注我们人工智能究竟是什么?简单来说,人工智能就像是模仿人类思考方式的软件。它既不等同于人类思维,也不比人类思维更好或更坏,但即便是对...
阅读原文

ControlNet作者搞起大模型:让天下没有难写的生图提示词,一句话变构图小作文

梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAIControlNet作者新项目,居然也搞起大模型和Agent了。 当然还是和AI绘画相关:解决大伙不会写提示词的痛点。 现...
阅读原文

今日arXiv最热大模型论文:13位作者,200篇文献,腾讯最新综述高效多模态大模型:性能要强,规模要小

夕小瑶科技说 原创作者 | 谢年年在过去一年里,多模态大语言模型(MLLMs)在视觉问答、视觉理解和推理等任务中展现了卓越性能。OpenAI的GPT-4V和Google的Gemi...
阅读原文

GPT-4o 引爆小红书打卡潮,推动 Vision Pro想象,刷新微软、Adobe 产品线

GPT-4o 多模态视觉能力激发多重想象。作者丨许一扬 编辑丨陈彩娴1小红书打卡潮GPT-4o 发布以后,虽然业内一片嘘声,小红书上却掀起了一股打卡热潮。社交媒体...
阅读原文

神笔马良画出三维世界,基于线稿的3D生成编辑方法SketchDream来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

任意模态输入输出?语音/文本/图像/音乐都拿下! 复旦提出AnyGPT:序列建模的统一多模态 LLM

直播预告 | 5月28日10点,「智猩猩AI新青年讲座」第236讲正式开讲,密歇根大学安娜堡分校在读博士生张挥杰将直播讲解《利用多级框架和多解码器架构提高扩散模...
阅读原文
1141516171848