标签:对象
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
新智元报道编辑:Aeneas 桃子 【新智元导读】斯坦福炒菜机器人的大火,开启了2024年机器人元年。最近,CMU研究团队推出了一款能在开放世界完成任务的机器人,...
买个机器人端茶倒水有希望了?Meta、纽约大学造了一个OK-Robot
机器之心报道 编辑:张倩、陈萍如果有个这样的机器人,你几点回家?「xx,去把电视柜上的遥控器帮我拿过来。」在一个家庭环境中,很多家庭成员都不免被支使干...
画个框、输入文字,面包即刻出现:AI开始在3D场景「无中生有」了
机器之心报道 编辑:陈萍现在,通过文本提示和一个 2D 边界框,我们就能在 3D 场景中生成对象。看到下面这张图了没?一开始,盘子里是没有东西的,但当你在托...
Agent触摸汉堡辨冷热,首次拥有类人感官!UCLA等发布3D多模态交互具身智能大模型
新智元报道编辑:桃子 好困 【新智元导读】Sam Altman认为AGI很快就会降临,但若是没有感官兼备的AI何以称为智能?最近,UCLA等机构研究人员提出多模态具身智...
杰克逊跳舞秒变3D机器人!阿里又出新活儿,视频任何人可替换
白交 发自 凹非寺量子位 | 公众号 QbitAI人形机器人跳舞复刻杰克逊,竟一点不逊色?? 这究竟是怎么回事? 原来啊,阿里又整出新活儿—— MotionShop,能将视频...
点击收获霉霉旗袍写真!阿里“AI替换万物”框架火爆社区,网友:偶像不需要真人了?
白交 发自 凹非寺量子位 | 公众号 QbitAIReplace Anything as you want。 现在只需框住你需要保留的区域,AI就可以替换万物了! 比如让霉霉穿上中国旗袍,结...
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
机器之心报道 机器之心编辑部「能不能把这张图里的产品,都放到另一张图的桌子上?」面对这样的要求,设计师肯定会脑瓜嗡嗡的。 把指定物品放进另一张图片不...
弥合2D和3D生成领域之间的次元壁,X-Dreamer实现高质量的文本到3D生成
机器之心专栏机器之心编辑部本文介绍了一个名为 X-Dreamer 的框架,它主要由CG-LoRA和AMA损失两种关键创新组成,实现了弥合 text-to-2D 和 text-to-3D 间的领...
CMU清华MIT引爆全球首个Agent无限流,机器人「007」加班自学停不下来!具身智能被
新智元报道编辑:Aeneas 好困【新智元导读】最近,由CMU/MIT/清华/Umass提出的全球首个生成式机器人智能体RoboGen,可以无限生成数据,让机器人7*24小时永不...
支持二次编辑、导入虚拟引擎5,Stable Diffusion进化出3D生成功能
机器之心报道编辑:杜伟、小舟从 2D 到 3D 图像生成,Stability AI 的文生图 Stable Diffusion 平台迎来了进化。说到文生图大模型,Stability AI 在 2022 年...
解决多模态大模型幻觉问题的秘密武器:“啄木鸟”免重训方法!哪里出问题啄哪里!
夕小瑶科技说 原创作者 | 付奶茶、王二狗最近多模态大模型的研究取得了巨大的进展。然而,这些模型在生成时存在着文本与图像不一致的问题,这个问题就是一直...
数学逻辑和计算机程序代码之间的深层联系:互为镜像
选自量子杂志机器之心编译编辑:Panda W数学证明=计算机程序?什么是柯里-霍华德对应?一些科学发现被赋予了重要的意义,因为揭示了一些新的东西,比如 DNA ...
百万网友围观DALL-E 3新玩法!钢铁侠特斯拉皆“中招”,症友好,博主分享提示词
白交 发自 凹非寺量子位 | 公众号 QbitAIDALL-E 3被网友们玩疯了!你见过这样的钢铁侠和蝙蝠侠吗?身体部件被大卸八块整齐地平铺在桌面上。虽然但是,看起来...
ChatGPT App重大进化!能看能听还会说,多模态模型细节同时公布
梦晨 发自 凹非寺量子位 | 公众号 QbitAIOpenAI连发两则重磅消息,首先ChatGPT可以看、听、说了。新版ChatGPT开启一种更直观的交互方式,可以向AI展示正在谈...
大模型的能力边界在哪里?来自范畴论视角的答案
导语如果用一个范畴论公式来描绘大模型的能力,它应该是什么样?本文作者、清华大学交叉信息学院助理教授袁洋给出了这样一个公式。他认为,现代科学基于数学...
12