标签：对象

CMU华人18万打造高能机器人，完爆斯坦福炒虾机器人！全自主操作，1小时学会开12种门

新智元报道编辑：Aeneas 桃子【新智元导读】斯坦福炒菜机器人的大火，开启了2024年机器人元年。最近，CMU研究团队推出了一款能在开放世界完成任务的机器人，...

阅读原文

AIGC动态

2年前 (2024)

买个机器人端茶倒水有希望了？Meta、纽约大学造了一个OK-Robot

机器之心报道编辑：张倩、陈萍如果有个这样的机器人，你几点回家？「xx，去把电视柜上的遥控器帮我拿过来。」在一个家庭环境中，很多家庭成员都不免被支使干...

阅读原文

AIGC动态

2年前 (2024)

画个框、输入文字，面包即刻出现：AI开始在3D场景「无中生有」了

机器之心报道编辑：陈萍现在，通过文本提示和一个 2D 边界框，我们就能在 3D 场景中生成对象。看到下面这张图了没？一开始，盘子里是没有东西的，但当你在托...

阅读原文

AIGC动态

2年前 (2024)

Agent触摸汉堡辨冷热，首次拥有类人感官！UCLA等发布3D多模态交互具身智能大模型

新智元报道编辑：桃子好困【新智元导读】Sam Altman认为AGI很快就会降临，但若是没有感官兼备的AI何以称为智能？最近，UCLA等机构研究人员提出多模态具身智...

阅读原文

AIGC动态

2年前 (2024)

杰克逊跳舞秒变3D机器人！阿里又出新活儿，视频任何人可替换

白交发自凹非寺量子位 | 公众号 QbitAI人形机器人跳舞复刻杰克逊，竟一点不逊色？？这究竟是怎么回事？原来啊，阿里又整出新活儿—— MotionShop，能将视频...

阅读原文

AIGC动态

2年前 (2024)

点击收获霉霉旗袍写真！阿里“AI替换万物”框架火爆社区，网友：偶像不需要真人了？

白交发自凹非寺量子位 | 公众号 QbitAIReplace Anything as you want。现在只需框住你需要保留的区域，AI就可以替换万物了！比如让霉霉穿上中国旗袍，结...

阅读原文

AIGC动态

2年前 (2024)

再也不怕合照缺人，Anydoor为图片编辑开了一道「任意门」

机器之心报道机器之心编辑部「能不能把这张图里的产品，都放到另一张图的桌子上？」面对这样的要求，设计师肯定会脑瓜嗡嗡的。把指定物品放进另一张图片不...

阅读原文

AIGC动态

3年前 (2023)

弥合2D和3D生成领域之间的次元壁，X-Dreamer实现高质量的文本到3D生成

机器之心专栏机器之心编辑部本文介绍了一个名为 X-Dreamer 的框架，它主要由CG-LoRA和AMA损失两种关键创新组成，实现了弥合 text-to-2D 和 text-to-3D 间的领...

阅读原文

AIGC动态

3年前 (2023)

CMU清华MIT引爆全球首个Agent无限流，机器人「007」加班自学停不下来！具身智能被

新智元报道编辑：Aeneas 好困【新智元导读】最近，由CMU/MIT/清华/Umass提出的全球首个生成式机器人智能体RoboGen，可以无限生成数据，让机器人7*24小时永不...

阅读原文

AIGC动态

3年前 (2023)

支持二次编辑、导入虚拟引擎5，Stable Diffusion进化出3D生成功能

机器之心报道编辑：杜伟、小舟从 2D 到 3D 图像生成，Stability AI 的文生图 Stable Diffusion 平台迎来了进化。说到文生图大模型，Stability AI 在 2022 年...

阅读原文

AIGC动态

3年前 (2023)

解决多模态大模型幻觉问题的秘密武器：“啄木鸟”免重训方法！哪里出问题啄哪里！

夕小瑶科技说原创作者 | 付奶茶、王二狗最近多模态大模型的研究取得了巨大的进展。然而，这些模型在生成时存在着文本与图像不一致的问题，这个问题就是一直...

阅读原文

AIGC动态

3年前 (2023)

数学逻辑和计算机程序代码之间的深层联系：互为镜像

选自量子杂志机器之心编译编辑：Panda W数学证明=计算机程序？什么是柯里-霍华德对应？一些科学发现被赋予了重要的意义，因为揭示了一些新的东西，比如 DNA ...

阅读原文

AIGC动态

3年前 (2023)

百万网友围观DALL-E 3新玩法！钢铁侠特斯拉皆“中招”，症友好，博主分享提示词

白交发自凹非寺量子位 | 公众号 QbitAIDALL-E 3被网友们玩疯了！你见过这样的钢铁侠和蝙蝠侠吗？身体部件被大卸八块整齐地平铺在桌面上。虽然但是，看起来...

阅读原文

AIGC动态

3年前 (2023)

ChatGPT App重大进化！能看能听还会说，多模态模型细节同时公布

梦晨发自凹非寺量子位 | 公众号 QbitAIOpenAI连发两则重磅消息，首先ChatGPT可以看、听、说了。新版ChatGPT开启一种更直观的交互方式，可以向AI展示正在谈...

阅读原文

AIGC动态

3年前 (2023)

大模型的能力边界在哪里？来自范畴论视角的答案

导语如果用一个范畴论公式来描绘大模型的能力，它应该是什么样？本文作者、清华大学交叉信息学院助理教授袁洋给出了这样一个公式。他认为，现代科学基于数学...

阅读原文

AIGC动态

3年前 (2023)