标签:物体

深层探索相对论中的尺缩效应:是物体自身真的变短了,还是测量结果变短了?

来源:宇宙探索未解之谜 “运动着的物体,其运动方向上的长度会变短”这句话经常出现在相对论科普中,虽然表述不太严谨,但作为科普来说,还是可以的,不过这也...
阅读原文

首个无师自通、泛化使用各种家具家电的具身三维图文大模型系统

机器之心专栏 机器之心编辑部这几天,家务活都被机器人抢着干了。 前脚来自斯坦福的会用锅的机器人刚刚登场,后脚又来了个会用咖啡机的机器人 Figure-01 。只...
阅读原文

告别逐一标注,一个提示实现批量图片分割,高效又准确

机器之心专栏 机器之心编辑部仅需一个任务描述,即可一键分割所有图片! Segment Anything Model (SAM) 的提出在图像分割领域引起了巨大的关注,其卓越的泛化...
阅读原文

让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接

机器之心专栏 机器之心编辑部来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架,让机器人学习通用的基于视觉的人机交接策略(generalizable vision-b...
阅读原文

「灌篮高手」模拟人形机器人,一比一照搬人类篮球招式,看一遍就能学会,无需特定任务的奖励

西风 发自 凹非寺量子位 | 公众号 QbitAI投篮、运球、手指转球…这个物理模拟人形机器人会打球: 会的招数还不少: 一通秀技下来,原来都是跟人学的,每个动作...
阅读原文

字节具身智能新成果:用大规模视频数据训练GR-1,复杂任务轻松应对

机器之心发布 机器之心编辑部如何利用大规模的视频数据来帮助机器人学习复杂任务? 最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上...
阅读原文

清华大学提出三维重建的新方法:O²-Recon,用2D扩散模型补全残缺的3D物体

机器之心专栏 机器之心编辑部在计算机视觉中,物体级别的三维表面重建技术面临诸多挑战。与场景级别的重建技术不同,物体级别的三维重建需要为场景中的每个物...
阅读原文

NeurIPS 2023|真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了

机器之心专栏机器之心编辑部最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 Lig...
阅读原文

当GPT-4V充当机器人大脑,可能你都没AI会规划

机器之心专栏机器之心编辑部来自清华大学交叉信息研究院的研究者提出了「ViLa」(全称Robotic Vision-Language Planning)算法,其能在非常复杂的环境中控制...
阅读原文

Meta AI新交互模型炸街:能在3D环境中连续模拟人类行为,并且可以精准交互,计算机图形学将迎来新突破?

整理|冬梅、核子可乐 CHOIS是一套先进的人工智能系统,用于合成逼真的 3D 人机交互。近日,斯坦福大学与 Meta/Facebook AI 研究(FAIR)实验室的工作人员共...
阅读原文

NeurIPS 2023|北京大学提出类别级6D物体位姿估计新范式,取得新SOTA

机器之心专栏作者:张继耀类别级 6D 物体位姿估计是一个基础且重要的问题,在机器人、虚拟现实和增强现实等领域应用广泛。本文中,来自北京大学的研究者提出...
阅读原文

用GPT-4V和人类演示训练机器人:眼睛学会了,手也能跟上

机器之心报道编辑:赵阳微软提出使用人手运动视频直接教机器人完成任务的新方法,这种方法使用 GPT-4V 分解视频中的动作,结合大语言模型生成对应的行为表述...
阅读原文

GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理

机器之心报道编辑:赵阳扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。为了解决这些问...
阅读原文

北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断|NeurIPS 2023

新智元报道编辑:LRS 好困【新智元导读】新方法结合扩散模型和强化学习,将抓取问题分解为「如何抓」以及「何时抓」,平价显卡即可实现实时交互。手是人类与...
阅读原文

浙大拿下唯一最佳论文奖,中国团队喜获三项大奖!ACM MultiMedia 2023奖项揭幕

新智元报道编辑:LRS【新智元导读】ACM MM 2023上中国团队获三项大奖,多媒体领域再获新突破。近日,2023 ACM MultiMedia会议落下帷幕,中国大陆团队在这次国...
阅读原文
13456