标签:物体

​优势显著!华南理工等团队AISY:新型光电皮肤赋能软抓手触觉感知

大数据文摘受权转载自机器人大讲堂 导读:触觉传感器是提升机器人对环境和物体认知能力的重要工具。对于机械手来说,集成大面积触觉传感器能增强其感知和交互...
阅读原文

ECCV 2024 | 比基准高30%,媲美Gemini 1.5 Pro,基于记忆的视频理解智能体来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

多篇3D生成顶会成果!斯坦福大学吴佳俊教授团队提出交互式3D世界生成 | 讲座预告

「智猩猩AI新青年讲座」由智猩猩出品,致力于邀请青年学者,主讲他们在生成式AI、LLM、AI Agent、CV等人工智能领域的最新重要研究成果。 AI新青年是加速人工...
阅读原文

李飞飞「空间智能」之后,上交、智源、北大等提出空间大模型SpatialBot

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

ICML 2024|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

“具身智能小镇”来了!机器人逛超市买菜满街跑,AI充当NPC,来自上海AI Lab

明敏 发自 凹非寺量子位 | 公众号 QbitAI超逼真的机器人小镇来了! 在这里,机器人可以像人一样在超市里购物: 买菜回家做饭: 在办公室里接咖啡(旁边还有人...
阅读原文

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能,你需要这种提示范式

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

机器人版的「斯坦福小镇」来了,专为具身智能研究打造

机器之心报道 编辑:张倩首个专为各种机器人设计的模拟互动 3D 社会。还记得斯坦福的 AI 小镇吗?这是斯坦福的 AI 研究者打造的一个虚拟环境。在这个小镇上,...
阅读原文

CVPR'24 Highlight|一个框架搞定人物动作生成,精细到手部运动

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

上交发布MG-LLaVA,基于多粒度指令调整,横扫视觉大模型榜单

夕小瑶科技说 原创作者 |Richard近年来多模态大语言模型(MLLMs)在视觉理解任务中取得了长足进步。然而,大多数模型仍局限于处理低分辨率图像,这限制了它们在...
阅读原文

靠Scaling Laws炼出4D版视频生成模型,多伦多大学北交大等携手开源81K高质量数据集

Diffusion4D团队 投稿量子位 | 公众号 QbitAI只需几分钟、一张图或一句话,就能完成时空一致的4D内容生成。 注意看,这些生成的3D物体,是带有动作变化的那种...
阅读原文

斯坦福博士助力,一年打造7亿融资独角兽!银河通用机器人创具身智能赛道天使轮融资纪录

新智元报道编辑:编辑部 【新智元导读】过去一年,美元在华投资大幅缩水,资本市场呈现「寒冬」态势。然而,在这样的背景下,这家中国公司成立仅一年却创纪录...
阅读原文

给NeRF开透视眼!稀疏视角下用X光进行三维重建,9类算法工具包全开源 | CVPR 2024

新智元报道编辑:LRST 【新智元导读】本文提出了SAX-NeRF框架,一种专为稀疏视角下X光三维重建设计的新型NeRF方法,通过Lineformer Transformer和MLG采样策略...
阅读原文

北大快手攻克复杂视频生成难题!新框架轻松组合各种细节,代码将开源

杨灵 投稿自 凹非寺量子位 | 公众号 QbitAI如何生成高难度、指令超复杂的视频呢? 北大与快手AI有解了,他们提出新框架VideoTetris,就像拼俄罗斯方块一样,...
阅读原文

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
1235