标签:视觉

追忆商汤科技汤晓鸥:告别一个有趣的灵魂|甲子光年

汤晓鸥教授,一路走好。作者|「甲子光年」内容团队‍‍‍“我不是在最好的时光遇见了你们,而是遇见了你们,我才有了这段最好的时光。”在今年7月举办的2023世界...
阅读原文

悼念!商汤创始人汤晓鸥逝世,享年55岁

金磊 发自 凹非寺量子位 | 公众号 QbitAI据多方消息证实,商汤科技创始人、香港中文大学教授汤晓鸥,在睡梦中不幸离世,享年55岁。有商汤人士称:你真的不知...
阅读原文

哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世

作者丨王悦编辑丨陈彩娴12 月 16 日中午,AI科技评论获悉:上海人工智能实验室主任、商汤科技创始人、香港中文大学信息工程学系教授汤晓鸥去世。经多位独立信...
阅读原文

LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界

新智元报道编辑:alan 润【新智元导读】近日,斯坦福的华人研究人员提出全新视频生成框架——WonderJourney,一句话或者一张图,即可自动生成一系列3D场景的连...
阅读原文

当GPT-4V充当机器人大脑,可能你都没AI会规划

机器之心专栏机器之心编辑部来自清华大学交叉信息研究院的研究者提出了「ViLa」(全称Robotic Vision-Language Planning)算法,其能在非常复杂的环境中控制...
阅读原文

一套参数,狂揽160个SOTA!厦大等重磅开源「视觉感知基础模型」APE

新智元报道编辑:LRS 好困【新智元导读】由厦门大学等机构提出的全新视觉感知基础模型APE,只需一个模型外加一套参数,就能在160个测试集上取得当前SOTA或极...
阅读原文

梅卡曼德联合创始人付翱:AI+3D开启更广阔的智能制造时代|甲子引力

3D技术与人工智能的结合真正实现从1到100的跨越。2023年11月30日-12月1日,中国科技产业智库「甲子光年」主办的「致追风赶月的你」2023甲子引力年终盛典在北...
阅读原文

首个精通3D任务的具身通才智能体:感知、推理、规划、行动统统拿下

机器之心专栏机器之心编辑部想要迈向通用人工智能,必须要构建一个能够理解人类生活的真实世界,并掌握丰富技能的具身通用智能体。今年以来,以 GPT-4 (V)[1]...
阅读原文

传字节月底推生成式AI开发平台;马斯克Grok一周左右向X订阅用户开放;王慧文入股大模型AI创企丨AIGC大事日报

12/04全球AIGC产业要闻1、传字节月底推出AI聊天机器人开发平台2、王慧文入股袁进辉旗下新AI创企3、马斯克Grok一周左右向X订阅用户开放4、传谷歌Gemini推迟至...
阅读原文

R-CNN作者Ross Girshick离职,何恺明、谢赛宁回归学界,Meta CV走出了多少大神

机器之心报道编辑:杜伟、陈萍Yann LeCun 表示:「人才离开 FAIR 是我们的损失,但自己仍为他们感到高兴」。FAIR 又一位大佬级研究科学家「出走了」,这次是 ...
阅读原文

通用视觉推理显现,UC伯克利炼出单一纯CV大模型,三位资深学者参与

机器之心报道机器之心编辑部仅靠视觉(像素)模型能走多远?UC 伯克利、约翰霍普金斯大学的新论文探讨了这一问题,并展示了大型视觉模型(LVM)在多种 CV 任...
阅读原文

计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

新智元报道编辑:编辑部【新智元导读】UC伯克利的CV三巨头推出首个无自然语言的纯视觉大模型,第一次证明纯CV模型也是可扩展的。更令人震惊的是,LVM竟然也能...
阅读原文

横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%

新智元报道编辑:LRS【新智元导读】哈工深发布全新多模态大语言模型九天(JiuTian-LION),融合细粒度空间感知和高层语义视觉知识,在13个评测任务上实现了so...
阅读原文

北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务

一个北大投稿 发送至 凹非寺量子位 | 公众号 QbitAI训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了...
阅读原文

训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解

机器之心专栏机器之心编辑部北京大学和中山大学等机构研究者提出了统一的视觉语言大模型 ——Chat-UniVi。通过构建图片和视频统一表征,该框架使得一个 LLM 能...
阅读原文
1131415161720