标签:视觉

谷歌Gemini扳回一局!多模态能力和GPT-4V不分伯仲|港中文128页全面测评报告

happy投稿量子位 | 公众号 QbitAI谷歌扳回一局! 在Gemini开放API不到一周的时间,港中文等机构就完成评测,联合发布了多达128页的报告,结果显示: 在37个视...
阅读原文

再见,汤晓鸥

一位伟大而丰盈的灵魂离去了。▲CVPR 2009最佳论文奖获奖论文截图 这是中国人工智能学术界一篇具有里程碑领域的论文——2009年,世界计算机视觉顶级学术会CVPR创...
阅读原文

清华提出ViLa,揭秘 GPT-4V 在机器人视觉规划中的潜力

夕小瑶科技说 原创作者 | 智商掉了一地、兔子酱人类在面对简洁的语言指令时,可以根据上下文进行一连串的操作。对于“拿一罐可乐”的指令,若可乐近在眼前,下...
阅读原文

追忆商汤科技汤晓鸥:告别一个有趣的灵魂|甲子光年

汤晓鸥教授,一路走好。作者|「甲子光年」内容团队‍‍‍“我不是在最好的时光遇见了你们,而是遇见了你们,我才有了这段最好的时光。”在今年7月举办的2023世界...
阅读原文

悼念!商汤创始人汤晓鸥逝世,享年55岁

金磊 发自 凹非寺量子位 | 公众号 QbitAI据多方消息证实,商汤科技创始人、香港中文大学教授汤晓鸥,在睡梦中不幸离世,享年55岁。有商汤人士称:你真的不知...
阅读原文

哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世

作者丨王悦编辑丨陈彩娴12 月 16 日中午,AI科技评论获悉:上海人工智能实验室主任、商汤科技创始人、香港中文大学信息工程学系教授汤晓鸥去世。经多位独立信...
阅读原文

LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界

新智元报道编辑:alan 润【新智元导读】近日,斯坦福的华人研究人员提出全新视频生成框架——WonderJourney,一句话或者一张图,即可自动生成一系列3D场景的连...
阅读原文

当GPT-4V充当机器人大脑,可能你都没AI会规划

机器之心专栏机器之心编辑部来自清华大学交叉信息研究院的研究者提出了「ViLa」(全称Robotic Vision-Language Planning)算法,其能在非常复杂的环境中控制...
阅读原文

一套参数,狂揽160个SOTA!厦大等重磅开源「视觉感知基础模型」APE

新智元报道编辑:LRS 好困【新智元导读】由厦门大学等机构提出的全新视觉感知基础模型APE,只需一个模型外加一套参数,就能在160个测试集上取得当前SOTA或极...
阅读原文

梅卡曼德联合创始人付翱:AI+3D开启更广阔的智能制造时代|甲子引力

3D技术与人工智能的结合真正实现从1到100的跨越。2023年11月30日-12月1日,中国科技产业智库「甲子光年」主办的「致追风赶月的你」2023甲子引力年终盛典在北...
阅读原文

首个精通3D任务的具身通才智能体:感知、推理、规划、行动统统拿下

机器之心专栏机器之心编辑部想要迈向通用人工智能,必须要构建一个能够理解人类生活的真实世界,并掌握丰富技能的具身通用智能体。今年以来,以 GPT-4 (V)[1]...
阅读原文

传字节月底推生成式AI开发平台;马斯克Grok一周左右向X订阅用户开放;王慧文入股大模型AI创企丨AIGC大事日报

12/04全球AIGC产业要闻1、传字节月底推出AI聊天机器人开发平台2、王慧文入股袁进辉旗下新AI创企3、马斯克Grok一周左右向X订阅用户开放4、传谷歌Gemini推迟至...
阅读原文

R-CNN作者Ross Girshick离职,何恺明、谢赛宁回归学界,Meta CV走出了多少大神

机器之心报道编辑:杜伟、陈萍Yann LeCun 表示:「人才离开 FAIR 是我们的损失,但自己仍为他们感到高兴」。FAIR 又一位大佬级研究科学家「出走了」,这次是 ...
阅读原文

通用视觉推理显现,UC伯克利炼出单一纯CV大模型,三位资深学者参与

机器之心报道机器之心编辑部仅靠视觉(像素)模型能走多远?UC 伯克利、约翰霍普金斯大学的新论文探讨了这一问题,并展示了大型视觉模型(LVM)在多种 CV 任...
阅读原文

计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

新智元报道编辑:编辑部【新智元导读】UC伯克利的CV三巨头推出首个无自然语言的纯视觉大模型,第一次证明纯CV模型也是可扩展的。更令人震惊的是,LVM竟然也能...
阅读原文
1101112131417