标签:视觉

击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三

机器之心报道 机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。 最新评测结果显示,云从科技的从容...
阅读原文

计算机视觉华人史:权龙与他的学生们

他们见证了 3D 视觉的崛起故事,也是故事的本身。作者 | 赖文昕 编辑 | 陈彩娴 「简单,是终极的复杂。」1群星闪耀时1988 年的冬天,一辆火车从法国出发、开...
阅读原文

完全开源!谢赛宁发布最新SOTA多模态模型Cambrian-1,“不与GPT-4V媲美”

夕小瑶科技说 原创作者 | 21# 6月15日,智源大会「多模态大模型」论坛中,纽约大学助理教授谢赛宁从哲学的角度出发,分享了AI是否需要更强的视觉基础来实现理...
阅读原文

LeCun谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V

新智元报道编辑:编辑部 【新智元导读】近日,LeCun和谢赛宁等大佬,共同提出了这一种全新的SOTA MLLM——Cambrian-1。开创了以视觉为中心的方法来设计多模态模...
阅读原文

视觉AI的「Foundation Model」,已经发展到哪一步?丨CVPR 2024现场直击

大数据文摘授权转载自AI科技评论 作者:房晓楠 编辑:陈彩娴 2024 年美国时间 6 月 17 日至 21 日,IEEE 国际计算机视觉与模式识别会议(CVPR)在美国西雅图...
阅读原文

视觉 AI 的「Foundation Model」,已经发展到哪一步?丨CVPR 2024 现场直击

CVPR 不再只是一个纯粹的学术会议,也是产业发展的嗅觉源。作者|房晓楠 编辑|陈彩娴 2024 年美国时间 6 月 17 日至 21 日,IEEE 国际计算机视觉与模式识别...
阅读原文

微软Florence-2官宣开源,一统视觉基础模型!华人团队联手打造

新智元报道编辑:桃子 【新智元导读】等了半年,微软视觉基础模型Florence-2终于开源了。它能够根据提示,完成字幕、对象检测、分割等各种计算机视觉和语言的...
阅读原文

GPT-4o一夜被赶超!Anthropic推出Claude 3.5,网友3分钟克隆马里奥游戏

OpenAI劲敌出手,追击GPT-4o。 编译|李水青 编辑|心缘 一夜之间,刚封神的GPT-4o被赶超了。 智东西6月21日报道,昨日晚间,Anthropic推出了新一代大模型Claud...
阅读原文

Claude 3.5 发布!性能超越GPT-4o和Claude 3 Opus!

夕小瑶科技说 原创作者 | 醒醒Claude大模型又双叒叕更新升级了!刚刚,OpenAI最强对手Anthropic官宣了Claude 3.5 系列的第一个大模型——Claude 3.5 Sonnet。 ...
阅读原文

智源独家丨谢赛宁:AI是否需要更强的视觉基础来实现理解和意义?

来源:智源社区 6 月 15 日,万众瞩目的智源大会「多模态大模型」论坛轰动举行。纽约大学助理教授谢赛宁从哲学的角度出发,针对大语言时代的视觉表征研究娓娓...
阅读原文

北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

CVPR 2024现场观察:随处可见的华人面孔和最热的三大研究领域|甲子光年

在凉爽的西雅图,屋子太小,CVPR太火。作者|苏霍伊‍ 编辑|王博 发自美国西雅图 美国当地时间6月19日,2024年IEEE国际计算机视觉与模式识别会议(CVPR)的最...
阅读原文

超1.2万人参加CVPR 2024,谷歌研究院获得最佳论文

大数据文摘授权转载自AI科技评论 作者:赖文昕、马蕊蕾 编辑:陈彩娴 北京时间今天凌晨,美国西雅图正在召开的计算机视觉盛会 CVPR 2024 正式公布了最佳论文...
阅读原文

超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文

视觉基础模型与文生视频成为 CVPR 2024 两大热点。作者丨赖文昕 马蕊蕾 编辑丨陈彩娴 北京时间今天凌晨,美国西雅图正在召开的计算机视觉盛会 CVPR 2024 正式...
阅读原文

商汤披露:50篇论文入选CVPR 2024

一水 发自 凹非寺量子位 | 公众号 QbitAICVPR正在进行中,中国科研力量再次成为场内外焦点之一。 日前,AI顶会常客选手商汤科技,已经披露了今年成绩单:50篇...
阅读原文
14567819