AI搞定谷歌验证码，最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队

AIGC动态3年前 (2023)发布量子位

AIGC动态欢迎阅读

原标题：AI搞定谷歌验证码，最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队

文章来源：量子位

内容字数：3999字

内容摘要：Michael 投稿自凹非寺量子位 | 公众号 QbitAI谷歌人机验证已经拦不住AI了！最新多模态大模型，能轻松找到图中所有交通信号灯，还准确圈出了具置。表现直接超越GPT-4V。这就是由苹果和哥伦比亚大学研究团队带来的多模态大模型“雪貂”（Ferret）。它具备更强的图文关联能力，提升了大模型在“看说答”任务中的精确度。比如下图中非常细小的部件（region 1），它也可以分辨出来是避震…

原文链接：点此阅读原文：AI搞定谷歌验证码，最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队