AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队

AIGC动态1年前 (2023)发布 量子位
19 0 0

AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队

AIGC动态欢迎阅读

原标题:AI搞定谷歌验证码,最新多模态大模型GPT-4V空间理解更准确 | 苹果AI/ML团队

关键字:模型,区域,坐标,图像,特征

文章来源:量子位

内容字数:3999字

内容摘要:Michael 投稿自 凹非寺量子位 | 公众号 QbitAI谷歌人机验证已经拦不住AI了!最新多模态大模型,能轻松找到图中所有交通信号灯,还准确圈出了具体位置。表现直接超越GPT-4V。这就是由苹果和哥伦比亚大学研究团队带来的多模态大模型“雪貂”(Ferret)。它具备更强的图文关联能力,提升了大模型在“看说答”任务中的精确度。比如下图中非常细小的部件(region 1),它也可以分辨出来是避震…

原文链接:点此阅读原文:AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...