GPT-4V“大翻车”!把海豹识别成狗!分不清炸鸡和泰迪,葫芦娃也数不明白…

GPT-4V“大翻车”!把海豹识别成狗!分不清炸鸡和泰迪,葫芦娃也数不明白...

AIGC动态欢迎阅读

原标题:GPT-4V“大翻车”!把海豹识别成狗!分不清炸鸡和泰迪,葫芦娃也数不明白…
关键字:偏见,图像,干扰,幻觉,模型
文章来源:夕小瑶科技说
内容字数:5342字

内容摘要:


夕小瑶科技说 原创作者 | 付奶茶、王二狗最近听说,“遥遥领先”的GPT-4V翻大车了!竟然把海豹识别成狗!而且还分不清炸鸡和泰迪!
下面是GPT-4V对狗子和海豹的识别结果:
另外微博大V王威廉测试了GPT-4V对炸鸡和泰迪的识别结果:
纳尼?GPT-4V这么菜🐶吗!
我们接着让GPT-4V识别一下葫芦娃!
完蛋!GPT-4V不认识这是葫芦娃!
不要紧,可能是GPT-4V的数据集中没见过葫芦娃,但是我给的图里面明明有7个葫芦娃,GPT-4V却说只有6个!GPT-4V看图识数的本领让人堪忧呀!
尽管GPT-4V在处理视觉和文本信息时非常厉害,但其产生幻觉的行为还没人进行系统性的评估。能不能对偏见和干扰做一个系统研究呢?
大模型“幻觉缺陷”研究最近,来自北卡罗来纳大学教堂山分校等机构的研究人员对大模型这类“幻觉缺陷”进行了系统性地总结,并提出了一个名为Bingo的新基准测试,用以评估视觉语言模型中的偏见和干扰挑战。
论文题目:
《Holistic Analysis of Hallucination in GPT-4V(ision):Bias and Interference Chall


原文链接:GPT-4V“大翻车”!把海豹识别成狗!分不清炸鸡和泰迪,葫芦娃也数不明白…

联系作者

文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:更快的AI前沿,更深的行业洞见。聚集25万AI应用开发者、算法工程师和研究人员。一线作者均来自清北、国外顶级AI实验室和互联网大厂,兼备媒体sense与技术深度。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...