GPT-4V“大翻车”！把海豹识别成狗！分不清炸鸡和泰迪，葫芦娃也数不明白…

AIGC动态3年前 (2023)发布夕小瑶科技说

GPT-4V“大翻车”！把海豹识别成狗！分不清炸鸡和泰迪，葫芦娃也数不明白...

AIGC动态欢迎阅读

原标题：GPT-4V“大翻车”！把海豹识别成狗！分不清炸鸡和泰迪，葫芦娃也数不明白…
关键字：偏见,图像,干扰,幻觉,模型
文章来源：夕小瑶科技说
内容字数：5342字

内容摘要：

夕小瑶科技说原创作者 | 付奶茶、王二狗最近听说，“遥遥领先”的GPT-4V翻大车了！竟然把海豹识别成狗！而且还分不清炸鸡和泰迪！
下面是GPT-4V对狗子和海豹的识别结果：
另外微博大V王威廉测试了GPT-4V对炸鸡和泰迪的识别结果：
纳尼？GPT-4V这么菜?吗！
我们接着让GPT-4V识别一下葫芦娃！
完蛋！GPT-4V不认识这是葫芦娃！
不要紧，可能是GPT-4V的数据集中没见过葫芦娃，但是我给的图里面明明有7个葫芦娃，GPT-4V却说只有6个！GPT-4V看图识数的本领让人堪忧呀！
尽管GPT-4V在处理视觉和文本信息时非常厉害，但其产生幻觉的行为还没人进行系统性的评估。能不能对偏见和干扰做一个系统研究呢？
大模型“幻觉缺陷”研究最近，来自北卡罗来纳大学教堂山分校等机构的研究人员对大模型这类“幻觉缺陷”进行了系统性地总结，并提出了一个名为Bingo的新基准测试，用以评估视觉语言模型中的偏见和干扰挑战。
论文题目：
《Holistic Analysis of Hallucination in GPT-4V(ision):Bias and Interference Chall

原文链接：GPT-4V“大翻车”！把海豹识别成狗！分不清炸鸡和泰迪，葫芦娃也数不明白…