小红书等给AI图像检测上难度!数据集均通过人类感知“图灵测试” | ICLR 2025

AI图像鉴别新SOTA

小红书等给AI图像检测上难度!数据集均通过人类感知“图灵测试” | ICLR 2025

原标题:小红书等给AI图像检测上难度!数据集均通过人类感知图灵测试” | ICLR 2025
文章来源:量子位
内容字数:8370字

小红书团队联合高校推出AI生成图像检测新方法:AIDE

随着AI生成内容的普及,精准甄别AI生成图像成为迫切需求。小红书生态算法团队、中科大、上海交通大合推出了一套行业领先的AI生成图像检测方法——AIDE,并构建了高质量的Chameleon基准数据集,显著提升了AI生成图像检测的准确率。

1. 现有AI生成图像检测方法的局限性

现有的AI生成图像检测方法通常存在两个主要问题:评估基准过于简单,现有基准数据集中的图像通常包含一些人工痕迹(artifacts);训练数据的局限性,模型通常在一个特定的生成模型(如GAN或扩散模型)上进行训练,限制了其泛化能力。

2. Chameleon数据集:更真实,更具挑战性

为了解决上述问题,研究团队构建了Chameleon数据集,该数据集具有以下显著特点:

  1. 高度逼真性:所有AI生成图像均通过了人类感知“图灵测试”,人类标注者难以将其与真实图像区分。
  2. 多样化类别:涵盖人类、动物、物体和场景等多类图像,模拟现实世界场景。
  3. 高分辨率:图像分辨率普遍超过720P,最高可达4K,提供更丰富的细节信息。

Chameleon数据集的构建过程非常严谨,包括多渠道高逼真度图像获取、多维度精细化数据清洗(分辨率过滤、内容过滤、去重处理、文本-图像一致性过滤)以及专业标注平台与多轮评估。

与之前的基准数据集相比,Chameleon数据集在规模、多样性和图像质量方面均展现出显著优势,包含约26,000张测试图像,是目前最大的AI生成图像检测数据集之一。

3. AIDE模型:多专家融合的检测框架

AIDE模型(AI-generated Image DEtector with Hybrid Features)通过融合多种专家模块,从低级像素统计和高级语义两个层面全面捕捉图像特征,实现了对AI生成图像的精准检测。

AIDE模型主要由两个核心模块组成:

  1. Patchwise Feature Extraction (PFE) 模块:捕捉图像中的低级像素统计特征,例如噪声模式和纹理异常。
  2. Semantic Feature Embedding (SFE) 模块:捕捉图像中的高级语义特征,例如物体共现和上下文关系。

这两个模块提取的特征融合后,通过多层感知机(MLP)进行最终的分类预测。

4. 实验结果与结论

实验结果表明,AIDE模型在AIGCDetectBenchmark和GenImage数据集上取得了显著的性能提升,分别比现有的最先进方法提高了3.5%和4.6%的准确率。即使在更具挑战性的Chameleon数据集上,AIDE也取得了最佳性能,但这表明AI生成图像检测仍然具有很大的挑战性,需要进一步的研究和改进。

5. 未来工作

研究团队计划在未来工作中进一步优化模型架构,探索更高效的特征提取和融合方法,并扩大Chameleon数据集的规模,以推动AI生成图像检测技术的进一步发展。


联系作者

文章来源:量子位
作者微信:
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明
问小白满血版DeepSeek免费不限次数使用

相关文章

问小白满血版DeepSeek免费不限次数使用

暂无评论

暂无评论...