首次引入GPT-4o！图像自动评估新基准来啦

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：首次引入GPT-4o！图像自动评估新基准来啦
关键字：图像,人类,团队,数据,评分
文章来源：量子位
内容字数：0字

内容摘要：

DreamBench++团队投稿量子位 | 公众号 QbitAI面对层出不穷的个性化图像生成技术，一个新问题摆在眼前：
缺乏统一标准来衡量这些生成的图片是否符合人们的喜好
对此，来自清华、西交大、伊利诺伊厄巴纳-香槟分校、中科院、旷视的研究人员共同推出了一项新基准DreamBench++。
通过收集不同的图像和提示，团队利用GPT-4o实现了符合人类偏好的自动评估。
简单来说，通过精心设计prompt以及引入思维链提示，团队让GPT-4o在图像评估过程中学会了像人类一样思考，并展现其思考过程。
为了测试效果，团队以7名专业人类标注员的打分为基准，对7种不同的图像生成方法进行了评估。
结果显示DreamBench++与人类评价高度一致。
更多细节接下来一起瞅瞅~
什么是DreamBench++？DreamBench++是一个全新的评估工具，它在个性化图像评估领域实现了两项关键技术突破。
引入支持多模态的GPT-4o，同时实现与人类偏好的深度对齐以及自动化评估
推出了一个更为全面和多元化的数据集
与人类对齐的自动化评估尽管GPT-4o支持多模态输入，但在评估图像中的细微差异时面临挑战。

原文链接：首次引入GPT-4o！图像自动评估新基准来啦