首次引入GPT-4o!图像自动评估新基准来啦

AIGC动态3个月前发布 量子位
3 0 0

首次引入GPT-4o!图像自动评估新基准来啦

AIGC动态欢迎阅读

原标题:首次引入GPT-4o!图像自动评估新基准来啦
关键字:图像,人类,团队,数据,评分
文章来源:量子位
内容字数:0字

内容摘要:


DreamBench++团队 投稿量子位 | 公众号 QbitAI面对层出不穷的个性化图像生成技术,一个新问题摆在眼前:
缺乏统一标准来衡量这些生成的图片是否符合人们的喜好
对此,来自清华、西交大、伊利诺伊厄巴纳-香槟分校、中科院、旷视的研究人员共同推出了一项新基准DreamBench++。
通过收集不同的图像和提示,团队利用GPT-4o实现了符合人类偏好的自动评估。
简单来说,通过精心设计prompt以及引入思维链提示,团队让GPT-4o在图像评估过程中学会了像人类一样思考,并展现其思考过程。
为了测试效果,团队以7名专业人类标注员的打分为基准,对7种不同的图像生成方法进行了评估。
结果显示DreamBench++与人类评价高度一致。
更多细节接下来一起瞅瞅~
什么是DreamBench++?DreamBench++是一个全新的评估工具,它在个性化图像评估领域实现了两项关键技术突破。
引入支持多模态的GPT-4o,同时实现与人类偏好的深度对齐以及自动化评估
推出了一个更为全面和多元化的数据集
与人类对齐的自动化评估尽管GPT-4o支持多模态输入,但在评估图像中的细微差异时面临挑战。


原文链接:首次引入GPT-4o!图像自动评估新基准来啦

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...