开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

AIGC动态12个月前发布 机器之心
53 0 0

开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

AIGC动态欢迎阅读

原标题:开源模型幻觉」更严重,这是三元组粒度的幻觉检测套件

关键字:幻觉,模型,检测器,声明,报告

文章来源:机器之心

内容字数:8855字

内容摘要:机器之心专栏机器之心编辑部BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课题。近日,亚马逊上海人工智能研究院推出细粒度大模型幻觉检测工具 BSChecker,包含如下重要特性:细粒度幻觉检测框架,对大模型输出文本进行三元组粒度的幻觉检测。幻觉检测基准测试集,包含三种任务场景,满足用户的不同需求。两个基准测试排行榜,目前涵盖15个主流大模型的幻觉检测结果。另外,BSChecker的作者们在Gemini推出后也很快做了自动检测的幻觉测试。幻觉检测框架示意图项目地址:https://github.com/amazon-science/…

原文链接:点此阅读原文:开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...