连ChatGPT都懂“阿谀奉承”了!OpenAI最强竞对:都是“人类偏好”犯的错

连ChatGPT都懂“阿谀奉承”了!OpenAI最强竞对:都是“人类偏好”犯的错

AIGC动态欢迎阅读

原标题:连ChatGPT都懂“阿谀奉承”了!OpenAI最强竞对:都是“人类偏好”犯的错

关键字:模型,人类,用户,研究人员,行为

文章来源:大数据文摘

内容字数:4243字

内容摘要:大数据文摘授权转载自学术头条你是否想过,ChatGPT 生成的答案会受到用户个人偏好的影响,回复一些足够“阿谀奉承(sycophancy)”的话,而非中立或真实的信息?实际上,这种现象存在于包括 ChatGPT 在内的大多数 AI 模型之中,而罪魁祸首竟可能是“基于人类反馈的强化学习(RLHF)”。近日,OpenAI 在美国硅谷的最强竞争对手 Anthropic 在研究经过 RLHF 训练的模型时…

原文链接:点此阅读原文:连ChatGPT都懂“阿谀奉承”了!OpenAI最强竞对:都是“人类偏好”犯的错

联系作者

文章来源:大数据文摘

作者微信:BigDataDigest

作者简介:普及数据思维,传播数据文化

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...