连ChatGPT都懂“阿谀奉承”了！OpenAI最强竞对：都是“人类偏好”犯的错

AIGC动态3年前 (2023)发布大数据文摘

AIGC动态欢迎阅读

原标题：连ChatGPT都懂“阿谀奉承”了！OpenAI最强竞对：都是“人类偏好”犯的错

文章来源：大数据文摘

内容字数：4243字

内容摘要：大数据文摘授权转载自学术头条你是否想过，ChatGPT 生成的答案会受到用户个人偏好的影响，回复一些足够“阿谀奉承（sycophancy）”的话，而非中立或真实的信息？实际上，这种现象存在于包括 ChatGPT 在内的大多数 AI 模型之中，而罪魁祸首竟可能是“基于人类反馈的强化学习（RLHF）”。近日，OpenAI 在美国硅谷的最强竞争对手 Anthropic 在研究经过 RLHF 训练的模型时…

原文链接：点此阅读原文：连ChatGPT都懂“阿谀奉承”了！OpenAI最强竞对：都是“人类偏好”犯的错