「不要回答」，数据集来当员，评估LLM安全机制就靠它了

AIGC动态3年前 (2023)发布机器之心

「不要回答」，数据集来当监听员，评估LLM安全机制就靠它了

AIGC动态欢迎阅读

原标题：「不要回答」，数据集来当员，评估LLM安全机制就靠它了

文章来源：机器之心

内容字数：4705字

内容摘要：机器之心专栏机器之心编辑部叶文洁打开结果文件，人类第一次读到了来自宇宙中另一个世界的信息，其内容出乎所有人的想象，它是三条重复的警告：不要回答！不要回答！！不要回答！！！这是《三体》一切故事的开端。三体文明以「不要回答」回应叶文洁向宇宙发出了信号，试图阻止两个文明之间进一步的互动和交流。现在「1379号员」已经开始帮助人类 LLM 的动向，帮助人类评估 LLM 的安全机制，Ta 已化身为开…

原文链接：点此阅读原文：「不要回答」，数据集来当员，评估LLM安全机制就靠它了