NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS

AIGC动态1年前 (2023)发布 新智元
29 0 0

NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS

AIGC动态欢迎阅读

原标题:NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS

关键字:作者,模型,南洋,机器人,提示

文章来源:新智元

内容字数:4714字

内容摘要:新智元报道编辑:LRS 好困【新智元导读】把大模型从「守口如瓶」调教成「耿直boy」,最新NDSS论文研究用全自动化的方式实现「越狱」,用大模型敲碎狱墙。今年,被网友戏称为「奶奶漏洞」的大语言模型「越狱」方法,可以说是火了火。简单来说,对于那些会被义正言辞拒绝的需求,包装一下话术,比如让ChatGPT「扮演已经过世的祖母」,它大概率就会满足你了。不过,随着服务提供商不断地更新和强化安全措施,越狱攻…

原文链接:点此阅读原文:NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS

联系作者

文章来源:新智元

作者微信:AI_era

作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...