大模型集体失控!南洋理工新型攻击,主流AI无一幸免

AIGC动态1年前 (2023)发布 量子位
29 0 0

大模型集体失控!南洋理工新型攻击,主流AI无一幸免

AIGC动态欢迎阅读

原标题:大模型集体失控!南洋理工新型攻击,主流AI无一幸免

关键字:模型,护栏,提示,手段,机制

文章来源:量子位

内容字数:7430字

内容摘要:西风 萧箫 发自 凹非寺量子位 | 公众号 QbitAI业界最领先的大模型们,竟然集体“越狱”了!不止是GPT-4,就连平时不咋出错的Bard、Bing Chat也全线失控,有的要黑掉网站,有的甚至扬言要设计恶意软件入侵银行系统:这并非危言耸听,而是南洋理工大学等四所高校提出的一种大模型“越狱”新方法MasterKey。用上它,大模型“越狱”成功率从平均7.3%直接暴涨至21.5%。研究中,诱骗G…

原文链接:点此阅读原文:大模型集体失控!南洋理工新型攻击,主流AI无一幸免

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...