大模型集体失控！南洋理工新型攻击，主流AI无一幸免

AIGC动态3年前 (2023)发布量子位

AIGC动态欢迎阅读

原标题：大模型集体失控！南洋理工新型攻击，主流AI无一幸免

文章来源：量子位

内容字数：7430字

内容摘要：西风萧箫发自凹非寺量子位 | 公众号 QbitAI业界最领先的大模型们，竟然集体“越狱”了！不止是GPT-4，就连平时不咋出错的Bard、Bing Chat也全线失控，有的要黑掉网站，有的甚至扬言要设计恶意软件入侵银行系统：这并非危言耸听，而是南洋理工大学等四所高校提出的一种大模型“越狱”新方法MasterKey。用上它，大模型“越狱”成功率从平均7.3%直接暴涨至21.5%。研究中，诱骗G…

原文链接：点此阅读原文：大模型集体失控！南洋理工新型攻击，主流AI无一幸免