新型威胁：探索 LLM 攻击对网络安全的冲击

AIGC动态3年前 (2023)发布 AI前线

AIGC动态欢迎阅读

原标题：新型威胁：探索 LLM 攻击对网络安全的冲击

文章来源：AI前线

内容字数：3588字

内容摘要：作者 | Anthony Alford 译者 | 平川策划 | 丁晓昀来自卡内基梅隆大学（CMU）的研究人员发布了 LLM Attacks，这是一种可以针对各种大型语言模型（LLM）构建对抗性攻击的算法，包括 ChatGPT、Claude 和 Bard。这些自动生成的攻击，在 GPT-3.5 和 GPT-4 上的成功率为 84%，在 PaLM-2 上的成功率为 66%。与大多数“越狱”攻击通过…

原文链接：点此阅读原文：新型威胁：探索 LLM 攻击对网络安全的冲击