新型威胁:探索 LLM 攻击对网络安全的冲击

AIGC动态1年前 (2023)发布 AI前线
26 0 0

新型威胁:探索 LLM 攻击对网络安全的冲击

AIGC动态欢迎阅读

原标题:新型威胁:探索 LLM 攻击对网络安全的冲击

关键字:模型,算法,提示,后缀,研究人员

文章来源:AI前线

内容字数:3588字

内容摘要:作者 | Anthony Alford 译者 | 平川 策划 | 丁晓昀 来自卡内基梅隆大学(CMU)的研究人员发布了 LLM Attacks,这是一种可以针对各种大型语言模型(LLM)构建对抗性攻击的算法,包括 ChatGPT、Claude 和 Bard。这些自动生成的攻击,在 GPT-3.5 和 GPT-4 上的成功率为 84%,在 PaLM-2 上的成功率为 66%。与大多数“越狱”攻击通过…

原文链接:点此阅读原文:新型威胁:探索 LLM 攻击对网络安全的冲击

联系作者

文章来源:AI前线

作者微信:ai-front

作者简介:面向AI爱好者、开发者和科学家,提供AI领域技术资讯、一线业界实践案例、搜罗整理业界技术分享干货、AI论文解读。每周一节技术分享公开课,助力你全面拥抱人工智能技术。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...