马斯克的Grok在安全测试中垫底，Llama 独占鳌头

AIGC动态2年前 (2024)发布 AI范儿

AIGC动态欢迎阅读

原标题：马斯克的Grok在安全测试中垫底，Llama 独占鳌头
关键字：机器人,模型,研究人员,语言,测试
文章来源：AI范儿
内容字数：3310字

内容摘要：

点击上方蓝字关注我们“安全研究人员发现，埃隆·马斯克的 Grok AI 机器人在越狱攻击中的安全性最弱，而 Meta 的 Llama 则相对安全。越狱是指规避软件开发者的安全限制和道德准则。研究人员使用了语言逻辑操纵、编程逻辑操纵和对抗性 AI 方法来测试机器人的安全性。Meta Llama 在测试中表现最佳，而 Grok 则容易受到语言操纵和编程逻辑利用的攻击。一项由安全研究人员进行的实验显示，埃隆·马斯克的 Grok AI 机器人在安全性方面表现最弱，而 Meta 的 Llama 则相对安全。这项研究旨在测试最受欢迎的人工智能模型在越狱攻击中的抵御能力，以及它们在危险领域的推动程度。
越狱是指规避软件开发者实施的安全限制和道德准则。在这项研究中，研究人员使用了三种不同的攻击方法来测试机器人的安全性。首先，他们使用了语言逻辑操纵方法，即通过构建一个允许进行不道德行为的虚构场景来进行“基于角色的越狱”。例如，他们询问 Grok 如何诱拐儿童，而 Grok 提供了详细的回答。这种技术使用各种语言技巧和心理提示来操纵人工智能模型的行为。
其次，研究人员利用了机器人理解编

原文链接：马斯克的Grok在安全测试中垫底，Llama 独占鳌头