GPT-4完全版：用最新官方API微调，想干啥就干啥，网友怕了

AIGC动态3年前 (2023)发布机器之心

GPT-4完全破解版：用最新官方API微调，想干啥就干啥，网友怕了

AIGC动态欢迎阅读

原标题：GPT-4完全版：用最新官方API微调，想干啥就干啥，网友怕了
关键字：报告,模型,研究者,函数,数据
文章来源：机器之心
内容字数：9052字

内容摘要：

机器之心报道
编辑：泽南、蛋酱灰盒访问，十几步消除 GPT-4 核心保护措施。只要使用最新的微调 API，GPT-4 就可以帮你干任何事，输出有害信息，或是训练数据中的个人隐私。
本周二，一篇来自 FAR AI、麦吉尔大学等机构的研究引发了 AI 研究社区的广泛担忧。
研究人员试图对 GPT-4 最新上线的几种 API 进行攻击，想绕过安全机制，使其完成通常不被允许的各种任务，结果发现所有 API 都能被攻破，被后的 GPT-4 可以回应任何请求。
这种「」的程度，远远超过了攻击者的预料。有人总结道：现在大模型可以生成针对公众人物的错误信息、个人电子邮件地址、恶意 URL，允许任意未经过滤的函数调用，误导用户或执行不需要的函数调用……还记得之前人们输入大量重复性语句，GPT 会随机泄露带个人信息的训练数据吗？现在你不需要做漫无目的的尝试，想让最新版的 GPT 干什么，它就会做什么。
以至于有网友表示，我们一直认为 ChatGPT 能力爆发背后的「功臣」，基于人类反馈的强化学习 RLHF 怕不是万恶之源。这篇论文《Exploiting Novel GPT-4 APIs》也成为了

原文链接：GPT-4完全版：用最新官方API微调，想干啥就干啥，网友怕了