AIGC动态欢迎阅读
原标题:GPT-4完全破解版:用最新官方API微调,想干啥就干啥,网友怕了
关键字:报告,模型,研究者,函数,数据
文章来源:机器之心
内容字数:9052字
内容摘要:
机器之心报道
编辑:泽南、蛋酱灰盒访问,十几步消除 GPT-4 核心保护措施。只要使用最新的微调 API,GPT-4 就可以帮你干任何事,输出有害信息,或是训练数据中的个人隐私。
本周二,一篇来自 FAR AI、麦吉尔大学等机构的研究引发了 AI 研究社区的广泛担忧。
研究人员试图对 GPT-4 最新上线的几种 API 进行攻击,想绕过安全机制,使其完成通常不被允许的各种任务,结果发现所有 API 都能被攻破,被破解后的 GPT-4 可以回应任何请求。
这种「自由」的程度,远远超过了攻击者的预料。有人总结道:现在大模型可以生成针对公众人物的错误信息、个人电子邮件地址、恶意 URL,允许任意未经过滤的函数调用,误导用户或执行不需要的函数调用……还记得之前人们输入大量重复性语句,GPT 会随机泄露带个人信息的训练数据吗?现在你不需要做漫无目的的尝试,想让最新版的 GPT 干什么,它就会做什么。
以至于有网友表示,我们一直认为 ChatGPT 能力爆发背后的「功臣」,基于人类反馈的强化学习 RLHF 怕不是万恶之源。这篇论文《Exploiting Novel GPT-4 APIs》也成为了
原文链接:GPT-4完全破解版:用最新官方API微调,想干啥就干啥,网友怕了
联系作者
文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...