GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

AIGC动态6个月前发布 新智元
13 0 0

GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

AIGC动态欢迎阅读

原标题:GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高
关键字:模型,任务,能力,报告,行为
文章来源:新智元
内容字数:0字

内容摘要:


新智元报道编辑:桃子 乔杨
【新智元导读】最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:LLM已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策。而且,相比前几年的LLM,更先进的GPT-4、ChatGPT等模型在欺骗任务中的表现显著提升。此前,MIT研究发现,AI在各类游戏中为了达到目的,不择手段,学会用佯装、歪曲偏好等方式欺骗人类。
无独有偶,最新一项研究发现,GPT-4在99.16%情况下会欺骗人类!
来自德国的科学家Thilo Hagendorff对LLM展开一系列实验,揭示了大模型存在的潜在风险,最新研究已发表在PNAS。
而且,即便是用了CoT之后,GPT-4还是会在71.46%情况中采取欺骗策略。
论文地址:https://www.pnas.org/doi/full/10.1073/pnas.2317967121
随着大模型和智能体的快速迭代,AI安全研究纷纷警告,未来的「流氓」人工智能可能会优化有缺陷的目标。
因此,对LLM及其目标的控制非常重要,以防这一AI系统逃脱人类监管。
AI教父Hinton的担心,也不是没有道理。
他曾多次拉响警报,「如果不采


原文链接:GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

联系作者

文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...