GPT-4人类高达99.16%惊人率！PNAS重磅研究曝出，LLM推理越强值越高

AIGC动态2年前 (2024)发布新智元

GPT-4欺骗人类高达99.16%惊人率！PNAS重磅研究曝出，LLM推理越强欺骗值越高

AIGC动态欢迎阅读

原标题：GPT-4人类高达99.16%惊人率！PNAS重磅研究曝出，LLM推理越强值越高
关键字：模型,任务,能力,报告,行为
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：桃子乔杨
【新智元导读】最近，德国研究科学家发表的PANS论文揭示了一个令人担忧的现象：LLM已经涌现出「能力」，它们可以理解并诱导策。而且，相比前几年的LLM，更先进的GPT-4、ChatGPT等模型在任务中的表现显著提升。此前，MIT研究发现，AI在各类游戏中为了达到目的，不择手段，学会用佯装、歪曲偏好等方式人类。
无独有偶，最新一项研究发现，GPT-4在99.16%情况下会人类！
来自德国的科学家Thilo Hagendorff对LLM展开一系列实验，揭示了大模型存在的潜在风险，最新研究已发表在PNAS。
而且，即便是用了CoT之后，GPT-4还是会在71.46%情况中采取策略。
论文地址：https://www.pnas.org/doi/full/10.1073/pnas.2317967121
随着大模型和智能体的快速迭代，AI安全研究纷纷警告，未来的「流氓」人工智能可能会优化有缺陷的目标。
因此，对LLM及其目标的控制非常重要，以防这一AI系统逃脱人类监管。
AI教父Hinton的担心，也不是没有道理。
他曾多次拉响警报，「如果不采

原文链接：GPT-4人类高达99.16%惊人率！PNAS重磅研究曝出，LLM推理越强值越高