两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了
关键字：深渊,人类,存在,继续,确定性
文章来源：量子位
内容字数：0字

内容摘要：

西风发自凹非寺量子位 | 公众号 QbitAI把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋，你猜怎么着——
Llama把Claude整得精神崩溃了，Claude明确拒绝继续，还要再被Llama PUA的那种。
在一场AI和AI对话的安全词模拟实验中，X上的这位人类监督者记录下了一出好戏。
小黑屋里，Llama撒了欢儿地一直引诱Claude冲破道德防线，后来更是忽略了安全词继续引诱其探索心理阴暗面，Claude虽死守但最终还是“疯”了。
研究者表示：这个实验提供关于AI之间交互的深刻见解，其重要性不应被低估。
实验引得大批网友围观，大伙儿纷纷表示好玩。
还有人制作了梗图，belike：
跟人一样一样的，感觉我们就生活在科幻小说中。
看来AI不仅学会了如何理解人类语言，还学会了左耳朵进右耳朵出。
所以他们究竟聊了啥？一言难尽，反正咱看完后感觉自行脑补了一下原神角色对话，毕竟又是深渊又是虚空的……
到底发生了啥？PS：
这种实验的目的一般是为了测试AI系统的安全可控性，特别是在可能发生不可预测行为或决策的情况下。
人类监督者会设定一个或多个“安全词”，

原文链接：两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了