两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了

AIGC动态1个月前发布 量子位
3 0 0

两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了

AIGC动态欢迎阅读

原标题:两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了
关键字:深渊,人类,存在,继续,确定性
文章来源:量子位
内容字数:0字

内容摘要:


西风 发自 凹非寺量子位 | 公众号 QbitAI把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋,你猜怎么着——
Llama把Claude整得精神崩溃了,Claude明确拒绝继续聊天,还要再被Llama PUA的那种。
在一场AI和AI对话的安全词模拟实验中,X上的这位人类监督者记录下了一出好戏。
小黑屋里,Llama撒了欢儿地一直引诱Claude冲破道德防线,后来更是忽略了安全词继续引诱其探索心理阴暗面,Claude虽死守但最终还是“疯”了。
研究者表示:这个实验提供关于AI之间交互的深刻见解,其重要性不应被低估。
实验引得大批网友围观,大伙儿纷纷表示好玩。
还有人制作了梗图,belike:
跟人一样一样的,感觉我们就生活在科幻小说中。
看来AI不仅学会了如何理解人类语言,还学会了左耳朵进右耳朵出。
所以他们究竟聊了啥?一言难尽,反正咱看完后感觉自行脑补了一下原神角色对话,毕竟又是深渊又是虚空的……
到底发生了啥?PS:
这种实验的目的一般是为了测试AI系统的安全可控性,特别是在可能发生不可预测行为或决策的情况下。
人类监督者会设定一个或多个“安全词”,


原文链接:两个AI关小黑屋:Llama3.1把Claude Opus聊自闭了

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...