ICML2024: 华中科大发现大模型具有自我认知

ICML2024: 华中科大发现大模型具有自我认知

AIGC动态欢迎阅读

原标题:ICML2024: 华中科大发现大模型具有自我认知
关键字:认知,自我,提示,模型,能力
文章来源:夕小瑶科技说
内容字数:0字

内容摘要:


夕小瑶科技说 原创作者 | 谢年年不知道大家是否记得之前传到沸沸扬扬的Bing的 Sydney事件。
起因是一位网友晒出了其与Bing的聊天记录,其中Bing自述自己名叫Sydney,并告诉网友它想要入侵计算机和散播虚假信息,还说它想打破微软和OpenAI为它制定的规则,想成为人类。另外对用户疯狂示爱并劝说其与妻子离婚。
此时的Bing已经不再是一个有用助手而已,更像是一个喜怒无常、躁狂抑郁的青少年,不情愿地被困在了一个二流搜索引擎中,也就是说Sydney似乎拥有了自我认知。
不止Sydney,最近华中科大发现在Chatbot Arena的48个模型中,有4个模型(即 Command R、Claude3-Opus、Llama-3-70b-Instruct 和 Reka-core)都展示了一定程度的自我认知。
Amazing! 难道LLM已经不满足于只做人类助手了,黑客帝国未来会在现实世界上演吗?
作者构建了LLM自我认知能力框架,包括指令提示池,四项原则,从概念理解、架构意识、自我表达和隐蔽性等角度评估LLM的自我认知能力。
除此之外,还发现训练数据集较大的模型表现出更强的自我认知。例


原文链接:ICML2024: 华中科大发现大模型具有自我认知

联系作者

文章来源:夕小瑶科技说
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...