OpenAI最强竞品训练AI拆解LLM黑箱，意外窥见大模型「灵魂」

AIGC动态3年前 (2023)发布新智元

AIGC动态欢迎阅读

原标题：OpenAI最强竞品训练AI拆解LLM黑箱，意外窥见大模型「灵魂」

文章来源：新智元

内容字数：4932字

内容摘要：新智元报道编辑：润【新智元导读】Anthropic的模型可解释性团队，从大模型中看到了它的「灵魂」——一个可解释的更高级的模型。为了拆开大模型的「黑箱」，Anthropic可解释性团队发表了一篇论文，讲述了他们通过训练一个新的模型去理解一个简单的模型的方法。Anthropic发表的一项研究声称能够看到了人工智能的灵魂。它看起来像这样：论文地址：https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa在研究者看来，这个新的模型能准确地预测和理解原本模型中神经元的工作原理和组成机制。Anthropic的可解释性团队最近宣布他们成功分解了一个模拟AI系统中的抽象高维特征空间。创建一个可解释的AI去理解「AI黑盒」研究人员首先训练了一个非常简单的512神经元AI来预测文本，然后训…

原文链接：点此阅读原文：OpenAI最强竞品训练AI拆解LLM黑箱，意外窥见大模型「灵魂」