OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型「灵魂」

AIGC动态10个月前发布 新智元
40 0 0

OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型「灵魂」

AIGC动态欢迎阅读

原标题:OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型「灵魂」

关键字:神经元,特征,报告,解释性,模型

文章来源:新智元

内容字数:4932字

内容摘要:新智元报道编辑:润【新智元导读】Anthropic的模型可解释性团队,从大模型中看到了它的「灵魂」——一个可解释的更高级的模型。为了拆开大模型的「黑箱」,Anthropic可解释性团队发表了一篇论文,讲述了他们通过训练一个新的模型去理解一个简单的模型的方法。Anthropic发表的一项研究声称能够看到了人工智能的灵魂。它看起来像这样:论文地址:https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa在研究者看来,这个新的模型能准确地预测和理解原本模型中神经元的工作原理和组成机制。Anthropic的可解释性团队最近宣布他们成功分解了一个模拟AI系统中的抽象高维特征空间。创建一个可解释的AI去理解「AI黑盒」研究人员首先训练了一个非常简单的512神经元AI来预测文本,然后训…

原文链接:点此阅读原文:OpenAI最强竞品训练AI拆解LLM黑箱,意外窥见大模型「灵魂」

联系作者

文章来源:新智元

作者微信:AI_era

作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...