爆火后反转？「一夜干掉MLP」的KAN：其实我也是MLP

AIGC动态1年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：爆火后反转？「一夜干掉MLP」的KAN：其实我也是MLP
关键字：解释性,作者,参数,论文,线性
文章来源：机器之心
内容字数：8473字

内容摘要：

机器之心报道
编辑：蛋酱、张倩KAN 作者：我想传达的信息不是「KAN 很棒」，而是「尝试批判性地思考当前的架构，并寻求从根本上不同的替代方案，这些方案可以完成有趣、有用的事情。」多层感知器（MLP），也被称为全连接前馈神经网络，是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过，因为它们是机器学习中用于逼近非线性函数的默认方法。
但是最近，来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。该方法在准确性和可解释性方面表现优于 MLP。而且，它能以非常少的参数量胜过以更大参数量运行的 MLP。比如，作者表示，他们用 KAN 重新发现了结理论中的数学规律，以更小的网络和更高的自动化程度重现了 DeepMind 的结果。具体来说，DeepMind 的 MLP 有大约 300000 个参数，而 KAN 只有大约 200 个参数。
这些惊人的结果让 KAN 迅速走红，吸引了很多人对其展开研究。很快，有人提出了一些质疑。其中，一篇标题为《KAN is just MLP》的 Colab 文档成为了议论的焦点。KAN 只是一个普通的 MLP？
上述文档的作者

原文链接：爆火后反转？「一夜干掉MLP」的KAN：其实我也是MLP