LeCun新作：神经网络在实践中的灵活性到底有多大？

AIGC动态2年前 (2024)发布新智元

AIGC动态欢迎阅读

原标题：LeCun新作：神经网络在实践中的灵活性到底有多大？
关键字：数据,模型,神经网络,样本,标签
文章来源：新智元
内容字数：0字

内容摘要：

新智元报道编辑：alan
【新智元导读】神经网络拟合数据的能力受哪些因素影响？CNN一定比Transformer差吗？ReLU和SGD还有哪些神奇的作用？近日，LeCun参与的一项工作向我们展示了神经网络在实践中的灵活性。人工智能在今天百花齐放，大模型靠规模称王，小模型则凭数据取胜。
当然我们也希望，可以付出更少的资源，并达到相同的效果。
很早之前，谷歌就有相关研究，探索了在固定算力的情况下，如何分配模型参数量和训练数据量，以达到最好的性能。
近日，LeCun参与的一项工作从另一个角度向我们展示了，神经网络在实践中的灵活性到底有多大？
论文地址：https://arxiv.org/pdf/2406.11463
这个灵活性指的是，神经网络拟合训练数据（样本数量）的能力，在实际应用中受到哪些因素的影响。
比如我们第一时间想到的可能就是模型的参数量。
人们普遍认为，神经网络可以拟合至少与自身参数一样多的训练样本。
这就像是解一个线性方程组，有多少个参数（或者方程）、多少个未知数，从而判断解的数量。
然而神经网络实际上要复杂的多，尽管在理论上能够进行通用函数逼近，但在实践中，我们训练的模型容

原文链接：LeCun新作：神经网络在实践中的灵活性到底有多大？