背诵不等于理解，深度解析大模型背后的知识储存与提取

AIGC动态2年前 (2023)发布机器之心

AIGC动态欢迎阅读

原标题：背诵不等于理解，深度解析大模型背后的知识储存与提取

关键字：模型,知识,数据,传记,探针

文章来源：机器之心

内容字数：7483字

内容摘要：机器之心专栏机器之心编辑部自然语言模型的背诵 (memorization) 并不等于理解。即使模型能完整记住所有数据，也可能无法通过微调 (finetune) 提取这些知识，无法回答简单的问题。随着模型规模的增大，人们开始探索大模型是如何掌握大量知识的。一种观点认为这归功于 “无损压缩”，即模型通过大量训练，记忆更多内容以提高预测精度。但 “无损压缩” 真的能让大模型理解这些知识吗？朱泽园 (Me…

原文链接：点此阅读原文：背诵不等于理解，深度解析大模型背后的知识储存与提取