背诵不等于理解,深度解析大模型背后的知识储存与提取

AIGC动态1年前 (2023)发布 机器之心
18 0 0

背诵不等于理解,深度解析大模型背后的知识储存与提取

AIGC动态欢迎阅读

原标题:背诵不等于理解,深度解析大模型背后的知识储存与提取

关键字:模型,知识,数据,传记,探针

文章来源:机器之心

内容字数:7483字

内容摘要:机器之心专栏机器之心编辑部自然语言模型的背诵 (memorization) 并不等于理解。即使模型能完整记住所有数据,也可能无法通过微调 (finetune) 提取这些知识,无法回答简单的问题。随着模型规模的增大,人们开始探索大模型是如何掌握大量知识的。一种观点认为这归功于 “无损压缩”,即模型通过大量训练,记忆更多内容以提高预测精度。但 “无损压缩” 真的能让大模型理解这些知识吗?朱泽园 (Me…

原文链接:点此阅读原文:背诵不等于理解,深度解析大模型背后的知识储存与提取

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...