张俊林：大语言模型无法对数字进行准确运算的主要原因

AIGC动态1年前 (2024)发布算法邦

AIGC动态欢迎阅读

原标题：张俊林：大语言模型无法对数字进行准确运算的主要原因
关键字：数字,加法,知乎,侵权,报告
文章来源：算法邦
内容字数：0字

内容摘要：

直播预告 | 7月23日14点，「智猩猩在线研讨会 NVIDIA AI for Science 专场」将开讲，两位专家将分别以《AI 驱动下的新能源材料研究与发现》、《NVIDIA Modulus 加速 AI 驱动的材料计算》为主题进行直播讲解，欢迎扫名~导读本文转载知乎，是张俊林对“LLM（大语言模型）无法对数字进行准确运算的底层原因是什么？”这一问题做的回答。近期大模型无确回答9.11和9.9哪个大成为热点，转载此文主要是传递来自技术专家的理性分析。
原文来自https://www.zhihu.com/question/654932431，出于技术分享转载此文，侵权联系删除。“LLM能通向AGI”这一观点的反对者经常提这个问题：你们整天吹LLM会达到AGI，可为啥大模型连最简单的“多位数加法”都做不好？这质疑对很多AGI信奉者来说是很扎心的，不好反驳，因为大模型做多位数加法这种简单数学确实有困难。不过，目前基本已能理清其主要原因，大部分也获得了解决，我归纳了下，有如下几点：
01其一，LLM的 Tokenizer对数字切分问题早期LLM的Tokenizer一般不会对数字进行

原文链接：张俊林：大语言模型无法对数字进行准确运算的主要原因