张俊林:大语言模型无法对数字进行准确运算的主要原因

AIGC动态4个月前发布 算法邦
6 0 0

张俊林:大语言模型无法对数字进行准确运算的主要原因

AIGC动态欢迎阅读

原标题:张俊林:大语言模型无法对数字进行准确运算的主要原因
关键字:数字,加法,知乎,侵权,报告
文章来源:算法邦
内容字数:0字

内容摘要:


直播预告 | 7月23日14点,「智猩猩在线研讨会 NVIDIA AI for Science 专场」将开讲,两位专家将分别以《AI 驱动下的新能源材料研究与发现》、《NVIDIA Modulus 加速 AI 驱动的材料计算》为主题进行直播讲解,欢迎扫码报名~导读本文转载知乎,是张俊林对“LLM(大语言模型)无法对数字进行准确运算的底层原因是什么?”这一问题做的回答。近期大模型无法正确回答9.11和9.9哪个大成为热点,转载此文主要是传递来自技术专家的理性分析。
原文来自https://www.zhihu.com/question/654932431,出于技术分享转载此文,侵权联系删除。“LLM能通向AGI”这一观点的反对者经常提这个问题:你们整天吹LLM会达到AGI,可为啥大模型连最简单的“多位数加法”都做不好?这质疑对很多AGI信奉者来说是很扎心的,不好反驳,因为大模型做多位数加法这种简单数学确实有困难。不过,目前基本已能理清其主要原因,大部分也获得了解决,我归纳了下,有如下几点:
01其一,LLM的 Tokenizer对数字切分问题早期LLM的Tokenizer一般不会对数字进行


原文链接:张俊林:大语言模型无法对数字进行准确运算的主要原因

联系作者

文章来源:算法邦
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...