以图灵机为师：通过微调训练让大语言模型懂执行计算过程

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：以图灵机为师：通过微调训练让大语言模型懂执行计算过程
关键字：算术,图灵机,累加器,加法,模型
文章来源：机器之心
内容字数：0字

内容摘要：

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com
本文来自学计算机学院软件研究所，聚焦于开放环境下的智能软件新技术研究，定位国际学术前沿，面向国家关键需求，承担了一系列国家科技部和基金委重大/重点科研项目。团队拥有包括中科院院士等多名国家级人才，重点关注软件和智能方向，研究成果发表于NeurIPS/ICLR/SOSP/ATC/EuroSys/OOPSLA/PLDI/ICSE/FSE等国际顶级会议，其中多篇文章获得相应会议的最佳论文奖。
大型语言模型（LLM）在各种自然语言处理和推理任务中表现出卓越的能力，某些应用场景甚至超越了人类的表现。然而，这类模型在最基础的算术问题的表现上却不尽如人意。当遇到算术问题时，LLM 通常依赖记住特定的表达式及其对应结果的方式输出算术问题的结果。通过简单的实验发现，

原文链接：以图灵机为师：通过微调训练让大语言模型懂执行计算过程