今日arXiv最热NLP大模型论文：上海AI Lab联合清华发布十项全能数学大模型InternLM-Math

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：今日arXiv最热NLP大模型论文：上海AI Lab联合清华发布十项全能数学大模型InternLM-Math
关键字：模型,数学,数据,能力,链式
文章来源：夕小瑶科技说
内容字数：8686字

内容摘要：

夕小瑶科技说原创作者 | 芒果、Python引言：数学推理与大语言模型的新突破数学推理能力是大语言模型（LLMs）抽象推理能力的一个重要体现。近年来，随着深度学习技术的不断进步，LLMs在数学推理任务上取得了显著的进展。从小学级别到高中级别的数学问题，通过链式推理（chain-of-thought reasoning）或程序式推理（program-of-thought reasoning），LLMs展现出了解决数学问题的潜力。这些模型的构建需要在数学语料上进行预训练，并在数学问题上进行监督式微调。在这一背景下，该研究介绍了InternLM-Math，基于InternLM2-Base模型继续预训练的数学推理LLM。InternLM-Math不仅在解决数学问题方面表现出色，还在验证、证明和数据增强等多个方面展现了其能力。本文将对InternLM-Math的最新进展进行介绍，包括其在各项基准测试中的表现，以及如何通过开源的方式推动数学LLMs的发展。
论文标题：InternLM-Math: Open Math Large Language Models Toward Verifiable

原文链接：今日arXiv最热NLP大模型论文：上海AI Lab联合清华发布十项全能数学大模型InternLM-Math