大模型的高考数学成绩单：及格已经非常好了

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：大模型的高考数学成绩单：及格已经非常好了
关键字：错误,豆包,模型,部分,能力
文章来源：机器之心
内容字数：0字

内容摘要：

机器之心发布
机器之心编辑部让考生头皮发麻的高考数学，可难倒了顶尖 AI 大模型。
一年一度的高考即将落幕，衷心希望各位考生都超常发挥，考出满意的好成绩！！
和往年一样，除了让 AI 大模型写写高考作文，我们也选取了六家国内头部大模型公司的产品与考生们一同参与一场客观且公平（让众多考生头皮发麻）的高考数学考试（新课标 Ⅰ 卷），其中包括 GPT-4o、GLM-4、文心一言 4.0、豆包、百小应（百川 4）以及通义千问 2.5。
先来瞧一瞧这份「大模型成绩单」：令人惊讶的是，在这次模拟考试中，大模型（产品）的表现并未达到预期，甚至出现了几乎全部不及格的情况，只有智谱最新发布的 GLM-4-0520 模型超过了及格线。
对大模型产品来说，高考语文作文可以直接测试它们的创造性写作技巧，包括构思、组织和表达观点的能力。
而在数学考试测试中，除了基本的计算能力、对数学知识的掌握，更能体现大模型在逻辑推理、抽象思维和问题解决方面的高级能力。大模型必须理解并运用数学概念、公式和定理，这要求它具备深厚的数学知识基础。同时，逻辑推理能力是解答数学题目的关键，大模型需要通过严密的逻辑推导来解决问题。
具体

原文链接：大模型的高考数学成绩单：及格已经非常好了