最强数学大模型易主！阿里千问新模型成绩超GPT-4o，网友：这才是真“草莓”

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：最强数学大模型易主！阿里千问新模型成绩超GPT-4o，网友：这才是真“草莓”
关键字：模型,数据,版本,数学,团队
文章来源：量子位
内容字数：0字

内容摘要：

克雷西发自凹非寺量子位 | 公众号 QbitAI最强数学大模型，现在易主！
阿里千问大模型团队发布的Qwen2-Math，不仅超越了Llama 3.1-405B，也战胜了GPT-4o、Claude 3.5等一系列闭源模型。
而且还会解决竞赛级试题，在GPT-4只能做对一道的AIME 24中，Qwen2-Math答对的题目数量达到了两位数。
Qwen2-Math一共有三个参数量的版本——72B，7B和1.5B。
最强的72B版本，在MATH数据集上比GPT-4o多得了7分，按比例算高出了9.6%。
7B版本也用不到十分之一的参数量，超过了72B的开源数学模型NuminaMath。
而且这个NuminaMath来头不小，它的7B版本在全球首届AIMO中获奖，奖项由数学大牛陶哲轩颁发。
阿里高级算法专家林俊旸激动地宣布，千问团队把Qwen2模型变成了一个数学高手。
fast.ai创始人Jeremy Howard看了直呼amazing。
网友更是惊叹，原来这才是真正的“草莓”，这是开源的胜利，也是所有人的胜利。
超越GPT4o，会做竞赛级试题如前文所说，Qwen2-Math共有72B、7B

原文链接：最强数学大模型易主！阿里千问新模型成绩超GPT-4o，网友：这才是真“草莓”