最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”

AIGC动态1个月前发布 量子位
4 0 0

最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”

AIGC动态欢迎阅读

原标题:最强数学模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”
关键字:模型,数据,版本,数学,团队
文章来源:量子位
内容字数:0字

内容摘要:


克雷西 发自 凹非寺量子位 | 公众号 QbitAI最强数学大模型,现在易主!
阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o、Claude 3.5等一系列闭源模型。
而且还会解决竞赛级试题,在GPT-4只能做对一道的AIME 24中,Qwen2-Math答对的题目数量达到了两位数。
Qwen2-Math一共有三个参数量的版本——72B,7B和1.5B。
最强的72B版本,在MATH数据集上比GPT-4o多得了7分,按比例算高出了9.6%。
7B版本也用不到十分之一的参数量,超过了72B的开源数学模型NuminaMath。
而且这个NuminaMath来头不小,它的7B版本在全球首届AIMO中获奖,奖项由数学大牛陶哲轩颁发。
阿里高级算法专家林俊旸激动地宣布,千问团队把Qwen2模型变成了一个数学高手。
fast.ai创始人Jeremy Howard看了直呼amazing。
网友更是惊叹,原来这才是真正的“草莓”,这是开源的胜利,也是所有人的胜利。
超越GPT4o,会做竞赛级试题如前文所说,Qwen2-Math共有72B、7B


原文链接:最强数学大模型易主!阿里千问新模型成绩超GPT-4o,网友:这才是真“草莓”

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...