阿里推出世界最强的数学模型Qwen2-Math，击败GPT4o、Claude3.5

AIGC动态2年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：阿里推出世界最强的数学模型Qwen2-Math，击败GPT4o、Claude3.5
关键字：政策,模型,数学,团队,数据
文章来源：夕小瑶科技说
内容字数：0字

内容摘要：

夕小瑶科技说原创作者 | 谷雨龙泽上周，阿里通义团队宣布，模型又迎来了一次升级，他们推出了专用于解决数学问题的Qwen2-Math！
Qwen2-Math模型简介通义千问的数学模型包括Qwen2-Math 和 Qwen2-Math-Instruct-1.5B/7B/72B。这批模型是一系列基于 Qwen2 LLM 构建的专用数学语言模型，其数学能力明显强于开源模型甚至闭源模型（如 GPT-4o）的数学能力。
根据研发团队的评测，其中量最大的数学模型Qwen2-Math-72B-Instruct登顶全服最强，拳打GPT-4o、Claude-3.5-Sonnet，脚踢Gemini-1.5-Pro和Llama-3.1-405B。
基础模型 Qwen2-MathQwen2-Math 的基础模型使用Qwen2-1.5B/7B/72B 进行初始化，然后在团队构建的数学专用数据上进行预训练。数据包含通义千问合成的大规模高质量数学网络内容、数学书籍、代码、试题和数学预训练数据。比如这就是其中一道用来训练的数学题：
好吧，笔者承认，我已经不会做这道题了——当然也不能在几秒钟内回答。
值得注意的是，千问

原文链接：阿里推出世界最强的数学模型Qwen2-Math，击败GPT4o、Claude3.5