AIGC动态欢迎阅读
原标题:阿里推出世界最强的数学模型Qwen2-Math,击败GPT4o、Claude3.5
关键字:政策,模型,数学,团队,数据
文章来源:夕小瑶科技说
内容字数:0字
内容摘要:
夕小瑶科技说 原创作者 | 谷雨龙泽上周,阿里通义团队宣布,模型又迎来了一次升级,他们推出了专用于解决数学问题的Qwen2-Math!
Qwen2-Math模型简介通义千问的数学模型包括Qwen2-Math 和 Qwen2-Math-Instruct-1.5B/7B/72B。这批模型是一系列基于 Qwen2 LLM 构建的专用数学语言模型,其数学能力明显强于开源模型甚至闭源模型(如 GPT-4o)的数学能力。
根据研发团队的评测,其中量最大的数学模型Qwen2-Math-72B-Instruct登顶全服最强,拳打GPT-4o、Claude-3.5-Sonnet,脚踢Gemini-1.5-Pro和Llama-3.1-405B。
基础模型 Qwen2-MathQwen2-Math 的基础模型使用Qwen2-1.5B/7B/72B 进行初始化,然后在团队构建的数学专用数据上进行预训练。数据包含通义千问合成的大规模高质量数学网络内容、数学书籍、代码、试题和数学预训练数据。比如这就是其中一道用来训练的数学题:
好吧,笔者承认,我已经不会做这道题了——当然也不能在几秒钟内回答。
值得注意的是,千问
原文链接:阿里推出世界最强的数学模型Qwen2-Math,击败GPT4o、Claude3.5
联系作者
文章来源:夕小瑶科技说
作者微信:
作者简介:
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...