通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5
关键字：模型,能力,基准,团队,阿里
文章来源：机器之心
内容字数：5601字

内容摘要：

机器之心报道
编辑：泽南超越 Claude、GPT-3.5，提升了多语言支持能力。赶在春节前，通义千问大模型（Qwen）的 1.5 版上线了。今天上午，新版本的消息引发了 AI 社区关注。
新版大模型包括六个型号尺寸：0.5B、1.8B、4B、7B、14B 和 72B，其中最强版本的性能超越了 GPT 3.5、Mistral-Medium，包括 Base 模型和 Chat 模型，且有多语言支持。
阿里通义千问团队表示，相关技术也已经上线到了通义千问官网和通义千问 App。
除此以外，今天 Qwen 1.5 的发布还有如下一些重点：
支持 32K 上下文长度；
开放了 Base + Chat 模型的 checkpoint；
可与 Transformers 一起本地运行；
同时发布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 权重。
借助更先进的大模型作为评委，通义千问团队在两个广泛使用的基准 MT-Bench 和 Alpaca-Eval 上对 Qwen1.5 进行了初步评估，评估结果如下：尽管落后于 GPT-4-Turbo，但最大版本的 Qwen1.5 模型 Qwen1.

原文链接：通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5