通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5

通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5

AIGC动态欢迎阅读

原标题:通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5
关键字:模型,能力,基准,团队,阿里
文章来源:机器之心
内容字数:5601字

内容摘要:


机器之心报道
编辑:泽南超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。
新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。
阿里通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问 App。
除此以外,今天 Qwen 1.5 的发布还有如下一些重点:
支持 32K 上下文长度;
开放了 Base + Chat 模型的 checkpoint;
可与 Transformers 一起本地运行;
同时发布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 权重。
借助更先进的大模型作为评委,通义千问团队在两个广泛使用的基准 MT-Bench 和 Alpaca-Eval 上对 Qwen1.5 进行了初步评估,评估结果如下:尽管落后于 GPT-4-Turbo,但最大版本的 Qwen1.5 模型 Qwen1.


原文链接:通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...