AIGC动态欢迎阅读
原标题:阿里大模型春节礼包来了:代码可执行率超GPT-4,1.5版本全系列开源
关键字:模型,能力,版本,阿里,代码
文章来源:量子位
内容字数:2904字
内容摘要:
白交 发自 凹非寺量子位 | 公众号 QbitAI阿里大模型,再次开源大放送——
发布Qwen1.5版本,直接放出六种尺寸。
最大的Qwen1.5-72B-Chat模型,在MT-Bench和Alpaca-Eval v2上,超越Claude-2.1、GPT-3.5-Turbo-0613。
甚至在部分任务中,得分已经超过前几个版本的GPT-4。
各地的开发者前来祝贺,其中0.5B的迷你版让不少人都迫不及待想试试。
并且还顺便问问,那个多模态大模型Qwen-VL-Max有可能开源吗?
除此之外,还集成到了Hugging face transformers,以及同主流的十余个框架合作,从微调、部署、量化到本地推理一步到位。
Qwen1.5开源此次开源发布,主要有四个方面值得关注。
首先,模型系列很多,直接开源了6种尺寸(0.5B、1.8B、4B、7B、14B、72B)的基础模型(base)、模型(chat)以及量化模型(包括Int4 和 Int8 GPTQ 模型,以及 AWQ 和 GGUF 量化模型)。
其次,更多的生态融入。
目前,Qwen1.5的代码合并到Hugging Face tr
原文链接:阿里大模型春节礼包来了:代码可执行率超GPT-4,1.5版本全系列开源
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...