最受欢迎开源大模型,为什么是通义?

最受欢迎开源大模型,为什么是通义?

AIGC动态欢迎阅读

原标题:最受欢迎开源大模型,为什么是通义?
关键字:模型,开发者,阿里,尺寸,系列
文章来源:AI科技评论
内容字数:0字

内容摘要:


开源一年,通义千问的血缘模型已经达到 5 万多个。作者丨张进
编辑丨陈彩娴
开源与闭源之争早已非新奇的话题,但毋庸置疑的是,开源极大地促进了大模型技术发展和生态繁荣。
大模型被认为是最烧钱的技术,训练一个大模型往往需要大量的数据、计算资源,导致训练成本巨大,众所周知GPT-3的训练费用据说超过 4600万美元,在大模型开源之前,大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。
随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮,那些没有AI积累的企业、大量中小公司团队,今天个人开发者,都能基于开源底座模型,用很低的成本训练、部署自己的专属模型,llama 这样的开源先锋也因此拥有一众拥趸。
回到国内,在 llama、Mistral 这样的开源先锋影响下,国产开源也经历了百家争鸣阶段,如ChatGLM、Baichuan、DeepSeek、Qwen也曾掀起一阵阵开源浪潮。
“百模大战”至今不过一年多,全球开源格局已几经变换,最出人意料的一件事,莫过于国产开源大模型先发后至,有了比肩全球顶尖开源模型的影响力。通义千问开源模型,就是“国模


原文链接:最受欢迎开源大模型,为什么是通义?

联系作者

文章来源:AI科技评论
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...