AIGC动态欢迎阅读
原标题:1元=1700000tokens!清华系发布国产Mistral仅2B,老手机都带得动,GitHub一天斩获300+星
关键字:小钢炮,模型,华为,小米,报告
文章来源:量子位
内容字数:9484字
内容摘要:
金磊 发自 凹非寺量子位 | 公众号 QbitAI一个体量仅为2B的大模型,能有什么用?
答案可能超出你的想象。
因为若是用四个字来概括,那就是“多、快、好、省”:
多:它是业界第一个在端侧部署多模态的大模型。
快:一张1080Ti可高效微调、一台机器可以持续训练。
好:性能跟体量极具反差感,在多项成绩中超越了一众主流“大体量”大模型。
省:1元=1700000 tokens,成本为Mistral-Medium百分之一
那么,这个能够“以小博大”,颇有四两拨千斤意味的大模型,到底什么来头?
不卖关子,它正是由清华系初创公司面壁智能最新发布的旗舰终端大模型——MiniCPM。
并且团队还给它起了个别具一格的昵称——小钢炮。
而在众多亮点之间,最令人意外的还是小钢炮用2B的“姿势”所表现出来的性能。
例如与同样是采用“以小博大”路数的大模型标杆之作Mistral-7B做比较,小钢炮多项标准测试成绩均胜出:
再把与小钢炮同“体量”的选手拉出来,大部分能力依旧是处于领先,并且英文能力还是较为出众的那种:
即使把Mistral-7B更大的模型拉进来同台比擂,例如Llama2-13B、MPT-13
原文链接:1元=1700000tokens!清华系发布国产Mistral仅2B,老手机都带得动,GitHub一天斩获300+星
联系作者
文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...