2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源

AIGC动态10个月前发布 机器之心
20 0 0

2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源

AIGC动态欢迎阅读

原标题:2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源
关键字:模型,智能,报告,性能,参数
文章来源:机器之心
内容字数:4086字

内容摘要:


机器之心报道
编辑:泽南千元机也能本地运行。在大模型不断向着大体量方向前进的同时,最近一段时间,人们在优化和部署方面也取得了成果。
2 月 1 日,面壁智能联合清华 NLP 实验室在北京正式发布了旗舰端侧大模型「面壁 MiniCPM」。新一代大模型被称为「性能小钢炮」,直接拥抱终端部署,同时也具有同量级最强的多模态能力。
面壁智能本次提出的 MiniCPM 2B 参数量仅有 20 亿,使用 1T token 的精选数据训练。这是一个参数量上与 2018 年 BERT 同级的模型,面壁智能在其之上实现了极致的性能优化与成本控制,让该模型可以「越级打怪」。
面壁智能联合创始人、CEO 李大海将新模型与业内知名开源大模型 Mistral-7B 进行了对比,在多项主流评测榜单上,MiniCPM 2B 的性能全面超越了后者。与微软近期提出的「小模型」Phi-2 相比,MiniCPM 也有很大优势。李大海表示,面壁智能的新模型还能越级实现 13B、30B 甚至 40B 模型的能力。在最接近用户体验的评测榜单 MT-Bench 上,MiniCPM 取得了 7 分的成绩(GPT-4-Turbo 为 9


原文链接:2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...