AIGC动态欢迎阅读
原标题:专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮
关键字:模型,智能,团队,能力,参数
文章来源:AI科技评论
内容字数:14559字
内容摘要:
以小博大,面壁MiniCPM在大模型赛场上扔出了重磅炸弹。作者丨赖文昕、王悦
编辑丨陈彩娴
2月1日,刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。
MiniCPM 2B 有着当之无愧的「小钢炮」称号,其炸裂的点在于,从规模大小和性能来看,仅用2B 规模和1T tokens精选数据,便已在多项主流评测榜单、中英文平均成绩中超越被称为“欧洲最佳大模型”的Mistral-7B。
在与其他同等规模大模型的对比中,面壁MiniCPM表现依旧领先,大幅超越了 Llama2-7B, Mistral7B,Gemini Nano,Qwen-1.8B等一众模型,甚至还能越级比肩 Llama2-13B、Falcon 40B和Cohere 54B此类比自己庞大数十倍规模的模型。
可以说,面壁智能这次扔出的“2B小钢炮”,炸出了超越Mistral-7B发布的效果,展示了端侧大语言模型的无限潜力
针对面壁智能本次发布的大模型成果,AI 科技评论独家对话面壁智能 CTO 曾国洋后发现,面壁这个刚成立一年的团队背后,是
原文链接:专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮
联系作者
文章来源:AI科技评论
作者微信:aitechtalk
作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...