专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮

AIGC动态3年前 (2024)发布 AI科技评论

AIGC动态欢迎阅读

原标题：专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮
关键字：模型,智能,团队,能力,参数
文章来源：AI科技评论
内容字数：14559字

内容摘要：

以小博大，面壁MiniCPM在大模型赛场上扔出了重磅。作者丨赖文昕、王悦
编辑丨陈彩娴
2月1日，刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。
MiniCPM 2B 有着当之无愧的「小钢炮」称号，其炸裂的点在于，从规模大小和性能来看，仅用2B 规模和1T tokens精选数据，便已在多项主流评测榜单、中英文平均成绩中超越被称为“欧洲最佳大模型”的Mistral-7B。
在与其他同等规模大模型的对比中，面壁MiniCPM表现依旧领先，大幅超越了 Llama2-7B, Mistral7B，Gemini Nano，Qwen-1.8B等一众模型，甚至还能越级比肩 Llama2-13B、Falcon 40B和Cohere 54B此类比自己庞大数十倍规模的模型。
可以说，面壁智能这次扔出的“2B小钢炮”，炸出了超越Mistral-7B发布的效果，展示了端侧大语言模型的无限潜力
针对面壁智能本次发布的大模型成果，AI 科技评论独家对话面壁智能 CTO 曾国洋后发现，面壁这个刚成立一年的团队背后，是

原文链接：专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮

联系作者

文章来源：AI科技评论
作者微信：aitechtalk
作者简介：雷峰网旗下AI新媒体。聚焦AI前沿研究，关注AI工程落地。

阅读原文

# AIGC动态 # 参数 # 团队 # 智能 # 模型 # 能力

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮

AIGC动态欢迎阅读

内容摘要：

联系作者

DARPA的量子计算项目技术介绍

清华系又造大模型标杆！2B规模干翻Mistral-7B，超低成本为AI Agent护航

相关文章

暂无评论

专访面壁曾国洋：踩过 1000 次大模型的坑后 ，造一个性能小钢炮

AIGC动态欢迎阅读

内容摘要：

联系作者

DARPA的量子计算项目技术介绍

清华系又造大模型标杆！2B规模干翻Mistral-7B，超低成本为AI Agent护航

相关文章

暂无评论

专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮