对标法国当红大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年

AIGC动态11个月前发布 甲子光年
30 0 0

对标法国当红大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年

AIGC动态欢迎阅读

原标题:对标法国当红大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年
关键字:知乎,模型,智能,小米,华为
文章来源:甲子光年
内容字数:10829字

内容摘要:


成本是大模型的隐形竞争力。作者|刘杨楠‍‍‍
编辑|赵健‍‍
今天,清华系大模型公司「面壁智能」发布了首款终端旗舰大模型“面壁MiniCPM”,面壁智能给它起了个响亮的名字——“小钢炮”。
据面壁智能联合创始人、CEO李大海介绍,面壁MiniCPM的参数规模为2B,采用1T精选数据,性能超越法国当红的大模型Mistral-7B,越级比肩LLama 2-13B。其中,Mistral-7B背后的公司Mistral AI,被称作“欧洲版的OpenAI”。
面壁MiniCPM核心实现的是用更小的尺寸、更低的成本,实现更强的性能。“小尺寸是模型技术的极限竞技场。”李大海说道。
所谓“端侧大模型”,即模型服务部署在手机、电脑、IoT设备等本地终端,直接由终端芯片完成推理过程,无需联网。2023年下半年,华为、小米、vivo、OPPO、荣耀、苹果、三星等海内外主流手机厂商均在端侧大模型有所布局,面壁智能则是第一个布局端侧模型的大模型厂商。
端侧大模型战火越演越烈,为何吸引众多厂商纷纷参与?以“大模型+Agent”为核心战略的面壁智能,为何又率先布局端侧大模型?
发布会后,「甲子光年」等媒体与面壁智能


原文链接:对标法国当红大模型Mistral,面壁智能如何用“小”模型超越“大”模型?|甲子光年

联系作者

文章来源:甲子光年
作者微信:jazzyear
作者简介:甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...