国产端侧小模型超越 GPT-4V，「多模态」能力飞升

AIGC动态2年前 (2024)发布 AI科技评论

AIGC动态欢迎阅读

原标题：国产端侧小模型超越 GPT-4V，「多模态」能力飞升
关键字：模型,能力,报告,终端,智能
文章来源：AI科技评论
内容字数：8731字

内容摘要：

端侧大模型的解耦难题：是模型适配终端，还是终端适配模型？作者 | 西西
编辑 | 陈彩娴
在刚刚过去的机器人学术顶会 ICRA 2024 上，「具身智能」成为热议，其中围绕具身智能的一个普遍疑问是：若将 AI 大模型应用到消费级机器人领域，首先是模型适配终端，还是终端适配模型？
过去一年，由于 6B、7B 等小模型的成果井喷，以及 MoE 训练技术的越发成熟，将模型跑在手机、学习机、平板电脑、机器人甚至汽车等等终端应用上的想象力开始变大，无论算法层还是硬件层都「蠢蠢欲动」。诚然，这已经成为一个明朗的行业方向，但在系统整合上却要面临不同话语体系之间的博弈。
以机器人为例。从算法层看，将模型做小是关键，但硬件厂商关心的却是模型能否适配自身的产品：
首先，消费机器人有固定的产品周期，从研发到投入市场往往要经历大半年到一年半左右的时间。因此，尽管 ChatGPT 破圈后已经过去一年多，但目前已经上市的扫地机中却没有已经部署大模型的产品；
其次，硬件底层的芯片有上限，芯片设计完后就是一个性能参数限定的「物理」产品，其中带宽能跑多少、内存能用多大都已经是已知数，这就直接了应用在硬件上的 AI 模型

原文链接：国产端侧小模型超越 GPT-4V，「多模态」能力飞升