国产端侧小模型超越 GPT-4V,「多模态」能力飞升

国产端侧小模型超越 GPT-4V,「多模态」能力飞升

AIGC动态欢迎阅读

原标题:国产端侧小模型超越 GPT-4V,「多模态」能力飞升
关键字:模型,能力,报告,终端,智能
文章来源:AI科技评论
内容字数:8731字

内容摘要:


端侧大模型的解耦难题:是模型适配终端,还是终端适配模型?作者 | 西西
编辑 | 陈彩娴
在刚刚过去的机器人学术顶会 ICRA 2024 上,「具身智能」成为热议,其中围绕具身智能的一个普遍疑问是:若将 AI 大模型应用到消费级机器人领域,首先是模型适配终端,还是终端适配模型?
过去一年,由于 6B、7B 等小模型的成果井喷,以及 MoE 训练技术的越发成熟,将模型跑在手机、学习机、平板电脑、机器人甚至汽车等等终端应用上的想象力开始变大,无论算法层还是硬件层都「蠢蠢欲动」。诚然,这已经成为一个明朗的行业方向,但在系统整合上却要面临不同话语体系之间的博弈。
以机器人为例。从算法层看,将模型做小是关键,但硬件厂商关心的却是模型能否适配自身的产品:
首先,消费机器人有固定的产品周期,从研发到投入市场往往要经历大半年到一年半左右的时间。因此,尽管 ChatGPT 破圈后已经过去一年多,但目前已经上市的扫地机中却没有已经部署大模型的产品;
其次,硬件底层的芯片有上限,芯片设计完后就是一个性能参数限定的「物理」产品,其中带宽能跑多少、内存能用多大都已经是已知数,这就直接了应用在硬件上的 AI 模型


原文链接:国产端侧小模型超越 GPT-4V,「多模态」能力飞升

联系作者

文章来源:AI科技评论
作者微信:aitechtalk
作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...