首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源
关键字：模型,语言,视觉,复杂度,本文
文章来源：机器之心
内容字数：6574字

内容摘要：

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com。引言
近年来，多模态大型语言模型（MLLM）在各个领域的应用取得了显著的成功。然而，作为许多下游任务的基础模型，当前的 MLLM 由众所周知的 Transformer 网络构成，这种网络具有较低效的二次计算复杂度。为了提高这类基础模型的效率，大量的实验表明：（1）Cobra 与当前计算效率高的最先进方法（例如，LLaVA-Phi，TinyLLaVA 和 MobileVLM v2）具有极具竞争力的性能，并且由于 Cobra 的线性序列建模，其速度更快。（2）有趣的是，封闭集挑战性预测基准的结果显示，Cobra 在克服视觉错觉和空间关系判断方面表现良好。（3）值得注意的是，Cobra 甚至在参数数量只有 LLaVA 的 43% 左右的情况下，也取得了与 LLaV

原文链接：首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

联系作者

文章来源：机器之心
作者微信：almosthuman2014
作者简介：专业的人工智能媒体和产业服务平台

阅读原文

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

AIGC动态欢迎阅读

内容摘要：

联系作者

时代2024最具影响力100人：黄仁勋、Bengio、纳德拉、王传福等人入选

AI重建粒子轨迹，发现新物理学

相关文章

暂无评论

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

AIGC动态欢迎阅读

内容摘要：

联系作者

时代2024最具影响力100人：黄仁勋、Bengio、纳德拉 、王传福等人入选

AI重建粒子轨迹，发现新物理学

相关文章

暂无评论

时代2024最具影响力100人：黄仁勋、Bengio、纳德拉、王传福等人入选