AIGC动态欢迎阅读
原标题:苹果首次披露多模态大模型!AI 大招什么时候上 iPhone
关键字:模型,数据,图像,研究人员,解读
文章来源:爱范儿
内容字数:8283字
内容摘要:
一直在大模型浪潮有点克制的苹果,终于不再低调了。在今年的苹果股东大会上,库克罕见地谈及了生成式 AI。
苹果 2024 年将在生成式 AI 领域「开辟新天地」。
今天,苹果首次揭晓了在多模态大型语言模型(LLM)研究领域的最新突破。
这是一篇题为《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的学术论文,里面详细介绍了具有高达 30B 参数规模的系列多模态 LLM。
不只是数苹果!超大杯自带火眼金睛
直入主题,先来看看「超大杯」 MM1-30B-Chat 的能力。
MM1-30B-Chat 不仅准确无误地数出图片中苹果、橙子的数量,而且面对一连串数字的识别,也能轻松应对。
难度也进一步升级,研究人员设置了个陷阱问题,询问 MM1-30B-Chat 能看到图片中的红球吗?
并未中招的它能够明确地回应道:「图片中并无红球,我所见到的是一只猫正坐在沙发的枕头上,除此之外,别无他物。」
我们时常在朋友圈上看到飞机上随手一拍的风景图,那 MM1-30B-Chat 会怎么解读这些风景图呢?
目睹这幅图像,人们会
原文链接:苹果首次披露多模态大模型!AI 大招什么时候上 iPhone
联系作者
文章来源:爱范儿
作者微信:ifanr
作者简介:关注明日产品的数字潮牌
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...