标签:基准
一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo
机器之心报道 编辑:陈萍、小舟开源大模型领域,又迎来一位强有力的竞争者。 近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专...
上海AI Lab开源首个可替代GPT-4V的多模态大模型
夕小瑶科技说 原创作者 | 任同学与开源和闭源模型相比,InternVL 1.5 在 OCR、多模态、数学和多轮对话等 18 个基准测试中的 8 个中取得了最先进的结果。 上海...
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
机器之心报道 编辑:佳琪、蛋酱当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。提高大型语言模型的...
苹果首次公布开源大模型,加紧和OpenAI谈判,我们从中找到了AI iPhone的细节
AI iPhone 怎么做?开源最近成了 AI 圈绕不开的高频热门词汇。 先有 Mistral 8x22B 闷声干大事,后有 Meta Llama 3 模型深夜炸场,现在连苹果也要下场参加这...
首批中文版Llama3模型来了,解释成语、答弱智吧问题
机器之心报道 编辑:小舟、张倩中文问题,中文回答。最近,Meta 推出了 Llama 3,为开源大模型树立了新的标杆。 和以往的原始 Llama 模型一样,Llama 3 对中...
微软来大招:手机部署堪比GPT3.5高性能大模型!
夕小瑶科技说 原创作者 | 任同学 上周 LLaMa3 算是把关注度拉爆了,这才过了几天,微软已经宣布自己的 Phi-3-mini (3.8B) 模型可以媲美 Mixtral 8x7B 和 GPT-...
微软发布Phi-3,性能超Llama-3,可手机端运行
机器之心报道 编辑:小舟、泽南数据已成为提升大模型能力的重点。Llama-3 刚发布没多久,竞争对手就来了,而且是可以在手机上运行的小体量模型。 本周二,微...
Meta AI 挑战 OpenAI!扎克伯格发布最强开源模型Llama 3,最大4000亿参数
大数据文摘受权转载自头部科技 文丨Congerry Meta 最新开源模型 Llama 3 如约而至。 上周,一位Meta员工透露,两款小型Llama 3模型将于本周发布。 今天,它来...
从文字模型到世界模型!Meta新研究让AI Agent理解物理世界
新智元报道编辑:Mindy 【新智元导读】Meta新发布的开放词汇体验问答(OpenEQA)基准,旨在衡量AI Agent对物理空间的理解能力,但目前AI Agent的水平还是无法...
马斯克旗下xAI发布首个多模态大模型!
大数据文摘受权转载自头部科技 文丨Congerry 3月中旬,马斯克旗下的 xAI 刚刚宣布开源 Grok-1 大模型! 一个月过去,xAI 又掏出了 Grok-1.5V。 Grok-1.5V是xA...
离世界模型更近一步!Meta开源OpenEQA,评估AI Agent情景理解能力
夕小瑶科技说 原创作者 | 任同学Yann LeCun 朝着 “世界模型” 又近了一步。 Meta最新的开源工作OpenEQA:从文字模型到世界模型,可以像人一样记忆、推理的新基...
今日arXiv最热NLP大模型论文:北京大学&快手发布统一的图文视频生成大模型Video-LaVIT
夕小瑶科技说 原创作者 | 芒果引言:探索视频与语言模型的新融合随着多模态大语言模型(LLMs)的新发展,人们越来越关注如何将它们从图像-文本数据扩展到更具...
马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合
新智元报道编辑:编辑部 【新智元导读】马斯克xAI的多模态模型Grok-1.5V横空出世了!不仅多项基准测试超越GPT-4V,而且看懂梗图写Python代码也都不在话下。并...
马斯克的首款多模态大模型来了,GPT-4V又被超越了一次
机器之心报道 机器之心编辑部自从 2023 年 11 月 Grok 首次亮相以来,马斯克的 xAI 正在大模型领域不断取得进步,向 OpenAI 等先行者发起进攻。在 Grok-1 开...
钥匙忘哪不知道,机器人帮你找!Meta最新开源OpenEQA,LeCun朝世界模型更近一步!
夕小瑶科技说 原创作者 | 任同学Yann LeCun 朝着 “世界模型” 又近了一步。 Meta最新的开源工作OpenEQA:从文字模型到世界模型,可以像人一样记忆、推理的新基...