标签:基准
开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
机器之心报道 机器之心编辑部刚刚,谷歌杀入开源大模型。 开源领域大模型,迎来了重磅新玩家。 谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma ...
三年16篇一作,前谷歌研究科学家Yi Tay官宣新模型,21B媲美Gemini Pro、GPT-3.5
机器之心报道 编辑:陈萍该团队的新模型在多个基准测试中都与 Gemini Pro 、GPT-3.5 相媲美。 如果你经常读 AI 大模型方向的论文,Yi Tay 想必是一个熟悉的名...
通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5
机器之心报道 编辑:泽南超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 ...
击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
机器之心报道 编辑:陈萍、小舟模型参数量只有 137M,5 天就能训练好。一周前,OpenAI 给广大用户发放福利,在下场修复 GPT-4 变懒的问题后,还顺道上新了 5 ...
无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍
机器之心报道 编辑:陈萍Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI ...
OpenAI官方下场修复GPT-4变懒,上新多个模型、还大降价
机器之心报道 编辑:杜伟、陈萍今天,OpenAI 一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。 ...
大模型推理成本排行榜来了:贾扬清公司效率领跑
机器之心报道 编辑:小舟、泽南风投烧完之后,哪些大模型创业公司会开始盈利? 「大模型的 API 是个亏本买卖吗?」随着大语言模型技术的逐渐实用化,越来越多...
无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用
机器之心专栏 机器之心编辑部随着人工智能技术的发展,以 GPT-4 为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。与此同时,大模型本身的安全...
最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发
新智元报道编辑:桃子 【新智元导读】Mixtral 8x7B模型开源后,AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-He...
开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了
机器之心报道 编辑:张倩又有新的开源模型可以用了。 从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准...
杀疯了的开源专家模型 Mixtral 8x7B 论文公开啦!
夕小瑶科技说 原创作者 | 付奶茶、王二狗上个月法国初创公司 Mistral AI 开源的一个8x7B MoE模型Mixtral 8x7B引爆了AI社区。 一是因为它的性能击败了LLama2和...
Mixtral 8x7B论文终于来了:架构细节、参数量首次曝光
机器之心报道 作者:陈萍、大盘鸡Mixtral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5。前段时间,那个爆火整个开源社区的 Mixtral 8x7B MoE 模型...
今日最热门AI论文Top5:高效微调、图生3D、AI Agent、大模型ChatGPT、图学习
夕小瑶科技说 原创作者 | 赛博马良本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。 论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马...
8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理
机器之心报道 编辑:陈萍感兴趣的小伙伴,可以跟着操作过程试一试。前段时间,Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区,其架构与 GPT-4 非常相...
微软发布 Orca 2 LLM,表现优于 10 倍参数模型
作者 | Anthony Alford 译者 | 明知山 策划 | 丁晓昀 微软发布 Orca 2 LLM,这是 Llama 2 的一个调优版本,性能与包含 10 倍参数的模型相当,甚至更好。Orca...