标签:基准

三年16篇一作,前谷歌研究科学家Yi Tay官宣新模型,21B媲美Gemini Pro、GPT-3.5

机器之心报道 编辑:陈萍该团队的新模型在多个基准测试中都与 Gemini Pro 、GPT-3.5 相媲美。 如果你经常读 AI 大模型方向的论文,Yi Tay 想必是一个熟悉的名...
阅读原文

通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5

机器之心报道 编辑:泽南超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 ...
阅读原文

击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了

机器之心报道 编辑:陈萍、小舟模型参数量只有 137M,5 天就能训练好。一周前,OpenAI 给广大用户发放福利,在下场修复 GPT-4 变懒的问题后,还顺道上新了 5 ...
阅读原文

无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍

机器之心报道 编辑:陈萍Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI ...
阅读原文

OpenAI官方下场修复GPT-4变懒,上新多个模型、还大降价

机器之心报道 编辑:杜伟、陈萍今天,OpenAI 一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。 ...
阅读原文

大模型推理成本排行榜来了:贾扬清公司效率领跑

机器之心报道 编辑:小舟、泽南风投烧完之后,哪些大模型创业公司会开始盈利? 「大模型的 API 是个亏本买卖吗?」随着大语言模型技术的逐渐实用化,越来越多...
阅读原文

无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用

机器之心专栏 机器之心编辑部随着人工智能技术的发展,以 GPT-4 为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。与此同时,大模型本身的安全...
阅读原文

最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发

新智元报道编辑:桃子 【新智元导读】Mixtral 8x7B模型开源后,AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-He...
阅读原文

开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了

机器之心报道 编辑:张倩又有新的开源模型可以用了。 从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准...
阅读原文

杀疯了的开源专家模型 Mixtral 8x7B 论文公开啦!

夕小瑶科技说 原创作者 | 付奶茶、王二狗上个月法国初创公司 Mistral AI 开源的一个8x7B MoE模型Mixtral 8x7B引爆了AI社区。 一是因为它的性能击败了LLama2和...
阅读原文

Mixtral 8x7B论文终于来了:架构细节、参数量首次曝光

机器之心报道 作者:陈萍、大盘鸡Mixtral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5。前段时间,那个爆火整个开源社区的 Mixtral 8x7B MoE 模型...
阅读原文

今日最热门AI论文Top5:高效微调、图生3D、AI Agent、大模型ChatGPT、图学习

夕小瑶科技说 原创作者 | 赛博马良本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。 论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马...
阅读原文

8x7B MoE与Flash Attention 2结合,不到10行代码实现快速推理

机器之心报道 编辑:陈萍感兴趣的小伙伴,可以跟着操作过程试一试。前段时间,Mistral AI 公布的 Mixtral 8x7B 模型爆火整个开源社区,其架构与 GPT-4 非常相...
阅读原文

微软发布 Orca 2 LLM,表现优于 10 倍参数模型

作者 | Anthony Alford 译者 | 明知山 策划 | 丁晓昀 微软发布 Orca 2 LLM,这是 Llama 2 的一个调优版本,性能与包含 10 倍参数的模型相当,甚至更好。Orca...
阅读原文

Ai Pin明年3月开始出货;昆仑万维天工SkyAgents公测;智源开源代码生成评测基准TACO丨AIGC大事日报

12/25 全球AIGC产业要闻 1、夸克App上线健康大模型应用 2、昆仑万维“天工SkyAgents”Beta版公测 3、智源开源代码生成训练数据集与评测基准TACO 4、首个汽车行...
阅读原文