开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了

AIGC动态3年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了
关键字：模型,数据,基准,性能,链接
文章来源：机器之心
内容字数：3247字

内容摘要：

机器之心报道
编辑：张倩又有新的开源模型可以用了。
从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5，因此它也被认为是一种「非常接近 GPT-4」的开源选项。
在前段时间的一篇论文中，该模型背后的公司 Mistral AI 公布了 Mixtral 8x7B 的一些技术细节，并推出了 Mixtral 8x7B – Instruct 模型。该模型性能在人类评估基准上明显超过了 GPT-3.5 Turbo、Claude-2.1、Gemini Pro 和 Llama 2 70B 模型。在 BBQ 和 BOLD 等基准中，Mixtral – Instruct 也显示出更少的偏见。
但最近，Mixtral Instruct 也被超越了。一家名叫 Nous Research 的公司宣布，他们基于 Mixtral 8x7B 训练的新模型 ——Nous-Hermes-2 Mixtral 8x7B 在很多基准上都超过了 Mixtral Instruct，

原文链接：开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了