面壁智能低调开源大模型“理科状元”！LeetCode 周赛超越80%人类选手，推理性能超 Llama3-70B

AIGC动态2年前 (2024)发布 AI前线

AIGC动态欢迎阅读

原标题：面壁智能低调开源大模型“理科状元”！LeetCode 周赛超越80%人类选手，推理性能超 Llama3-70B
关键字：模型,报告,小米,字节跳动,数据
文章来源：AI前线
内容字数：6073字

内容摘要：

整理 | 褚杏娟
在 4 月 18 日 Llama3 发布前两天，面壁智能低调开源了大模型 Eurux-8x22B。据悉，该模型在代码和数学等体现大模型核心素质的复杂推理综合性能方面超越 Llama3-70B，刷新开源大模型 SOTA，堪称“理科状元”。
除了开源时间早于 Llama3，Eurux-8x22B 的激活参数仅有 39B，推理速度更快，目前支持 64k 上下文，相比之下 Llama3-70B 的上下文大小为 8K。
此外，Eurux-8x22B 由 Mistral-8x22B 对齐而来，综合性能不输 Llama3-70B。
Eurux-8x22B 模型和对齐数据，全家桶开源：
https://github.com/OpenBMB/Eurus
https://huggingface.co/openbmb/Eurux-8x22b-ncaLeetCode 周赛超越 80% 人类选手复杂推理能力是体现大模型性能差异的最核心能力之一，也是大模型真正落地应用所需的关键能力所在。根据测评，Eurux-8x22B 在代码和数学等复杂推理的综合性能方面刷新开源大模型 SOTA。
具体而言，

原文链接：面壁智能低调开源大模型“理科状元”！LeetCode 周赛超越80%人类选手，推理性能超 Llama3-70B