大模型一对一战斗75万轮，GPT-4夺冠，Llama 3位列第五

AIGC动态2年前 (2024)发布量子位

AIGC动态欢迎阅读

原标题：大模型一对一战斗75万轮，GPT-4夺冠，Llama 3位列第五
关键字：模型,版本,测试,大杯,英文
文章来源：量子位
内容字数：3916字

内容摘要：

克雷西发自凹非寺量子位 | 公众号 QbitAI关于Llama 3，又有测试结果新鲜出炉——
大模型评测社区LMSYS发布了一份大模型排行榜单，Llama 3位列第五，英文单项与GPT-4并列第一。
不同于其他Benchmark，这份榜单的依据是模型一对一battle，由全网测评者自行命题并打分。
最终，Llama 3取得了榜单中的第五名，排在前面的是GPT-4的三个不同版本，以及Claude 3超大杯Opus。
而在英文单项榜单中，Llama 3反超了Claude，与GPT-4打成了平手。
对于这一结果，Meta的首席科学家LeCun十分高兴，转发了推文并留下了一个“Nice”。
PyTorch之父Soumith Chintala也激动地表示，这样的成果令人难以置信，对Meta感到骄傲。
Llama 3的400B版本还没出来，单靠70B参数就获得了第五名……我还记得去年三月GPT-4发布的时候，达到与之相同的表现几乎是一件不可能的事。……现在AI的普及化实在是令人难以置信，我对Meta AI的同仁们做出这样的成功感到非常骄傲。
那么，这份榜单具体展示了什么样的结果呢？
近90个模

原文链接：大模型一对一战斗75万轮，GPT-4夺冠，Llama 3位列第五