大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五

AIGC动态8个月前发布 量子位
11 0 0

大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五

AIGC动态欢迎阅读

原标题:大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五
关键字:模型,版本,测试,大杯,英文
文章来源:量子位
内容字数:3916字

内容摘要:


克雷西 发自 凹非寺量子位 | 公众号 QbitAI关于Llama 3,又有测试结果新鲜出炉——
大模型评测社区LMSYS发布了一份大模型排行榜单,Llama 3位列第五,英文单项与GPT-4并列第一。
不同于其他Benchmark,这份榜单的依据是模型一对一battle,由全网测评者自行命题并打分。
最终,Llama 3取得了榜单中的第五名,排在前面的是GPT-4的三个不同版本,以及Claude 3超大杯Opus。
而在英文单项榜单中,Llama 3反超了Claude,与GPT-4打成了平手。
对于这一结果,Meta的首席科学家LeCun十分高兴,转发了推文并留下了一个“Nice”。
PyTorch之父Soumith Chintala也激动地表示,这样的成果令人难以置信,对Meta感到骄傲。
Llama 3的400B版本还没出来,单靠70B参数就获得了第五名……我还记得去年三月GPT-4发布的时候,达到与之相同的表现几乎是一件不可能的事。……现在AI的普及化实在是令人难以置信,我对Meta AI的同仁们做出这样的成功感到非常骄傲。
那么,这份榜单具体展示了什么样的结果呢?
近90个模


原文链接:大模型一对一战斗75万轮,GPT-4夺冠,Llama 3位列第五

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...