标签:竞技场

新测试基准发布,最强开源Llama 3尴尬了

梦晨 发自 凹非寺量子位 | 公众号 QbitAI如果试题太简单,学霸和学渣都能考90分,拉不开差距…… 随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需...
阅读原文

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI能打得过GPT-4的开源模型出现了! 大模型竞技场最新战报: 1040亿参数开源模型Command R+攀升至第6位,与GPT-4-0314...
阅读原文

GPT-4王冠没掉!Claude 3竞技场人类投票成绩出炉:仅居第三

丰色 发自 凹非寺量子位 | 公众号 QbitAIClaude 3的竞技场排名终于来了: 短短3天内,20000张投票,将榜单的流量推向空前。 最终,Claude 3最强的“大杯”模型O...
阅读原文
12