大模型盲测竞技场放榜！国产黑马冲进世界七强，中文并列第一

AIGC动态2年前 (2024)发布智东西

AIGC动态欢迎阅读

原标题：大模型盲测竞技场放榜！国产黑马冲进世界七强，中文并列第一
关键字：模型,万物,用户,评分,数据
文章来源：智东西
内容字数：9222字

内容摘要：

把大模型差距从7-10年降低到6个月，成立一年的国内AI独角兽是怎么做到的？
作者|ZeR0
编辑|漠影
智东西5月22日报道，周二，知名大模型竞技场LMSYS Chatboat Arena盲测评测结果更新，国内大模型独角兽零一万物的千亿参数闭源大模型Yi-Large在最新总榜中排名世界第七，中国大模型中第一，超过Llama-3-70B、Claude 3 Sonnet；其中文分榜更是与GPT-4o并列第一。
LMSYS Chatboat Arena由第三方非营利组织LMSYS Org发布，其盲测结果来自至今积累超过1170万的全球用户真实投票数。此次共有44款模型参赛，既包含了开源大模型Llama 3-70B，也包含了各家大厂的闭源模型。
Chatbot Arena评测过程涵盖了从用户直接参与投票到盲测，再到大规模的投票和动态更新的评分机制等多个方面，这些因素共同作用，确保了评测的客观性、权威性和专业性，能够更准确地反映出大模型在实际应用中的表现。
上周OpenAI的GPT-4o的测试版本便以“im-also-a-good-gpt2-chatbot”的马甲闯进Chatbot Arena

原文链接：大模型盲测竞技场放榜！国产黑马冲进世界七强，中文并列第一