中国大模型头名易主：全球盲测榜单上，Yi-Large与GPT-4o中文并列第一

AIGC动态2年前 (2024)发布机器之心

AIGC动态欢迎阅读

原标题：中国大模型头名易主：全球盲测榜单上，Yi-Large与GPT-4o中文并列第一
关键字：模型,用户,评分,提示,冗余
文章来源：机器之心
内容字数：8467字

内容摘要：

机器之心发布
机器之心编辑部上周，一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena，排名直接超过 GPT-4-Turbo、Gemini 1 .5 Pro、Claude 3 0pus、Llama-3-70b 等各家国际大厂的当家基座模型。随后 OpenAI 揭开 “im-also-a-good-gpt2-chatbot” 神秘面纱 —— 正是 GPT-4o 的测试版本，OpenAI CEO Sam Altman 也在 Gpt-4o 发布后亲自转帖引用 LMSYS arena 盲测擂台的测试结果。由开放研究组织 LMSYS Org （Large Model Systems Organization）发布的 Chatbot Arena 已经成为 OpenAI、Anthropic、Google、Meta 等国际大厂 “龙争虎斗” 的当红擂台，以最开放与科学的评测方法，在大模型进入第二年之际开放群众投票。
时隔一周，在最新更新的排名中，类 “im-also-a-good-gpt2-chatbot” 的黑马故事再次上演

原文链接：中国大模型头名易主：全球盲测榜单上，Yi-Large与GPT-4o中文并列第一