中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一

中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一

AIGC动态欢迎阅读

原标题:中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一
关键字:模型,用户,评分,提示,冗余
文章来源:机器之心
内容字数:8467字

内容摘要:


机器之心发布
机器之心编辑部上周,一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena,排名直接超过 GPT-4-Turbo、Gemini 1 .5 Pro、Claude 3 0pus、Llama-3-70b 等各家国际大厂的当家基座模型。随后 OpenAI 揭开 “im-also-a-good-gpt2-chatbot” 神秘面纱 —— 正是 GPT-4o 的测试版本,OpenAI CEO Sam Altman 也在 Gpt-4o 发布后亲自转帖引用 LMSYS arena 盲测擂台的测试结果。由开放研究组织 LMSYS Org (Large Model Systems Organization)发布的 Chatbot Arena 已经成为 OpenAI、Anthropic、Google、Meta 等国际大厂 “龙争虎斗” 的当红擂台,以最开放与科学的评测方法,在大模型进入第二年之际开放群众投票。
时隔一周,在最新更新的排名中,类 “im-also-a-good-gpt2-chatbot” 的黑马故事再次上演


原文链接:中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一

联系作者

文章来源:机器之心
作者微信:almosthuman2014
作者简介:专业的人工智能媒体和产业服务平台

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...