大模型盲测竞技场放榜!国产黑马冲进世界七强,中文并列第一

AIGC动态7个月前发布 智东西
10 0 0

大模型盲测竞技场放榜!国产黑马冲进世界七强,中文并列第一

AIGC动态欢迎阅读

原标题:大模型盲测竞技场放榜!国产黑马冲进世界七强,中文并列第一
关键字:模型,万物,用户,评分,数据
文章来源:智东西
内容字数:9222字

内容摘要:


把大模型差距从7-10年降低到6个月,成立一年的国内AI独角兽是怎么做到的?
作者|ZeR0
编辑|漠影
智东西5月22日报道,周二,知名大模型竞技场LMSYS Chatboat Arena盲测评测结果更新,国内大模型独角兽零一万物的千亿参数闭源大模型Yi-Large在最新总榜中排名世界第七,中国大模型中第一,超过Llama-3-70B、Claude 3 Sonnet;其中文分榜更是与GPT-4o并列第一。
LMSYS Chatboat Arena由第三方非营利组织LMSYS Org发布,其盲测结果来自至今积累超过1170万的全球用户真实投票数。此次共有44款模型参赛,既包含了开源大模型Llama 3-70B,也包含了各家大厂的闭源模型。
Chatbot Arena评测过程涵盖了从用户直接参与投票到盲测,再到大规模的投票和动态更新的评分机制等多个方面,这些因素共同作用,确保了评测的客观性、权威性和专业性,能够更准确地反映出大模型在实际应用中的表现。
上周OpenAI的GPT-4o的测试版本便以“im-also-a-good-gpt2-chatbot”的马甲闯进Chatbot Arena


原文链接:大模型盲测竞技场放榜!国产黑马冲进世界七强,中文并列第一

联系作者

文章来源:智东西
作者微信:zhidxcom
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...