LLM排行榜更新!谷歌Bard超过GPT-4,中国玩家未进前十

LLM排行榜更新!谷歌Bard超过GPT-4,中国玩家未进前十

AIGC动态欢迎阅读

原标题:LLM排行榜更新!谷歌Bard超过GPT-4,中国玩家未进前十
关键字:模型,下图,科学家,用户,平局
文章来源:夕小瑶科技说
内容字数:2383字

内容摘要:


‍夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。
今天谷歌Bard的排名在Imsys的LLMs 排位赛上超过了GPT-4,直接跃居第二名(但没有超过OpenAI最新的 GPT-4 Turbo模型):
遇到这好事,谷歌首席科学家 Jeff Dean 当然是第一时间前来“炫耀”,并给自家的 Gemini Pro模型带货。
排行榜介绍这个LLMs 排行榜(Chatbot Arena基准平台)是由 UC伯克利研究人员主导的LMSYS (Large Model Systems Organization)组织发起的。通过在LLMs 间进行随机匿名的 1V1 battle 方式,并基于 Elo 评级系统得出排名。
如下图所示,你可以随便问一个问题,左侧是模型A的回答,右侧是模型B的回答。然后你可以给这两个模型的回答打分,一共有四个选项「A更好;B更好;A和B一样好;A和B一样差」,如果一轮聊天判断不出来,你可以继续聊天,直到选出你认为更好的,但如果在聊天过程中暴露了大模型的身份,则投票将不被计算在内。
下图显示了模型A在对战模型B时获胜几率(不包含平局 )的比例分布图:
下图显示了每种模型组合的


原文链接:LLM排行榜更新!谷歌Bard超过GPT-4,中国玩家未进前十

联系作者

文章来源:夕小瑶科技说
作者微信:xixiaoyaoQAQ
作者简介:更快的AI前沿,更深的行业洞见。聚集25万AI应用开发者、算法工程师和研究人员。一线作者均来自清北、国外顶级AI实验室和互联网大厂,兼备媒体sense与技术深度。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...