LLM排行榜更新！谷歌Bard超过GPT-4，中国玩家未进前十

AIGC动态3年前 (2024)发布夕小瑶科技说

AIGC动态欢迎阅读

原标题：LLM排行榜更新！谷歌Bard超过GPT-4，中国玩家未进前十
关键字：模型,下图,科学家,用户,平局
文章来源：夕小瑶科技说
内容字数：2383字

内容摘要：

‍夕小瑶科技说原创作者 | 王二狗大家好我是二狗。
今天谷歌Bard的排名在Imsys的LLMs 排位赛上超过了GPT-4,直接跃居第二名（但没有超过OpenAI最新的 GPT-4 Turbo模型）:
遇到这好事，谷歌首席科学家 Jeff Dean 当然是第一时间前来“炫耀”，并给自家的 Gemini Pro模型带货。
排行榜介绍这个LLMs 排行榜（Chatbot Arena基准平台）是由 UC伯克利研究人员主导的LMSYS (Large Model Systems Organization)组织发起的。通过在LLMs 间进行随机匿名的 1V1 battle 方式，并基于 Elo 评级系统得出排名。
如下图所示，你可以随便问一个问题，左侧是模型A的回答，右侧是模型B的回答。然后你可以给这两个模型的回答打分，一共有四个选项「A更好；B更好；A和B一样好；A和B一样差」，如果一轮判断不出来，你可以继续，直到选出你认为更好的，但如果在过程中暴露了大模型的身份，则投票将不被计算在内。
下图显示了模型A在对战模型B时获胜几率（不包含平局）的比例分布图：
下图显示了每种模型组合的

原文链接：LLM排行榜更新！谷歌Bard超过GPT-4，中国玩家未进前十