戴琼海院士：开源后在 AlpacaEval 直追 GPT4，零一靠技术如何重建生态信心

AIGC动态3年前 (2023)发布人工智能学家

戴琼海院士：开源风波后在 AlpacaEval 直追 GPT4，零一靠技术如何重建生态信心

AIGC动态欢迎阅读

原标题：戴琼海院士：开源后在 AlpacaEval 直追 GPT4，零一靠技术如何重建生态信心

文章来源：人工智能学家

内容字数：4412字

内容摘要：来源：AI科技大本营斯坦福大学研发的大语言模型评测 AlpacaEval Leaderboard 备受业内认可，在 2023 年 12 月 7 日更新的排行榜中，Yi-34B-Chat 以 94.08% 的胜率，超越 LLaMA2 Chat 70B、Claude 2、ChatGPT，在 Alpaca 经认证的模型类别中，成为仅次于 GPT-4 英语能力的大语言模型。同一周，在加州大学伯克利分校主导的 LMSYS ORG 排行榜中，Yi-34B-Chat 也以1102 的 Elo 评分，晋升最新开源 SOTA 开源模型之列，性能表现追平 GPT-3.5。多个Benchmark遥遥领先在五花八门的大模型评测中，伯克利 LMSYS ORG 排行榜采用了一个最为接近用户体感的「机器人竞技场」特殊测评模式，让众多大语言模型在评测平台随机进行一对一 battle，通过众筹真实用户来进行线上实时盲…

原文链接：点此阅读原文：戴琼海院士：开源后在 AlpacaEval 直追 GPT4，零一靠技术如何重建生态信心