戴琼海院士:开源风波后在 AlpacaEval 直追 GPT4,零一靠技术如何重建生态信心

戴琼海院士:开源风波后在 AlpacaEval 直追 GPT4,零一靠技术如何重建生态信心

AIGC动态欢迎阅读

原标题:戴琼海院士:开源风波后在 AlpacaEval 直追 GPT4,零一靠技术如何重建生态信心

关键字:模型,报告,架构,张量,数据

文章来源:人工智能学家

内容字数:4412字

内容摘要:来源:AI科技大本营斯坦福大学研发的大语言模型评测 AlpacaEval Leaderboard 备受业内认可,在 2023 年 12 月 7 日 更新的排行榜中,Yi-34B-Chat 以 94.08% 的胜率,超越 LLaMA2 Chat 70B、Claude 2、ChatGPT,在 Alpaca 经认证的模型类别中,成为仅次于 GPT-4 英语能力的大语言模型。同一周,在加州大学伯克利分校主导的 LMSYS ORG 排行榜中,Yi-34B-Chat 也以1102 的 Elo 评分,晋升最新开源 SOTA 开源模型之列,性能表现追平 GPT-3.5。多个Benchmark遥遥领先在五花八门的大模型评测中,伯克利 LMSYS ORG 排行榜采用了一个最为接近用户体感的「聊天机器人竞技场」特殊测评模式,让众多大语言模型在评测平台随机进行一对一 battle,通过众筹真实用户来进行线上实时盲…

原文链接:点此阅读原文:戴琼海院士:开源风波后在 AlpacaEval 直追 GPT4,零一靠技术如何重建生态信心

联系作者

文章来源:人工智能学家

作者微信:AItists

作者简介:致力成为权威的人工智能科技媒体和前沿科技研究机构

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...