C-Eval官网
大语言模型的多层次多学科中文评估套件
网站服务:C-Eval。
C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,如下所示。 通过 C-Eval 试题的测试后得到了一份中文大语言模型的排行榜,其中表现最好的是来自 是由清华大学和智谱 AI 联合研发的第二代 GLM 系列对话语言模型,其次是GPT – 4模型。
C-Eval网址入口
https://cevalbenchmark.com/index_zh.html#home_zh
OpenI小编发现C-Eval网站非常受用户欢迎,请访问C-Eval网址入口试用。
数据统计
数据评估
关于C-Eval特别声明
本站OpenI提供的C-Eval都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由OpenI实际控制,在2023年 9月 9日 上午9:52收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,OpenI不承担任何责任。
相关导航
暂无评论...