标签:大模型评测

AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!

这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...

开源小模型的大智慧!微软Phi-4技术报告解读与简单测评

Phi-4:小模型的大智慧——技术详解及简单测评
阅读原文

中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集,仅三个大模型达及格线

Chinese SafetyQA是全球第一个针对中文安全领域的系统性评估模型安全事实性知识的高质量评测集。
阅读原文

腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2

原标题:腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2 文章来源:小夏聊AIGC 内容字数:1502字LongBench v2:衡量大型语言模型长文本理解能力...
阅读原文

智源发布FlagEval「百模」评测结果,丈量模型生态变局

评测全面升级,多维度探索模型能力边界与应用潜能。
阅读原文

智源发布FlagEval评测:全球100+大模型多模态表现一览!

还有四大专项评测榜单,探索模型能力边界与应用潜能
阅读原文