大模型评测 - OpenI

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

1年前 (2025)

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

2年前 (2024)

智能体工作流生成基准WorfBench

1年前 (2025)

Phi-4：小模型的大智慧——技术详解及简单测评

1年前 (2025)

Chinese SafetyQA是全球第一个针对中文安全领域的系统性评估模型安全事实性知识的高质量评测集。

1年前 (2024)

原标题：腾讯联合智源发布升级版长文本理解基准测试模型—LongBench v2 文章来源：小夏聊AIGC 内容字数：1502字LongBench v2：衡量大型语言模型长文本理解能力...

1年前 (2024)

评测全面升级，多维度探索模型能力边界与应用潜能。

2年前 (2024)

还有四大专项评测榜单，探索模型能力边界与应用潜能

2年前 (2024)

还有四大专项评测榜单，探索模型能力边界与应用潜能

2年前 (2024)