标签：性能评估

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

1年前 (2025)

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

2年前 (2024)

评估模型（Judge models）是用于评估其他模型输出质量的辅助模型，充当“裁判员”的角色，对大语言模型（LLM）的输出结果进行评估和打分。模型通过输入问题和待...

1年前 (2025)

基准测试（Benchmarking）是一种评估和比较系统性能的方法，通过一系列标准化的测试程序来测量系统的性能表现。这种测试可以帮助确定系统在特定条件下的性能...

2年前 (2024)

目标函数（Objective Function）是数学优化问题中的核心概念，它表示所关心的目标与影响因素之间的函数关系。简单来说，目标函数是你试图通过计算或优化来实...

2年前 (2024)

目前还只是Preview版

2年前 (2024)

AutoTrain（AutoTrain Advanced）是Hugging Face推出的开源无代码平台，能简化最先进模型的训练过程。支持用户无需编写代码即可创建、微调和部署自己的AI模型...

2年前 (2024)

UniBench是Meta FAIR机构推出的视觉语言模型(VLM)评估框架，对视觉语言模型(VLM)进行全面评估。UniBench包含50多个基准测试，涵盖物体识别、空间理解、推理等...

2年前 (2024)

监督学习(Supervised Learning)是一种机器学习方法，通过使用带有标签的训练数据来训练算法，使其能够对新的数据进行分类或预测。它包括分类和回归任务，利用...

2年前 (2024)