Verifier Engineering：创新后训练范式推动产品智能化与个性化升级

Verifier Engineering是一种新颖的后训练范式，由中国科学院、阿里巴巴和小红书联合推出，旨在为基础模型设计提供有效的监督信号。该技术通过自动化验证器执行验证任务，并向基础模型反馈信息，分为搜索、验证和反馈三个阶段，从而显著优化模型性能。基于闭环反馈机制，Verifier Engineering强化了模型的泛化能力，为实现人工通用智能迈出了重要一步。

Verifier Engineering是什么

Verifier Engineering（验证器工程）是一种创新的后训练策略，专为基础模型设计，旨在解决有效监督信号的提供问题。通过自动化验证器执行验证任务并反馈信息，该方法分为搜索、验证和反馈三个阶段，以优化模型的性能。借助闭环反馈机制，Verifier Engineering不仅提升了模型的准确性，还增强了其泛化能力，是实现人工通用智能的关键步骤。

Verifier Engineering的主要功能

搜索（Search）：根据指定指令，从模型输出中采样具有代表性或潜在问题的样本。
验证（Verify）：利用多种验证器（如规则检测、评估指标或人工注释）评估生成的候选响应。
反馈（Feedback）：基于验证结果，采用监督式微调或上下文学习等方法提升模型性能。
持续优化模型性能：通过闭环反馈机制，不断提高模型的准确性和可靠性。

Verifier Engineering的技术原理

目标条件马尔可夫决策过程（GC-MDP）：将验证器工程形式化为GC-MDP，涵盖状态空间、动作空间、转移函数、目标空间、目标分布和奖励函数。
搜索结构：实施线性搜索和树搜索，在状态-动作空间内导航，以平衡探索与利用。
验证器分类：依据验证形式（如二进制、分数、排名、文本反馈）、验证粒度（标记级、思想级、轨迹级）、验证器来源（基于程序或模型）以及是否需额外训练对验证器进行分类。
反馈方法：
- 基于训练的反馈：通过高效的数据更新模型参数。
- 基于推理的反馈：在推理过程中调整输入或策略，而不更改模型参数。