ZeroSearch

ZeroSearch – 阿里通义开源的大模型搜索引擎框架

ZeroSearch

ZeroSearch 是阿里巴巴通义实验室推出的一款开源创新大模型搜索引擎框架，依托强化学习技术提升大模型的搜索性能，而无需依赖真实搜索引擎的交互。该框架利用大模型的预训练知识，将其转化为检索模块，能够根据用户查询生成相关或噪声文档，并能够动态调整生成文档的质量。

ZeroSearch是什么

ZeroSearch 是阿里巴巴通义实验室开源的一款前沿大模型搜索引擎框架，利用强化学习来提升大模型的搜索能力，完全不需要与真实搜索引擎（如谷歌）进行交互。该框架基于大模型的预训练知识，构建了一个检索模块，能够根据输入查询生成相关或噪声型文档，并动态调节生成的文档质量。在多个问答数据集上，ZeroSearch 的表现超越了谷歌搜索，显著降低了训练成本（超过80%）。通过轻量级的监督微调和课程学习机制，ZeroSearch 可以逐步增强模型的推理能力，支持多种强化学习算法，展现出强大的扩展性和通用性。

ZeroSearch的主要功能

无需真实搜索引擎交互：通过模拟搜索引擎的方式，激发大模型的搜索能力，避免与真实搜索引擎的交互，从而降低成本和不确定性。
动态控制文档质量：支持生成相关或噪声文档，用户可以通过调整提示中的关键词灵活控制生成文档的质量，从而为训练提供丰富多样的检索场景。
降低成本：与依赖真实搜索引擎进行强化学习训练相比，ZeroSearch 的训练成本大幅降低（超过80%），使得大规模训练变得更加可行。
支持多种模型和算法：兼容多种参数规模的大模型（如3B、7B、14B），并支持多种强化学习算法（如PPO、GRPO）。

ZeroSearch的技术原理

模拟搜索引擎：基于大模型自身的知识，构建模拟搜索引擎，能够根据查询生成相关或噪声文档，取代真实搜索引擎的功能。
轻量级监督微调：通过少量标注数据对大模型进行微调，生成高质量或低质量的文档，以满足不同的训练需求。
课程学习机制：在训练过程中逐步提高文档的噪声水平，让模型从简单场景起步，逐渐适应更具挑战性的任务，提升推理能力。
基于 F1 分数的奖励机制：使用 F1 分数作为奖励信号，专注于答案的准确性，确保模型生成的答案尽可能与真实答案一致。
多轮交互模板：设计明确的推理、搜索和回答阶段，使用结构化标签（如 <think>、<search>、<answer>）引导模型逐步完成任务。

ZeroSearch的项目地址

项目官网：https://alibaba-nlp.github.io/ZeroSearch/
GitHub仓库：https://github.com/Alibaba-nlp/ZeroSearch
HuggingFace模型库：https://huggingface.co/collections/sunhaonlp/zerosearch
arXiv技术论文：https://arxiv.org/pdf/2505.04588

ZeroSearch的应用场景

智能问答系统：能够快速、准确地回答用户提问，适合用于智能客服和智能助手。
内容创作：为内容创作者提供信息支持，帮助生成初稿或提供创作灵感，适用于新闻、文案及学术写作。
教育与学习：为学生提供即时解答，支持在线教育及智能辅导。
企业知识管理：帮助员工高效检索公司内部资源，提高工作效率。
研究与开发：为研究人员提供最新研究成果，助力加速研究进程。

常见问题

ZeroSearch是否适合所有领域的搜索需求？：ZeroSearch 的灵活性和扩展性使其能适应多种领域的搜索需求，特别是在智能问答和内容创作方面表现优异。
如何开始使用ZeroSearch？：用户可以访问ZeroSearch的官网或GitHub仓库，获取详细的使用说明和示例代码。
ZeroSearch的训练成本真的能降低80%吗？：根据实际测试，与传统方法相比，ZeroSearch在训练成本上确实实现了显著降低。
ZeroSearch支持哪些大模型？：ZeroSearch兼容多种参数规模的大模型，用户可以选择适合自己需求的模型。

阅读原文