DeepRAG

DeepRAG – 中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成框架

DeepRAG是什么

DeepRAG是由中国科学院、中国科学技术大学及腾讯微信AI部合作开发的一种全新检索增强生成(RAG)框架,旨在提升大型语言模型(LLMs)在推理和检索任务上的表现。该框架通过将检索增强推理视为马尔可夫决策过程(MDP),引入“检索叙事”和“原子决策”两个关键元素,从而实现了结构化且自适应的检索流程。DeepRAG的核心在于动态决策:模型在每个步骤会根据当前状态判断是否需要检索外部知识,或仅依赖其内部参数进行推理。

DeepRAG

DeepRAG的主要功能

  • 动态检索决策:DeepRAG能够在每一步动态决定是否检索外部知识,或仅使用模型本身的知识进行推理,避免了不必要的检索操作,从而提高了检索效率,减少了噪声和推理延迟。
  • 结构化检索流程:通过引入“检索叙事”,DeepRAG确保检索过程是有序且适应性的。模型根据先前检索到的信息生成新的子查询,逐步推进推理过程,更有效地处理复杂的查询。
  • 知识边界校准:DeepRAG应用“校准链”方法,帮助模型更精准地识别自身知识的界限。模型能够更好地判断何时需要检索外部信息,何时可以依靠自己的知识进行推理,从而提升答案的准确性和可靠性。
  • 提升检索效率和答案准确性:实验结果显示,DeepRAG在多个开放域问答数据集上显著提高了答案的准确性(平均提升21.99%),同时减少了检索次数,优化了整体检索效率。
  • 泛化能力与鲁棒性:DeepRAG在时间敏感及分布外的问答任务中展现出优异的泛化能力和鲁棒性,能够适应不同的问答场景及数据分布。

DeepRAG的技术原理

  • 马尔可夫决策过程(MDP)建模:DeepRAG将检索增强推理过程建模为MDP,表示原始问题的部分解决方案。状态st包含输入问题x及当前的子查询和中间答案,决策分为两个子项:
    • 终止决策(Termination Decision):决定是否生成下一个子查询,或直接输出最终答案。
    • 原子决策(Atomic Decision):决定是否进行外部检索,或仅依赖模型的内部知识。
  • 状态转移(Transitions):根据所做的决策更新状态。如果选择检索,模型会获取相关文档并生成中间答案;如果选择不检索,则直接生成中间答案。
  • 奖励机制(Rewards):根据答案的正确性和检索成本评估状态。奖励函数旨在最大化答案的准确性,同时最小化检索成本。
  • 二叉树搜索(Binary Tree Search):DeepRAG采用二叉树搜索策略为每个子查询构建推理路径。在每个子查询中,模型生成两个分支:一个基于参数知识直接生成答案,另一个通过检索外部知识生成答案。这种方式允许模型探索不同的检索策略,构建从问题到最终答案的完整推理路径。二叉树搜索能够分解问题,全面分析检索选择对最终答案的影响。
  • 模仿学习(Imitation Learning):模仿学习旨在让模型掌握有效的检索模式。通过优先队列高效探索潜在的推理轨迹,优先选择检索成本较低的路径。结合二叉树搜索合成的数据,提取出达成正确最终答案的推理过程。利用这些合成数据对模型进行微调,提高其终止决策和原子决策的能力,同时增强查询分解和可靠中间答案生成的能力。
  • 校准链(Chain of Calibration):校准链方法进一步优化模型对自身知识边界的认识。通过合成偏好数据确定何时需要检索,基于最优路径生成,指示每个子查询的首选检索策略。利用这些偏好数据对模型进行微调,增强其基于内部知识边界的原子决策能力。通过校准链,模型能更准确地判断何时需要外部知识,从而依赖自身知识进行推理。

DeepRAG的项目地址

DeepRAG的应用场景

  • 开放域问答:DeepRAG能够处理复杂的多跳问答任务,通过逐步分解问题并动态检索相关信息,生成准确的答案。
  • 知识库问答:在知识库问答场景中,DeepRAG可以结合外部知识库(如)和模型自身的知识,提供更精确的答案。
  • 智能客服与虚拟助手:DeepRAG可应用于智能客服系统,通过动态检索和推理,提供更准确且及时的客户支持。
  • 教育与学习辅助:在教育领域,DeepRAG能够帮助学生和教师获取更准确的知识和信息,依据学生的学习进度和需求,动态生成学习材料和练习题。
  • 医疗健康咨询:DeepRAG可以用于医疗健康咨询,通过检索最新的医学研究和临床指南,提供精准的健康建议。
阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...