MiniRAG – 港大推出高效部署小语言模型的新型 RAG 系统
MiniRAG是什么
MiniRAG是由香港大学开发的一种创新型检索增强生成(RAG)系统,旨在资源受限的环境中高效部署小型语言模型(SLMs)。该系统的设计基于两项核心技术:首先是语义感知的异构图索引机制,通过结合文本片段和命名实体,降低对复杂语义理解的依赖;其次是轻量级拓扑增强检索方法,利用图结构进行高效的知识发现,避免对高级语言能力的需求。MiniRAG在实验中展示了与大型语言模型(LLMs)相当的性能,同时仅需25%的存储空间。它提供了全面的基准数据集,以评估轻量级RAG系统在实际设备环境下的表现,推动在资源受限的环境中高效且私密的RAG系统的发展。
MiniRAG的主要功能
- 高效的知识检索:凭借独特的异构图索引机制,MiniRAG能够快速准确地从海量数据中提取与用户查询最相关的知识,从而为生成精准的回答提供支持。
- 轻量级的模型兼容性:该系统专为小型语言模型(SLMs)设计,在不显著降低性能的前提下,显著减少对计算资源和存储空间的需求,使其更适合在资源有限的设备上运行。
- 强大的推理能力:通过查询引导的推理路径发现机制,MiniRAG能够处理复杂的多步骤推理任务,即使在SLMs的语义理解能力有限的情况下,也能有效找到正确答案。
- 适应性强:MiniRAG能够适应多种应用场景,包括即时通讯、个人内容管理和本地文档检索,为用户提供个性化的信息检索和生成服务。
MiniRAG的技术原理
- 语义感知的异构图索引机制:
- 文本块节点(Vc):保持原始文本的上下文完整性,直接参与检索阶段,确保能够识别出最相关的上下文内容。
- 实体节点(Ve):提取自文本块的关键语义元素,如、地点、时间引用和领域特定概念,用于锚定语义理解。
- 实体-实体连接(Eα):捕捉命名实体之间的语义关系、层次结构及时空依赖关系。
- 实体-文本块连接(Eβ):连接命名实体及其对应的上下文,保持上下文的相关性和语义的连贯性。
- 边的语义描述:为连接的节点提供明确的关系上下文,增强图的语义理解能力,这些描述由语言模型生成。
- 轻量级拓扑增强检索方法:
- 查询语义映射:利用实体提取和轻量级句子嵌入模型,将用户的查询与图索引数据对齐,以识别相关文本块。
- 查询驱动的推理路径发现:在异构图中基于智能查询引导机制构建推理路径,综合考虑查询与实体节点之间的语义相关性及实体之间的结构连贯性。
- 拓扑增强的图检索:结合基于嵌入的相似性搜索和图结构的拓扑信息,识别与查询相关的高质量实体-实体连接,并提取逻辑相关的推理链。
- 查询相关文本块的检索:基于实体-文本块连接,收集与推理路径相关的文本块,计算输入查询与文本块及其边描述的语义相似性,从而选择最相关的文本块用于后续生成任务。
- 融合增强生成:将检索到的关键关系和最优文本块与先前确定的答案节点结合,构建全面且结构化的输入表示,以用于最终的增强生成过程。
MiniRAG的项目地址
- GitHub仓库:https://github.com/HKUDS/MiniRAG/
- arXiv技术论文:https://arxiv.org/pdf/2501.06713
MiniRAG的应用场景
- 即时通讯:快速检索历史记录,生成智能回复,并提供知识辅助。
- 个人内容管理:检索个人笔记,生成内容总结和提醒,帮助管理日程。
- 本地文档检索:检索本地文档内容,整合多文档信息,生成智能摘要。
- 隐私敏感应用:安全管理医疗和金融信息,提供保护隐私的问答服务。
- 边缘设备应用:在智能手表、智能音箱等设备上提供快速响应和智能服务。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...