FlexRAG

FlexRAG – 中科院推出的高性能多模态 RAG 框架

FlexRAG是什么

FlexRAG 是一种创新的检索增强生成（RAG）框架，旨在克服传统 RAG 系统在处理长上下文时所面临的高计算成本与生成质量不足的问题。通过将检索到的上下文信息压缩为紧凑的嵌入表示，FlexRAG 显著降低了计算负担，其核心组件包括压缩编码器和选择性压缩机制。前者负责将长上下文转换为固定尺寸的嵌入，而后者则通过评估信息的重要性来优先保留关键内容。这一设计不仅提升了生成模型的性能，还支持灵活的压缩比以及多模态数据的处理。

FlexRAG

FlexRAG的主要功能

多模态RAG: FlexRAG 支持多种数据模态，为不同类型的数据应用提供了广泛的可能性。
多数据类型支持: FlexRAG 能够处理多样的数据格式，包括文本（如 CSV、JSONL）、图像、文档和网页等，灵活应对各种数据源。
统一配置管理: 基于 Python 的 dataclass 和 hydra-core，FlexRAG 提供统一的配置管理，使 RAG 流程的设置变得更加简便。
上下文压缩：通过压缩编码器，FlexRAG 将长上下文信息转化为紧凑的嵌入表示，从而减少了计算负担，实现了对大量数据的高效处理。
多种检索器支持：FlexRAG 支持多种检索器类型，包括稀疏检索器、密集检索器、网络检索器以及多模态检索器，确保其在不同数据类型和应用场景中的灵活性。
提示微调：通过学习软提示（soft-prompt），FlexRAG 能够提升下游任务的表现，使模型更好地适应特定的任务需求。

FlexRAG的技术原理

压缩编码器
- 信息提取与数据压缩：压缩编码器是 FlexRAG 的核心组成部分，负责将检索的长上下文信息转化为紧凑的嵌入表示。它通过提取关键信息与特征，将不同长度的上下文信息转换为固定尺寸的嵌入，进而减轻下游模型的输入负担，提高计算效率。
- 实现机制：FlexRAG 采用特定的训练策略，使压缩编码器能够识别出哪些信息最为重要，从而在压缩过程中优先保留这些关键信息。
选择性压缩机制
- 重要性评估与动态调整：该机制通过评估不同上下文信息的重要性，优先保留对生成最为关键的信息，允许根据具体任务的需求动态调整保留的上下文信息，使压缩过程更加灵活。
- 压缩比分配：为了实现压缩效果与信息保留之间的平衡，FlexRAG 根据重要性评估对上下文进行分组，并为各组分配不同的压缩比。
双阶段训练工作流
- 预训练与微调：FlexRAG 的训练分为预训练和微调两个阶段。预训练阶段在大规模数据集上进行，以建立模型的基本语言理解和生成能力；微调阶段则针对特定任务的数据集进行，以优化模型在特定任务上的表现。