实用RAG系统:从知识库到检索增强生成
这些学生讲义从系统层面介绍了构建可用的检索增强生成(RAG)系统的视角。课程涵盖整个流程,包括数据摄入、分块策略、嵌入映射、向量存储、混合检索、重排序以及可信AI应用的评估。
课程
课程概述
📚 内容概要
这些学生讲义从系统层面介绍了构建可用的检索增强生成(RAG)系统的思路。课程涵盖了整个流程,包括数据摄入、分块策略、嵌入映射、向量存储、混合检索、重排序以及可信人工智能应用的评估。
通过全面的 RAG 流水线方法,掌握构建基于证据的人工智能系统艺术。
作者: EvoClass
致谢: EvoClass 团队
🎯 学习目标
- 区分提示工程、微调与 RAG,为特定业务需求选择正确的工具。
- 描绘信息在 RAG 流水线中的流动路径,从用户查询到有依据的生成。
- 设计一个专业的数据摄入流水线,融入元数据、规范化和版本控制,以防止“弱数据”失效。
- 评估并实施根据具体领域需求定制的多样化分块策略(固定长度、结构感知、层次化)。
- 解释嵌入机制,阐明语义相似性与答案实用性之间的区别。
- 描述向量存储与索引的技术理论,重点关注检索速度(延迟)与准确率之间的权衡。
- 为大规模语料库(10万+分块)设计多阶段检索方案,包含元数据和过滤策略。
- 区分检索的目标(召回率)与重排序的目标(精确度/相关性)。
- 分析为何重排序对有效的大语言模型生成至关重要,以及它如何与分块设计相互作用。
- 设计上游元数据结构,支持自动化引用和版本感知的检索。
🔹 第1课:RAG 与知识库构建基础
概述: 本课建立从大型语言模型(LLM)作为孤立生成引擎向利用外部知识的有根基系统转变的基础。学生将学习检索增强生成(RAG)的架构流水线,理解数据治理是模型质量的核心支柱,并掌握如何设计一个通过元数据和版本控制确保事实可靠性的数据摄入流程。
学习成果:
- 区分提示工程、微调与 RAG,为特定业务需求选择正确工具。
- 描绘信息在 RAG 流水线中的流动路径,从用户查询到有依据的生成。
- 设计一个专业级的数据摄入流水线,集成元数据、规范化和版本控制,以防止“弱数据”问题。
🔹 第2课:数据转换:分块、嵌入与索引
概述: 本课探讨从原始文本到 RAG 流水线中可搜索数据结构的关键过渡。内容涵盖通过多种分块方法战略性地选择“检索单元”,通过嵌入实现意义的数学表示,以及支撑高维搜索在大规模下高效运行所需的技术基础设施。
学习成果:
- 评估并实施根据具体领域需求定制的多样化分块策略(固定长度、结构感知、层次化)。
- 解释嵌入机制,阐明语义相似性与答案实用性之间的区别。
- 描述向量存储与索引的技术理论,重点关注检索速度(延迟)与准确率之间的权衡。
🔹 第3课:高级检索优化:混合搜索与重排序
概述: 本课讲述从基础向量搜索向生产级检索架构的演进。重点聚焦于混合搜索——即词法与语义检索的结合——以及两阶段检索流水线,其中重排序器被用来确保最具“答案承载力”的证据传递给大语言模型。学生将学习如何为大规模语料库设计检索方案,并理解排名质量与生成准确率之间关键的互动关系。
学习成果:
- 为大规模语料库(10万+分块)设计多阶段检索方案,包含元数据和过滤策略。
- 区分检索的目标(召回率)与重排序的目标(精确度/相关性)。
- 分析为何重排序对有效的大语言模型生成至关重要,以及它如何与分块设计相互作用。
🔹 第4课:可信性与质量:引用、时效性与评估
概述: 本课关注从“听起来合理”的原型向可信、可投入生产的 RAG 应用转变。探讨如何通过元数据设计实现可靠的引用与时间准确性(时效性),并提供一个多层级的评估框架,用于评估检索与生成阶段,从而超越误导性的演示。
学习成果:
- 设计支持自动化引用和版本感知检索的上游元数据结构。
- 实施时效性策略,在文档的新鲜度与权威性之间取得平衡。
- 构建全面的基准测试集,并进行诊断性错误分析,识别流水线中的具体故障点。
🔹 第5课:从原型到生产:集成与流水线整合
概述: 本课将理论上的 RAG 组件过渡到构建可投入生产的实际应用所面临的现实挑战。重点在于将各个独立阶段整合为一个连贯的端到端架构,成功标准定义为可观测性、有效的故障处理以及对系统内在权衡的审慎管理。学生将认识到,一个可用的系统应优先考虑证据可追溯性和优雅的行为表现,而非复杂性。
学习成果:
- 描繪一个实用的 9 阶段端到端 RAG 系统架构。
- 识别并评估性能、准确率与成本之间的关键权衡。
- 诊断流水线故障,通过回溯追踪至具体的架构阶段定位问题。