AI Agent

检索增强 · 检索增强

聚焦检索增强生成的结构、边界和在真实工作流里的用法。

中文 English 日本語

返回 AI Agent / 检索增强

阅读路径

9 篇文章

检索增强

聚焦检索增强生成的结构、边界和在真实工作流里的用法。

开始阅读

按顺序读下去，会从模型原理一路走到 Agent 与 Harness 的工程视角。

00 RAG 的整体流程：从资料到答案，一条链路讲清楚导读从离线建库到在线问答，先把 RAG 从资料进入系统到模型产出答案的完整链路串起来。
01 RAG 数据导入：不是把文件上传进去，而是把证据整理出来拆解 RAG 数据导入里的文档解析、清洗、结构保留与元数据设计，理解“文件”如何变成“证据”。
02 RAG 分块技术：不是把长文档切碎，而是把知识切成能被找到的证据解释 RAG 分块为何决定检索粒度、证据完整性和后续召回效果，并比较常见 chunk 策略。
03 RAG 向量嵌入与向量数据库：把语义坐标存成可检索的证据介绍 embedding 结果如何落入不同向量存储方案，并建立常见向量数据库选型直觉。
04 RAG 检索前处理：不是把问题润色一下，而是先决定该怎么查围绕查询构建、查询翻译和查询路由，说明 RAG 在正式检索前为什么要先决定“该怎么查”。
05 RAG 索引优化：不是把向量存进去，而是给知识准备多条能被找到的路从父子块、多表示索引到结构化入口，系统梳理 RAG 索引优化如何提升召回与上下文质量。
06 RAG 检索后处理：不是多召回几个结果，而是把证据整理成能回答问题的样子聚焦 rerank、去重、压缩和候选整理，说明检索结果如何变成真正适合模型作答的证据集。
07 RAG 召回质量评估：不是看起来搜到了，而是证明关键证据没有漏掉从 gold evidence、Recall@K 到排序指标，建立一套能定位 RAG 检索问题的召回评估视角。
08 GraphRAG：当问题不再只是找相似文本，而是要看懂知识之间的关系介绍 GraphRAG 如何把实体、关系和社区结构引入检索链路，处理普通向量 RAG 不擅长的复杂问题。