AI Agent
检索增强 · 检索增强
聚焦检索增强生成的结构、边界和在真实工作流里的用法。
目录
按顺序读下去,会从模型原理一路走到 Agent 与 Harness 的工程视角。
- 00 RAG 的整体流程:从资料到答案,一条链路讲清楚 导读 从离线建库到在线问答,先把 RAG 从资料进入系统到模型产出答案的完整链路串起来。
- 01 RAG 数据导入:不是把文件上传进去,而是把证据整理出来 拆解 RAG 数据导入里的文档解析、清洗、结构保留与元数据设计,理解“文件”如何变成“证据”。
- 02 RAG 分块技术:不是把长文档切碎,而是把知识切成能被找到的证据 解释 RAG 分块为何决定检索粒度、证据完整性和后续召回效果,并比较常见 chunk 策略。
- 03 RAG 向量嵌入与向量数据库:把语义坐标存成可检索的证据 介绍 embedding 结果如何落入不同向量存储方案,并建立常见向量数据库选型直觉。
- 04 RAG 检索前处理:不是把问题润色一下,而是先决定该怎么查 围绕查询构建、查询翻译和查询路由,说明 RAG 在正式检索前为什么要先决定“该怎么查”。
- 05 RAG 索引优化:不是把向量存进去,而是给知识准备多条能被找到的路 从父子块、多表示索引到结构化入口,系统梳理 RAG 索引优化如何提升召回与上下文质量。
- 06 RAG 检索后处理:不是多召回几个结果,而是把证据整理成能回答问题的样子 聚焦 rerank、去重、压缩和候选整理,说明检索结果如何变成真正适合模型作答的证据集。
- 07 RAG 召回质量评估:不是看起来搜到了,而是证明关键证据没有漏掉 从 gold evidence、Recall@K 到排序指标,建立一套能定位 RAG 检索问题的召回评估视角。
- 08 GraphRAG:当问题不再只是找相似文本,而是要看懂知识之间的关系 介绍 GraphRAG 如何把实体、关系和社区结构引入检索链路,处理普通向量 RAG 不擅长的复杂问题。