RAG 检索召回率怎么提升-软领Claw龙虾部署大师-有用科技官网

「RAG 知识检索」是「龙虾部署大师」技能市场中的本地知识库检索技能：作用是把图片、PDF、Word、Markdown、TXT、PPT 等多格式文档解析、切分并建成向量索引，提问时先改写问题，再用向量检索、BM25、LLM 分词、RRF 融合与重排序找出最相关的片段喂给大模型，让回答有据可依，而不是凭原文整篇硬塞。

技能效果

把年假政策和报销流程两份资料建索引后，它按用户问题检索作答：入职两年休五天年假，报销三千需主管加总监二次审批，还标了来源。

RAG知识检索技能对话示例：年假与报销资料检索问答

为什么把整份文档塞给大模型行不通

直接把整份资料丢给大模型回答问题，会遇到三个工程上的硬约束：一是上下文窗口有限，几十页的合同或一整本教材根本放不进去；二是塞进去的无关内容越多，模型越容易被干扰、答非所问，准确率反而下降；三是用户的提问往往很口语、很模糊，和原文里的措辞对不上，直接拿原话去匹配经常漏掉真正相关的段落。RAG（检索增强生成）就是为了解决这一类问题：先检索出少量真正相关的片段，再让模型基于这些片段作答。

这个技能把 RAG 流程做成了什么

它把"建库"和"检索"两个阶段串成一条完整流程。建库阶段，它解析图片、PDF、Word、Markdown、TXT、PPT 等多种格式（图片走 OCR 后入库），把内容切分并写入 sqlite-vec 向量数据库；这里用的是 smart 模式，会跳过已索引过的重复文件、只追加新文档，或在需要时定向重建索引，避免每次都从头跑一遍。检索阶段，它不会拿用户原话直接去查，而是先把口语化、模糊的问题改写成精准的查询词和子查询，再并行执行向量检索、BM25 关键词检索、LLM 分词，用 RRF 把多路结果融合，最后做一次 LLM 重排序，返回排在最前的相关片段。

这套混合检索加重排序的设计，目的是同时兼顾"语义相近"和"关键词命中"两种召回，比单一向量检索更不容易漏；问题改写则解决了"用户说得太口语、和原文对不上"的老问题。

用前须知

该技能依赖 sqlite-vec、requests、python-docx、python-pptx 等运行环境，并从 AI agent 身份文件读取 uid/token；每次开启新会话需先运行 check_env.py 初始化环境。一个重要约束是：回答时只引用检索出来的片段，不绕过检索直接翻整份原文，这样才能保证回答可溯源。

怎么用它

用法是用自然语言把"要建库的资料"或"要回答的问题"交给它，建库与检索的细节由它按流程处理，无需手动跑脚本或调参数。例如可以这样对它说：

可以这样对它说

"把这批 PDF 和 Word 建好索引，之后按用户问题检索相关片段来回答。"
"我的问题问得比较口语，先帮我改写成精确检索词，再跑一遍混合检索和重排。"
"这些图片资料先 OCR 入库，查询时只看检索到的片段，不要直接翻原文。"

它适合这些场景：用户上传教材、合同、论文或资料包，需要先建立统一的本地知识索引库；围绕已索引资料做问答，且要求答案只引用检索片段而非整份原文；新增或更新文件后，要避免重复索引、保留已有数据库内容；提问较模糊，需要先改写成结构化查询词以提升召回质量。适合做本地资料问答、课程辅助、文档研究和企业知识库检索，尤其是多格式文档混在一起的场景。