「RAG 知识检索」是「龙虾部署大师」技能市场中的本地知识库检索技能:作用是把图片、PDF、Word、Markdown、TXT、PPT 等多格式文档解析、切分并建成向量索引,提问时先改写问题,再用向量检索、BM25、LLM 分词、RRF 融合与重排序找出最相关的片段喂给大模型,让回答有据可依,而不是凭原文整篇硬塞。
技能效果
把年假政策和报销流程两份资料建索引后,它按用户问题检索作答:入职两年休五天年假,报销三千需主管加总监二次审批,还标了来源。

为什么把整份文档塞给大模型行不通
直接把整份资料丢给大模型回答问题,会遇到三个工程上的硬约束:一是上下文窗口有限,几十页的合同或一整本教材根本放不进去;二是塞进去的无关内容越多,模型越容易被干扰、答非所问,准确率反而下降;三是用户的提问往往很口语、很模糊,和原文里的措辞对不上,直接拿原话去匹配经常漏掉真正相关的段落。RAG(检索增强生成)就是为了解决这一类问题:先检索出少量真正相关的片段,再让模型基于这些片段作答。
这个技能把 RAG 流程做成了什么
它把"建库"和"检索"两个阶段串成一条完整流程。建库阶段,它解析图片、PDF、Word、Markdown、TXT、PPT 等多种格式(图片走 OCR 后入库),把内容切分并写入 sqlite-vec 向量数据库;这里用的是 smart 模式,会跳过已索引过的重复文件、只追加新文档,或在需要时定向重建索引,避免每次都从头跑一遍。检索阶段,它不会拿用户原话直接去查,而是先把口语化、模糊的问题改写成精准的查询词和子查询,再并行执行向量检索、BM25 关键词检索、LLM 分词,用 RRF 把多路结果融合,最后做一次 LLM 重排序,返回排在最前的相关片段。
这套混合检索加重排序的设计,目的是同时兼顾"语义相近"和"关键词命中"两种召回,比单一向量检索更不容易漏;问题改写则解决了"用户说得太口语、和原文对不上"的老问题。
用前须知
该技能依赖 sqlite-vec、requests、python-docx、python-pptx 等运行环境,并从 AI agent 身份文件读取 uid/token;每次开启新会话需先运行 check_env.py 初始化环境。一个重要约束是:回答时只引用检索出来的片段,不绕过检索直接翻整份原文,这样才能保证回答可溯源。
怎么用它
用法是用自然语言把"要建库的资料"或"要回答的问题"交给它,建库与检索的细节由它按流程处理,无需手动跑脚本或调参数。例如可以这样对它说:
可以这样对它说
- "把这批 PDF 和 Word 建好索引,之后按用户问题检索相关片段来回答。"
- "我的问题问得比较口语,先帮我改写成精确检索词,再跑一遍混合检索和重排。"
- "这些图片资料先 OCR 入库,查询时只看检索到的片段,不要直接翻原文。"
它适合这些场景:用户上传教材、合同、论文或资料包,需要先建立统一的本地知识索引库;围绕已索引资料做问答,且要求答案只引用检索片段而非整份原文;新增或更新文件后,要避免重复索引、保留已有数据库内容;提问较模糊,需要先改写成结构化查询词以提升召回质量。适合做本地资料问答、课程辅助、文档研究和企业知识库检索,尤其是多格式文档混在一起的场景。
注:技能的实际效果与所选用的 AI 模型能力有关,不同模型下的表现可能存在差异。

提示