「RAG 知识检索」是「龙虾部署大师」技能市场中的本地知识库检索技能:作用是把图片、PDF、Word、Markdown、TXT、PPT 等多格式文档解析、切分并建成向量索引,提问时先改写问题,再用向量检索、BM25、LLM 分词、RRF 融合与重排序找出最相关的片段喂给大模型,让回答有据可依,而不是凭原文整篇硬塞。

技能效果

把年假政策和报销流程两份资料建索引后,它按用户问题检索作答:入职两年休五天年假,报销三千需主管加总监二次审批,还标了来源。

RAG知识检索技能对话示例:年假与报销资料检索问答

为什么把整份文档塞给大模型行不通

直接把整份资料丢给大模型回答问题,会遇到三个工程上的硬约束:一是上下文窗口有限,几十页的合同或一整本教材根本放不进去;二是塞进去的无关内容越多,模型越容易被干扰、答非所问,准确率反而下降;三是用户的提问往往很口语、很模糊,和原文里的措辞对不上,直接拿原话去匹配经常漏掉真正相关的段落。RAG(检索增强生成)就是为了解决这一类问题:先检索出少量真正相关的片段,再让模型基于这些片段作答。

两种喂法的对比 整份原文硬塞 超窗口 · 被无关内容干扰 先检索再作答 只取相关片段 · 有出处

这个技能把 RAG 流程做成了什么

它把"建库"和"检索"两个阶段串成一条完整流程。建库阶段,它解析图片、PDF、Word、Markdown、TXT、PPT 等多种格式(图片走 OCR 后入库),把内容切分并写入 sqlite-vec 向量数据库;这里用的是 smart 模式,会跳过已索引过的重复文件、只追加新文档,或在需要时定向重建索引,避免每次都从头跑一遍。检索阶段,它不会拿用户原话直接去查,而是先把口语化、模糊的问题改写成精准的查询词和子查询,再并行执行向量检索、BM25 关键词检索、LLM 分词,用 RRF 把多路结果融合,最后做一次 LLM 重排序,返回排在最前的相关片段。

阶段 0 · 建库 多格式文档 解析 + 切分图片走 OCR sqlite-vec 索引smart 增量 阶段 1 · 检索 口语问题改写为查询词 向量 + BM25 + 分词RRF 融合 · 重排序 相关片段喂给模型

这套混合检索加重排序的设计,目的是同时兼顾"语义相近"和"关键词命中"两种召回,比单一向量检索更不容易漏;问题改写则解决了"用户说得太口语、和原文对不上"的老问题。

用前须知

该技能依赖 sqlite-vec、requests、python-docx、python-pptx 等运行环境,并从 AI agent 身份文件读取 uid/token;每次开启新会话需先运行 check_env.py 初始化环境。一个重要约束是:回答时只引用检索出来的片段,不绕过检索直接翻整份原文,这样才能保证回答可溯源。

怎么用它

用法是用自然语言把"要建库的资料"或"要回答的问题"交给它,建库与检索的细节由它按流程处理,无需手动跑脚本或调参数。例如可以这样对它说:

可以这样对它说

  • "把这批 PDF 和 Word 建好索引,之后按用户问题检索相关片段来回答。"
  • "我的问题问得比较口语,先帮我改写成精确检索词,再跑一遍混合检索和重排。"
  • "这些图片资料先 OCR 入库,查询时只看检索到的片段,不要直接翻原文。"

它适合这些场景:用户上传教材、合同、论文或资料包,需要先建立统一的本地知识索引库;围绕已索引资料做问答,且要求答案只引用检索片段而非整份原文;新增或更新文件后,要避免重复索引、保留已有数据库内容;提问较模糊,需要先改写成结构化查询词以提升召回质量。适合做本地资料问答、课程辅助、文档研究和企业知识库检索,尤其是多格式文档混在一起的场景。

Claw龙虾部署大师下载

想用上这个技能?

「RAG 知识检索」就在「龙虾部署大师」的技能市场里,打开 技能市场 就能一键安装使用。

还没装龙虾?先 一键部署「龙虾部署大师」,在本地跑起来后再装技能即可。

注:技能的实际效果与所选用的 AI 模型能力有关,不同模型下的表现可能存在差异。

Claw龙虾部署大师下载

客服
扫描与客服沟通

回顶部
提示

正在拉起鸿蒙应用市场,如遇无法拉起/无法下载的情况,可使用鸿蒙设备,自行前往应用市场,搜索「Win解压缩」安装。

知道了