「发票整理」是「龙虾部署大师」技能市场中的票据归档技能:它扫描源文件夹中的 PDF、图片和收据,提取日期、商家、金额和费用类别,按统一命名规则归档成年份/类别/商家目录,并生成 CSV 汇总表和待复核清单,把散乱票据转换成可报税、可交给会计的归档体系。
技能效果
给它五张不同年份、不同类别的发票,它按年份加费用类别建好目录树,并生成一张含日期、商户、类别、金额和归档路径的报税目录表。

票据一散,税务季就成了灾难
问题往往在年底集中爆发:一年里下载的发票都叫 invoice.pdf,截图收据躺在相册和聊天记录里,文件名没有规律,金额、日期、商家全靠临时翻。等到报税或交接给会计时,既要逐个打开核对,又怕漏掉某张票据少抵一笔费用。手工整理一两百张票据,既耗时间,又容易出错和遗漏。「发票整理」要做的,是把这件每年重复一次的苦活变成一次扫描就能完成的归档。
这个技能能帮你做到什么
它把"整理票据"拆成扫描、提取、归档、复核四步可以一次跑完。扫描层面,它识别文件夹里的 PDF、图片和需要 OCR 的文件;提取层面,它取出日期、商家、金额和费用类别等关键字段;归档层面,它按年份类别、商家或类别模式统一重命名并复制或移动文件,生成年份/类别/商家目录;汇总层面,它产出 invoice-summary.csv 明细表,并把无法完整识别的票据集中放进 Needs-Review 复核目录,便于人工补录。这样输出的结构既方便会计软件导入,也利于跨年度的审计追踪。
用前须知
该技能需要 Python 3.8 及 scripts/requirements.txt 中的依赖,无需额外 API Key。PDF 文本通过 pdfplumber 提取;图片票据若要 OCR,需另行安装 Tesseract。识别不完整的票据会被放入复核目录而非丢弃,最终金额、类别仍需人工核对后再交付会计。
怎么用它
用法是把要整理的文件夹和归档策略用自然语言交给它,原始文件可以选择保留。例如可以这样对它说:
可以这样对它说
- "把下载文件夹里的发票按年份和费用类别重新归档,生成一份报税用的目录表。"
- "这些收据文件名太乱,按日期、商家、金额统一重命名,整理好让会计复核。"
- "从这批 PDF 发票里提取金额,生成会计用的汇总表并按商家分类,原文请保留。"
它适合这些场景:报税前下载目录堆满 invoice.pdf,需要快速归类和汇总;公司报销或会计交接时,需要按费用类别生成 CSV 明细;多个供应商的收据命名混乱,需要统一日期和商家命名格式;扫描件或图片发票较多,需要标记出 OCR 失败项供人工补录。适用于自由职业者、小企业主、财务助理、行政人员,尤其适合跨年度的文件整理。
注:技能的实际效果与所选用的 AI 模型能力有关,不同模型下的表现可能存在差异。

提示