Skip to content

Charlie-El/REITsExcelAuditor

Repository files navigation

REITs Excel Auditor 使用说明

English Guide

REITs Excel Auditor 是一个用于整理 REITs 未审核 Excel 表和年度更新材料的 Windows 小工具。第一版功能用于识别不同类型的未审核表,提取需要的字段,并按照标准模板输出为审核格式;新版在此基础上增加了“年报现金流更新”流程,可以基于去年正式表、年度补充材料、公募年报 PDF、OCR/AI 整理结果和标准格式模板,生成产权/特许经营权年报提取表、未来现金流汇总表和集中复核清单。

工具支持单个文件处理,也支持文件夹批量处理。默认转换、年度更新和模板套用都在本机完成;只有你主动启用 AI 标准化或云端 OCR 时,程序才会调用外部接口。

主要功能

  • 自动识别 1-5 类内置模板未审核表,并转换为对应标准格式。
  • 支持手动选择表类型,适合已明确知道表类型的场景。
  • 支持上传文件夹,批量识别并逐个输出结果。
  • 支持补全信息表,自动补充 REITs 名称、上市日期、公告日期、开始日期和结束日期。
  • 支持自定义模板输出,按用户上传模板的字段和格式生成结果。
  • 第 4 类产权经营数据可按需额外生成处理版,用于修复和补全主配套资产面积相关字段。
  • 支持年报现金流更新,生成产权、特许经营权、未来现金流和复核清单。
  • 年报更新默认精简过程文件,把标准化导入表、复核清单、更新计划、输出对比和字段差异说明合并到一个结果汇总文件。

快速使用

如果你从源码运行,先安装依赖:

python -m pip install -r requirements.txt

然后启动软件:

python reit_excel_auditor\app.py

如需使用本地 OCR,再安装 OCR 依赖:

python -m pip install -r requirements-ocr.txt

生成 exe 使用

如果你希望把工具打包成可以直接双击运行的 Windows 软件,可以在项目根目录运行打包脚本。

.\build_exe.ps1

打包完成后,exe 文件会生成在:

dist\REITsExcelAuditor.exe

如需把本地 OCR 引擎一起打包:

.\build_exe.ps1 -WithOCR

图形界面操作

  1. 选择输入文件或输入文件夹。
  2. 选择输出位置。
  3. 选择转换方式。
  4. 如需自动补充基础信息,选择补全信息表。
  5. 如需修复第 4 类产权经营数据的主配套资产面积字段,勾选“额外生成第 4 类处理版”。
  6. 如需按新模板输出,选择自定义模板。
  7. 如需做年报现金流更新,切换到年度更新相关入口,选择年报工作文件夹和输出位置。
  8. 点击开始转换。
  9. 转换完成后,到输出位置查看结果和汇总表。

转换方式说明:

方式 适用场景
自动识别 不确定输入表属于哪一类时使用,软件会按表头字段判断。
指定表类型 已经知道输入表类型时使用。
自定义模板输出 输入表不属于内置 1-5 类模板,但希望按指定模板字段和格式输出时使用。
年报现金流更新 每年在去年正式表基础上,更新现金流、评估值、费率、基金净资产、折旧摊销等字段时使用。

输出文件

普通自动审核转换会保存到你选择的输出位置。

文件 说明
原文件名_自动审核.xlsx 转换后的标准格式表。
原文件名_自动审核_处理版.xlsx 仅在勾选第 4 类处理版选项且输入为第 4 类时生成。
自动审核_批量汇总.xlsx 批量转换时生成,记录每个文件的识别类型、输出文件、提示信息和失败原因。

年报现金流更新默认生成较少文件,通常包括:

文件 说明
产权表_自动更新.xlsx 产权类年报提取结果,文件名前缀会沿用输入表名称。
特许经营权表_自动更新.xlsx 特许经营权类年报提取结果,文件名前缀会沿用输入表名称。
年度更新_未来现金流汇总表.xlsx 按基金和项目整理的未来现金流宽表。
年度更新_结果汇总与复核清单.xlsx 集中复核文件,包含标准化导入表、人工复核清单、更新计划、字段差异说明、输出对比等。

如需兼容旧流程、拆分多个过程文件,可在命令行增加:

--annual-detailed-output-files

支持的固定表类型

类型 输入表 输出内容
第 1 类 基础资产评估价值表 基础资产估值
第 2 类 交通基础设施经营指标表 高速经营数据
第 3 类 基础资产财务指标表、招募资产财务指标表 资产负债收入成本
第 4 类 基础资产经营指标表 产权经营数据,可按需额外生成处理版
第 5 类 能源基础设施经营指标表 能源经营数据

软件主要根据表头字段识别表类型,不只依赖文件名。

第 4 类处理版选项

第 4 类处理版默认不生成。只有在界面勾选“额外生成第 4 类处理版”,或命令行使用 --property-processed 时,软件才会输出:

原文件名_自动审核_处理版.xlsx

这个文件不是标准汇总格式,而是在原始第 4 类明细表基础上另存一份,并对主配套资产相关字段做辅助修复。适合源表存在面积填错列、合计面积缺失、只有主要资产没有配套资产等情况时使用。

补全信息表

补全信息表用于把同一个 REITs 的基础信息自动填入输出表。示例文件在:

examples\自动审核补全信息表模板.xlsx

可填写字段:

字段 说明
REITs代码 用于匹配源表中的 REITs 代码,建议填写。
REITs名称 用于补充输出表中的 REITs 名称。
上市日期 用于补充上市日期。
公告日期 用于补充公告日期或 INFOPUBLDATE
开始日期 用于补充 STARTDATE 或开始日期。
结束日期 用于补充 ENDDATE 或结束日期。

字段可以不全。软件会使用已提供的字段,缺失内容会在汇总表中提示。

自定义模板输出

自定义模板适合“输入表不是内置 1-5 类表,但你已经有一个希望输出成什么样的 Excel 模板”的场景。软件会读取你上传模板的表头、列顺序和格式,再从输入表中尽量匹配同名或相似字段写入结果。

适合使用的情况:

  • 输入表不是内置的 1-5 类固定格式。
  • 你只想按自己的模板提取部分字段,不需要内置专属修复逻辑。
  • 你希望输出表继承指定模板的列宽、字体、边框、日期格式、百分比格式、数字格式或公式。
  • 你有多个同格式输入表,希望放在同一个文件夹里批量套同一个模板。

不建议使用的情况:

  • 你需要第 4 类产权经营数据的“处理版”面积修复逻辑。
  • 输入文件夹里混放了不同格式的源表。
  • 模板表头大量合并单元格,且每个输出列没有自己的字段名。

年报现金流更新

年报更新流程适合每年在去年正式表基础上,更新今年现金流、评估值、费率、基金净资产、折旧摊销等字段。

推荐工作文件夹结构:

你的年报工作文件夹\
  01_去年已核表\
    去年产权表.xlsx
    去年特许经营权表.xlsx
  02_补充资料\
    年度更新_统一补充大表.xlsx
    年度更新_项目别名映射表.xlsx
    年度更新_基金净资产与折旧摊销参考表.xlsx
  03_公募年报PDF\
    基金A_年度报告.pdf
  04_OCR资料\
    基金A_现金流截图.png
    基金B_现金流摘页.pdf

目录名只是建议,不要求完全一致。程序会优先按真实表头识别,自动寻找去年表、统一补充大表、辅助表、年报 PDF 和 OCR 资料。

常用命令:

python -m reit_excel_auditor.app --annual-update ".\你的年报工作文件夹" --annual-report-source ".\你的年报工作文件夹\03_公募年报PDF" --output-dir ".\输出结果"

如果已经整理好了统一补充大表,并希望跳过 OCR:

python -m reit_excel_auditor.app --annual-update ".\你的年报工作文件夹" --annual-standard-input ".\年度更新_统一补充大表.xlsx" --annual-max-ocr-pages -1 --output-dir ".\输出结果"

年报更新会优先使用仓库内置的标准格式模板:

standard_templates\annual_update\

这些模板用于控制产权表、特许经营权表和未来现金流表的表头、颜色、布局、列宽、行高和基础格式。它们是脱敏模板,不包含真实基金数据。

年报辅助模板

年度更新可复制填写的空白模板在:

examples\annual_update_helper_templates\

重点模板:

  • 年度更新_统一补充大表模板.xlsx
  • 年度更新_标准导入表模板.xlsx
  • 年度更新_项目别名映射表模板.xlsx
  • 年度更新_管理费率辅助表模板.xlsx
  • 年度更新_评估价值与资产性质辅助表模板.xlsx
  • 年度更新_残值参数辅助表模板.xlsx
  • 年度更新_公告日期辅助表模板.xlsx
  • 年度更新_基金净资产与折旧摊销参考表模板.xlsx

推荐优先使用 年度更新_统一补充大表模板.xlsx,把基础信息、年度现金流、人工补充字段集中维护在一张表里。真实填报后的文件请放到自己的工作文件夹,不要直接留在仓库模板目录。

高级配置

config/ 目录用于维护模板文件名和字段别名。

文件 作用
config\table_templates.json 指定 1-5 类固定表使用哪个标准模板文件。
config\field_aliases.json 指定字段别名,让源表字段和目标字段更容易匹配。

一般用户不需要修改配置。只有在更换标准模板文件名、或者发现某些字段名称需要新增别名时,才需要调整。

详细说明见:

config\README.md

标准模板

标准模板放在:

standard_templates\

当前分为两类:

目录 对应内容
standard_templates\excel_conversion\ 1-5 类自动审核转换模板。
standard_templates\annual_update\ 年报更新产权、特许经营权和未来现金流格式模板。

这些模板用于保留输出 Excel 的表头、列宽、字体、边框、筛选范围、颜色布局和数字格式。更换模板时,请保留正确表头和格式。

使用前检查

批量处理真实业务数据前建议运行:

python -m pytest
python scripts\check_private_files.py

确认没有把真实业务数据、年报 PDF、OCR 图片、输出结果、临时过程目录、本地路径或密钥混入当前工作目录。

常见提示

情况 处理方式
软件提示缺少字段 检查源表是否有对应列,或在输出表中手动补充。
自动识别失败 尝试手动选择表类型,或使用自定义模板输出。
文件夹批量转换失败部分文件 查看 自动审核_批量汇总.xlsx 中对应失败原因。
自定义模板有字段没填上 检查模板表头和源表表头是否名称接近,必要时在 config\field_aliases.json 增加别名。
年报更新输出留空 查看 年度更新_结果汇总与复核清单.xlsx 的人工复核清单和字段差异说明。
打不开 Excel 文件 确认文件没有被 Excel 占用,且不是 ~$ 开头的临时文件。

致谢

感谢所有在 REITs 数据整理、Excel 模板校验和工具测试过程中提供反馈与建议的使用者。也感谢 openpyxlPyInstaller 等开源项目为本工具提供基础能力支持。

版权说明

Copyright (c) 2026 Liu Juncheng. All rights reserved.

本项目用于 REITs Excel 表格格式转换、字段整理、年度更新和审核辅助。未经作者许可,请勿将本项目代码、模板或打包产物用于未授权的商业分发。使用本工具生成的结果仍需使用者自行核对,工具输出不构成投资、财务、法律或审计意见。

About

REITs Excel Auditor 是一款 Windows 桌面工具,用于将未审核 REITs Excel 表自动转换为标准审核格式,支持批量处理、补全信息表、自定义模板输出及年报产权经营数据处理版。

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors