# dify-plugins-doc-review-agent **Repository Path**: smart8/dify-plugins-doc-review-agent ## Basic Information - **Project Name**: dify-plugins-doc-review-agent - **Description**: dify-plugins-doc-review-agent - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-26 - **Last Updated**: 2026-04-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 文档审核Agent 一个强大的 Dify 插件,使用 AI 驱动的智能审核功能,支持标书、公文、合同、资料等各种类型的文档审核(支持范本和非范本文档审核)。支持智能文档解析、基于规则的审核、风险聚合和带批注的文档生成,具有专业级质量和灵活的配置选项。 ## 版本信息 - **当前版本**: v0.0.2 - **发布日期**: 2026-04-12 - **兼容性**: Dify 插件框架 - **Python 版本**: 3.12 ### 版本历史 - **v0.0.2** (2026-04-12): - 新增一体化**切片审核工具** `doc-slice-audit`(切片 -> 规则加载 -> 审核 -> 聚合 -> 批注 -> 修订) - 新增一体化**简单/全文审核工具** `doc-audit`,适用于短文档单循环审核 - 新增**范本切片审核工具** `doc-slice-audit-template`,`template_file` 必填、`rules_file` 可选 - 新增**范本全文审核工具** `doc-audit-template`,`template_file` 必填、`rules_file` 可选 - 新增范本对比子能力:`template_chunk_auditor.py` 和 `template_doc_auditor.py` - 新增范本风险编号规范 `template-0001` 格式,并统一聚合/标注字段结构 - 优化 `doc_annotator` 无风险场景处理(不再报错,直接返回 `annotation_count=0` 的已审核文档) - 按一体化顶层工具重构 Provider 工具暴露与 YAML 配置 - **v0.0.1** (2026-04-05): 初始版本,包含本地文档审核功能 ## 快速开始 1. 在您的 Dify 环境中安装插件 2. 下载规则模板和样例文件: https://github.com/sawyer-shi/awsome-dify-agents/blob/master/src/doc-review-agent/agent_test_files/review_rules_research_en.csv 3. 配置您的 LLM 模型设置。另外注意:防止超时可以修改参数PLUGIN_MAX_EXECUTION_TIMEOUT来增加处理时间,防止超时!!! 4. 上传你文档并开始审核流程结果如下: sample02 ## 核心特性 - **四类一体化审核工具**: 覆盖切片/全文、非范本/范本四种主流程 - **范本基线审核能力**: 以范本文档为基线对比,范本风险编号统一为 `template-0001` 风格 - **规则+范本混合审核**: `rules_file` 可选叠加,规则结果与范本结果统一聚合 - **结构化风险处理链路**: 审核 -> 聚合 -> 批注 -> 修订,字段结构一致便于后续打标 - **高质量文档输出**: 支持已审核(批注)与修订稿输出,并支持 JSON 摘要/明细模式 - **灵活参数控制**: 支持切片策略、审核策略、合并策略、输出语言与输出模式 - **无风险场景稳定返回**: 无命中时不报错,返回 `annotation_count=0` 的有效已审核文档 - **多语言输出支持**: 支持中/英/日/韩/西/法/德/葡/俄/阿 ENCN ## 核心功能 ### 1) 文档审核--切片审核(非范本)`doc-slice-audit` 面向较长文档的非范本切片审核。 - **必填**:`model_config`、`upload_file`、`rules_file` - **执行流程(6步)**: 1. 文档切片 2. 规则加载 3. 切片审核 4. 风险聚合 5. 文档批注 6. 文件修订 - **适用场景**:合同/标书等需要分片审阅的文档 ### 2) 文档审核--简单审核(非范本)`doc-audit` 面向短文档的非范本全文审核。 - **必填**:`model_config`、`upload_file`、`rules_file` - **执行流程(6步)**: 1. 加载审核文档 2. 规则加载 3. 全文规则审核 4. 风险聚合 5. 文档批注 6. 文件修订 - **适用场景**:篇幅较短、需要全文上下文判断的文档 ### 3) 文档审核--切片审核(范本)`doc-slice-audit-template` 面向较长文档的范本切片审核。 - **必填**:`model_config`、`upload_file`、`template_file` - **可选**:`rules_file`(提供后执行规则审核+范本审核的混合流程) - **执行流程(8步)**: 1. 审核文档切片 2. 范本文档切片 3. 规则加载(可选输入;进度步骤始终保留) 4. 规则分片审核(提供 `rules_file` 时执行,否则标记为跳过) 5. 范本分片对比审核 6. 风险聚合 7. 文档标注 8. 文件修订 - **输出语义**:范本风险编号统一为 `template-0001`、`template-0002`,风险等级由模型判定 ### 4) 文档审核--简单审核(范本)`doc-audit-template` 面向短文档的范本全文审核。 - **必填**:`model_config`、`upload_file`、`template_file` - **可选**:`rules_file`(提供后执行规则审核+范本审核的混合流程) - **执行流程(8步)**: 1. 加载审核文档 2. 加载范本文档 3. 规则加载(可选输入;进度步骤始终保留) 4. 规则审核(提供 `rules_file` 时执行,否则标记为跳过) 5. 范本对比审核 6. 风险聚合 7. 文档标注 8. 文件修订 - **适用场景**:短文档的快速范本合规检查 ### 通用输出与控制项 - **JSON 输出**:`summary_only` 或 `detailed` - **文件输出**:仅修订稿,或“已审核稿 + 修订稿” - **修订策略**:支持 `keep_highest_risk` / `keep_semantic` / `merge_semantic` - **无风险返回**:无命中时返回有效已审核文档,`annotation_count=0` ## 技术优势 - **LLM 驱动分析**: 利用先进的 LLM 模型进行智能文档理解 - **基于规则的审核**: 灵活的规则系统用于可自定义的审核标准 - **基于切片的处理**: 通过智能切片高效处理大型文档 - **风险去重**: 智能聚合以消除重复发现 - **带批注的输出**: 带有清晰风险指示器的专业文档输出 - **多格式支持**: 针对 docx 格式优化,可扩展到其他格式 - **可配置的审核级别**: 支持严格和宽松的审核模式 - **实时处理**: 高效的工作流程,及时进行文档审核 ## 系统要求 - Python 3.12 - Dify 平台访问权限 - 配置的 LLM 模型 - 所需的 Python 包(通过 requirements.txt 安装): - dify_plugin>=0.5.0 - python-docx>=1.1.2 - openpyxl>=3.1.5 ## 安装与配置 1. 安装所需的依赖项: ```bash pip install -r requirements.txt ``` 2. 在插件设置中配置您的 LLM 模型 3. 在您的 Dify 环境中安装插件 ## 使用方法 ### 如何选择工具 #### A) 非范本切片审核 使用 `doc-slice-audit`(有规则文件、需要切片级审核)。 - 必填:`model_config`、`upload_file`、`rules_file` - 推荐可选:`slice_strategy`、`max_chunk_chars`、`merge_policy`、`output_language` #### B) 非范本全文审核 使用 `doc-audit`(有规则文件、文档较短)。 - 必填:`model_config`、`upload_file`、`rules_file` - 推荐可选:`audit_strategy`、`merge_policy`、`output_language` #### C) 范本切片审核 使用 `doc-slice-audit-template`(按范本逐段对比)。 - 必填:`model_config`、`upload_file`、`template_file` - 可选:`rules_file`(启用规则+范本混合审核) - 说明:范本风险会生成 `template-0001` 风格编号 #### D) 范本全文审核 使用 `doc-audit-template`(按范本做全文对比)。 - 必填:`model_config`、`upload_file`、`template_file` - 可选:`rules_file`(启用规则+范本混合审核) ### 典型输出 - JSON 摘要(或明细 JSON) - 已审核文档 `.docx`(含批注) - 修订文档 `.docx`(按策略合并/回写) ## 支持的文档格式 - **输入**: .docx(Microsoft Word) - **输出**: .docx(带批注的 Microsoft Word) ## 注意事项 - 文档解析针对 docx 格式优化 - 切片大小可以根据文档复杂度调整 - 审核级别影响规则应用的严格程度 - 风险聚合使用智能去重以避免重复发现 - 批注风格目前支持基于批注的批注 - 大型文档通过切片高效处理 - 所有工具都需要配置的 LLM 模型才能运行 ## 开发者信息 - **作者**: `https://github.com/sawyer-shi` - **邮箱**: sawyer36@foxmail.com - **许可证**: Apache License 2.0 - **源代码**: `https://github.com/sawyer-shi/dify-plugins-doc-review-agent` - **支持**: 通过 Dify 平台和 GitHub Issues 提供 ## 许可证声明 本项目采用 Apache License 2.0 许可证。完整的许可证文本请参阅 [LICENSE](LICENSE) 文件。 --- **准备好使用 AI 驱动的智能审核您的文档了吗?**