# aardio-py3-excel **Repository Path**: chenbool/aardio-py3-excel ## Basic Information - **Project Name**: aardio-py3-excel - **Description**: aardio-py3-excel - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-05-05 - **Last Updated**: 2026-05-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # PDF 页码提取工具 基于 aardio + Python3 开发的桌面应用程序,从 Excel 读取页码信息,从 PDF 提取指定页面并合并为新 PDF。 --- ## 功能特性 | 功能 | 说明 | |------|------| | Excel 读取 | 支持 `.xls`、`.xlsx` 格式,自动解析页码 | | PDF 提取 | 从源 PDF 提取指定页面 | | 页面合并 | 将提取的页面合并为新 PDF | | 进度显示 | 实时显示处理进度 | --- ## 使用步骤 1. 运行 `tools\pip.aardio` 安装依赖 2. 点击 **选择 Excel** → 选择包含页码的 Excel 文件 3. 点击 **选择 PDF** → 选择源 PDF 文件 4. 点击 **加载页码** → 从 Excel 读取页码 5. 点击 **开始提取并合并** → 执行处理 6. 选择输出路径 → 完成 --- ## 技术栈 | 层级 | 技术 | |------|------| | 前端 | aardio | | 后端 | Python 3.8 | | Excel 处理 | pandas | | PDF 处理 | PyPDF2 | --- ## 项目结构 ``` excel/ │ ├─ main.aardio # 主程序入口,UI 与逻辑控制 ├─ readme.md # 项目说明文档 ├─ default.aproj # aardio 项目文件 │ ├─ py/ │ └─ excelLogic.py # Python 核心逻辑 │ ├─ tools/ │ └─ pip.aardio # 依赖管理工具 │ ├─ lib/ │ └─ config.aardio # 配置文件 │ └─ dist/ # 编译输出目录 ├─ excel.exe # 可执行程序 └─ lib/py3/ # Python 运行时 ``` --- ## Python API ### `load_pages_from_excel(excel_path)` 从 Excel 文件加载页码 - **参数**: `excel_path` - Excel 文件路径 - **返回**: `{"success": bool, "pages": list, "count": int, "error": str}` ### `extract_pdf_pages(pdf_path, page_numbers, output_path)` 从 PDF 提取页面并合并 - **参数**: - `pdf_path` - 源 PDF 路径 - `page_numbers` - 页码列表 - `output_path` - 输出路径 - **返回**: `{"success": bool, "extracted_count": int, "invalid_count": int, "output_path": str, "error": str}` ### `get_pdf_info(pdf_path)` 获取 PDF 信息 - **参数**: `pdf_path` - PDF 文件路径 - **返回**: `{"success": bool, "page_count": int, "metadata": dict, "error": str}`