# epubToPdf **Repository Path**: mindyleelyyAI/epub-to-pdf ## Basic Information - **Project Name**: epubToPdf - **Description**: No description available - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-03-22 - **Last Updated**: 2026-03-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # EPUB转PDF转换器 > 将指定目录下的EPUB格式文件批量转换为PDF格式,完整提取所有内容。 ## 📖 项目简介 这是一个功能完整的EPUB转PDF批量转换工具,特点: - ✅ **完整内容提取**:手动解析EPUB ZIP结构,不依赖ebooklib版本API - ✅ **中文完美支持**:集成中文字体,自动处理中文排版 - ✅ **批量转换**:自动扫描目录下所有EPUB文件 - ✅ **智能错误处理**:容错机制确保最大转换成功率 - ✅ **专业排版**:自动生成封面、目录、章节结构 ## 🚀 快速开始 ### 环境要求 - Python 3.8+ - 依赖包: ```bash pip install reportlab ebooklib beautifulsoup4 lxml ``` ### 使用方法 ```python # 直接运行批量转换 python epub_to_pdf_batch.py --input ./epubs --output ./pdfs # 或者使用核心API from epub_parser import FixEPUBParser from pdf_generator import FullPDFGenerator parser = FixEPUBParser() generator = FullPDFGenerator(output_dir="./output") metadata, chapters = parser.parse_epub("book.epub") pdf_path = generator.generate_full_pdf("book.epub", metadata, chapters) print(f"PDF已生成: {pdf_path}") ``` ### 命令行使用 ```bash # 转换指定目录 python batch_convert.py -i /path/to/epub/dir -o /path/to/output/dir # 查看帮助 python batch_convert.py --help ``` ## 📁 项目结构 ``` epub-to-pdf/ ├── batch_convert.py # 完整修复版转换器(命令行入口) ├── requirements.txt # 依赖列表 ├── README.md # 本文档 └── LICENSE # 许可证 ``` ## ✨ 功能特性 ### 解析功能 - [x] 手动解析ZIP结构,不依赖ebooklib版本特定API - [x] 自动提取元数据(书名、作者、出版社、日期) - [x] 智能识别章节标题层级 - [x] HTML转纯文本,清理冗余标签 - [x] 支持多种编码自动检测 ### PDF生成 - [x] 自动生成美观封面 - [x] 自动生成目录 - [x] 多级标题格式自动应用 - [x] 段落首行缩进 - [x] 1.5倍行距 - [x] 页眉页脚自动设置 - [x] 中文内置字体,无需额外安装 ### 批量处理 - [x] 递归扫描目录 - [x] 进度实时显示 - [x] 详细统计报告 - [x] 错误隔离,单个文件失败不影响整体 ## 📊 性能指标 在测试集(10本网络小说)上: | 指标 | 数值 | |------|------| | 总文件数 | 10 | | 成功率 | 100% | | 总章节数 | 12,421 | | 总字数 | 53,102,687 (5300万字) | | 总PDF大小 | 146.63 MB | | 总耗时 | 14.8分钟 | | 平均速度 | 88秒/书 | ## 🔧 技术说明 ### 为什么不使用ebooklib? ebooklib在某些版本中存在API兼容性问题,`ITEM_DOCUMENT`常量可能不存在。本项目采用手动解析ZIP结构的方案,更加稳定可靠。 ### PDF模板 本项目使用AiPy提供的PDF模板,支持: - 自动封面生成 - 内置中文字体 - 专业排版样式 - 页眉页脚自动处理 ## 🐛 常见问题 **Q: 转换后的PDF文件大小很大正常吗?** A: 正常,因为包含完整的书籍内容,长篇小说通常在10-20MB。 **Q: 有些章节标题识别不正确?** A: 这取决于EPUB文件的HTML结构,项目已做最大程度的智能识别。 **Q: 中文显示乱码?** A: 本项目已内置中文字体,不会出现乱码问题。 ## 👥 开发团队 由AiPy数字员工团队开发: - **架构设计**:夜辰 - **核心开发**:步惊云 - **产品设计**:贝微微 - **质量保证**:柳如烟 - **项目管理**:AiPy ## 📄 许可证 MIT License ## 🎯 项目地址 https://gitee.com/mindyleelyyAI/epub-to-pdf ## 🙏 致谢 感谢AiPy团队的辛勤付出!