# pdfortable **Repository Path**: eloping-sven/pdfortable ## Basic Information - **Project Name**: pdfortable - **Description**: 本项目用于将PDF文件中的表格提取到Excel文件中。 是纯java的实现方案,媲美 python pdflumber的Java实现。 支持: PDF转Excel、抽取PDF文件中表格数据、按PDF文件页码抽取表格、 支持将抽取到的表格转存到Excel文件中,也支持将抽取到的表格数据保存到Java对象中。 - **Primary Language**: Java - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 3 - **Created**: 2025-02-24 - **Last Updated**: 2025-02-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 主要功能 1.PDF转Excel
2.抽取PDF表格数据,将数据转存excel文件或转存到Java对象中
3.可按页码范围转换Excel或抽取表格数据
# 效果展示 - ![alt PDF文件内容展示](/assets/测试数据源.png) - ![alt 按页抽取到Excel文件展示](/assets/按页抽取效果.png) - ![alt 按页抽取到LogicPage对象展示](/assets/按页抽取到LogicPage效果.png) # 使用方式 ## Maven 本项目已使用JitPack公开仓库,直接在pom.xml中添加依赖即可。添加方式如下: ```xml jitpack.io https://jitpack.io com.gitee.bondgit pdfortable v1.0 ``` ## gradle ``` dependencyResolutionManagement { repositoriesMode.set(RepositoriesMode.FAIL_ON_PROJECT_REPOS) repositories { mavenCentral() maven { url 'https://jitpack.io' } } } dependencies { implementation 'com.gitee.bondgit:pdfortable:v1.0' } ``` # 使用示例,Example.java ```java //创建PdforTable对象 PdforTable pdforTable = new PdforTable(); //测试数据文件: 项目内/assets/测试数据源-2页.pdf //待抽取的PDF文件路径 String pdfPath = "C:\\Users\\测试数据源-2页.pdf"; //保存抽取结果的Excel文件路径(自动创建文件) String excelPath = "C:\\Users\\export.xls"; //示例1:抽取PDF表格到LogicPage对象 //LogicPage logicPage = pdforTable.extractTable(pdfPath); //示例2:按页抽取PDF表格到LogicPage对象 LogicPage logicPage = pdforTable.extractTable(pdfPath,1,1); logicPage.getLogicRowList().forEach(logicRow -> { System.out.print("第" + logicRow.getRowIndex() + "行" +"["); logicRow.getLogicCellList().forEach(logicCell -> { System.out.print(logicCell.getText() + ","); }); System.out.println("]"); }); //示例3:抽取PDF表格到Excel //pdforTable.convertPdfToExcel(pdfPath, excelPath); //示例4:按页抽取PDF表格Excel //pdforTable.convertPdfToExcel(pdfPath, excelPath, 1, 1); ``` [![](https://jitpack.io/v/com.gitee.bondgit/pdfortable.svg)](https://jitpack.io/#com.gitee.bondgit/pdfortable)