# pdfortable
**Repository Path**: eloping-sven/pdfortable
## Basic Information
- **Project Name**: pdfortable
- **Description**: 本项目用于将PDF文件中的表格提取到Excel文件中。
是纯java的实现方案,媲美 python pdflumber的Java实现。
支持:
PDF转Excel、抽取PDF文件中表格数据、按PDF文件页码抽取表格、
支持将抽取到的表格转存到Excel文件中,也支持将抽取到的表格数据保存到Java对象中。
- **Primary Language**: Java
- **License**: Apache-2.0
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 3
- **Created**: 2025-02-24
- **Last Updated**: 2025-02-24
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 主要功能
1.PDF转Excel
2.抽取PDF表格数据,将数据转存excel文件或转存到Java对象中
3.可按页码范围转换Excel或抽取表格数据
# 效果展示
- 
- 
- 
# 使用方式
## Maven
本项目已使用JitPack公开仓库,直接在pom.xml中添加依赖即可。添加方式如下:
```xml
jitpack.io
https://jitpack.io
com.gitee.bondgit
pdfortable
v1.0
```
## gradle
```
dependencyResolutionManagement {
repositoriesMode.set(RepositoriesMode.FAIL_ON_PROJECT_REPOS)
repositories {
mavenCentral()
maven { url 'https://jitpack.io' }
}
}
dependencies {
implementation 'com.gitee.bondgit:pdfortable:v1.0'
}
```
# 使用示例,Example.java
```java
//创建PdforTable对象
PdforTable pdforTable = new PdforTable();
//测试数据文件: 项目内/assets/测试数据源-2页.pdf
//待抽取的PDF文件路径
String pdfPath = "C:\\Users\\测试数据源-2页.pdf";
//保存抽取结果的Excel文件路径(自动创建文件)
String excelPath = "C:\\Users\\export.xls";
//示例1:抽取PDF表格到LogicPage对象
//LogicPage logicPage = pdforTable.extractTable(pdfPath);
//示例2:按页抽取PDF表格到LogicPage对象
LogicPage logicPage = pdforTable.extractTable(pdfPath,1,1);
logicPage.getLogicRowList().forEach(logicRow -> {
System.out.print("第" + logicRow.getRowIndex() + "行" +"[");
logicRow.getLogicCellList().forEach(logicCell -> {
System.out.print(logicCell.getText() + ",");
});
System.out.println("]");
});
//示例3:抽取PDF表格到Excel
//pdforTable.convertPdfToExcel(pdfPath, excelPath);
//示例4:按页抽取PDF表格Excel
//pdforTable.convertPdfToExcel(pdfPath, excelPath, 1, 1);
```
[](https://jitpack.io/#com.gitee.bondgit/pdfortable)