# PdfTool **Repository Path**: lgx_com_cn/PdfTool ## Basic Information - **Project Name**: PdfTool - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-08-18 - **Last Updated**: 2021-01-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 本项目是个小工具,使用了第三方库Spire的免费版本 ## 目的 最近我有一个需求,就是把一个很大的PDF转换为word,要求是尽量不失真。但是我找了很多的在线免费转换工具,或者是有页数要求,或者是有大小要求。高级功能需要收费。 于是我考虑自己去实现,第一想到的是python,这个实现起来很简单,但是转换后的word会失真,页面的排版等等不符合要求,于是考虑采用第三方免费工具,然后写代码自己转换。 目前的话我没有做成web形式的,后期会改进。 ## 转换思路如下: 1、免费版本转换页数要求11页 2、输入一个pdf时候,小于11页直接转换,大于11页就先切分成子pdf 3、对每一个小的pdf进行转换,最后再合并。 总体上就是一个大的pdf拆分转换再合并的问题。 #### 其他的思路: 不使用第三方库,直接OCR技术扫描。这个技术我正在考虑当中,有兴趣的可以添加我的微信交流: fdd15735171890 ## 本工具特点: 1、图片不会转换 2、文字正常转换 3、数学公式正常转换 4、排版不会失真 (完全的不失真也做不到,会有微小的差别,但是和pdf基本上一样) ## 使用流程 1、git clone git@github.com:fengdongdongwsn/PdfTool.git 2、如果你是Eclipse或者是MyEclipse,直接导入运行即可,入口类在Main.java 3、如果你是Idea或其他的Maven环境下,在pom.xml环境中添加如下依赖: ```xml com.e-iceblue http://repo.e-iceblue.cn/repository/maven-public/ e-iceblue spire.pdf.free 2.6.3 e-iceblue spire.doc.free 2.7.3 ``` 然后直接运行Main类 ## 个人说明 喜欢的给个支持吧各位老铁们: ![image](https://upload-images.jianshu.io/upload_images/4153190-eafb1a4a904b36ae.jpg?imageMogr2/auto-orient/strip|imageView2/2/w/800/format/webp)