# wenku_spider
**Repository Path**: abner1121/wenku_spider
## Basic Information
- **Project Name**: wenku_spider
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2023-12-18
- **Last Updated**: 2023-12-18
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# 百度文库
爬取百度文库,支持doc,txt,ppt,pdf(word文件里的图片没有下载,用docx库的效果不太好还原度不高,在改进中,目前放出来版本的还原度都比较高)
也可网站上在线使用 http://106.15.231.202:8888
网页上的下载是返回docx文档 并支持豆丁word文档(觉得好用的各位赏个🌟呗)
## 使用
复制将网址复制进去即可
doc和txt保存为.txt在当前目录下,ppt和pdf保存为图片在img目录下
example效果:
