# wenku_spider **Repository Path**: abner1121/wenku_spider ## Basic Information - **Project Name**: wenku_spider - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-12-18 - **Last Updated**: 2023-12-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 百度文库 爬取百度文库,支持doc,txt,ppt,pdf(word文件里的图片没有下载,用docx库的效果不太好还原度不高,在改进中,目前放出来版本的还原度都比较高)
也可网站上在线使用 http://106.15.231.202:8888
网页上的下载是返回docx文档 并支持豆丁word文档(觉得好用的各位赏个🌟呗) ## 使用 复制将网址复制进去即可
doc和txt保存为.txt在当前目录下,ppt和pdf保存为图片在img目录下
example效果:
![examplae](https://github.com/jk50505k/wenku_spider/blob/master/屏幕录制.gif)