# meizitu **Repository Path**: soulnull/meizitu ## Basic Information - **Project Name**: meizitu - **Description**: 爬取meizitu全站图片并下载到本地,可以根据配置定时爬取下载。 - **Primary Language**: Python - **License**: GPL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2018-04-29 - **Last Updated**: 2021-04-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # meizitu #### 项目介绍 爬取meizitu全站图片并下载到本地,可以根据配置定时爬取下载。 配合linux定时任务Crontab,可以每天定时爬取图片~ #### 软件架构 软件架构说明 #### 安装教程 1.clone项目到本地 2.执行python命令 ``` Scrapy crawl meizitu ``` #### 使用说明 1. 设置下载路径 setting.py 文件下: ``` IMAGES_STORE = 'E:\PythonProject\\' ``` 2. 设置读取要爬取页数 ``` def readFile(self): //请本地自己创建一个文件名为page,文本为页数。默认1 read=open("E:\PythonProject\page.txt") page=read.read() read.close() return page //爬取完后页数+1重写文件 def writeFile(self,page): write = open("E:\PythonProject\page.txt",'w') write.write(page) write.close() ``` 3.py目录下为py发送邮件脚本 可以在执行完毕爬虫任务后邮件通知自己~ 4.task.sh linux shell脚本 Crontab定时任务执行task.sh 在爬虫执行完毕后自动发送邮件,根据自身项目修改里面的项目地址 ``` /usr/local/myspider/project/meizitu/scrapy crawl meizitu python /usr/local/myspider/project/shell/sendHTML.py ```