# learning

**Repository Path**: deepinspace/python_demo

## Basic Information

- **Project Name**: learning
- **Description**: python学习相关的项目
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2017-05-03
- **Last Updated**: 2020-12-19

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

## jd_book
    爬取京东的图书的项目

## sql_demo1
    连接数据库的demo示例

## lagou2项目：
    依赖：Python，scrapy，下载图片加了：urllib2
    我的环境：Python2.7
    然后安装了pip和easy_install
    安装了pip后可以直接安装插件：
    pip install scrapy
    pip install urllib2

### myspider这三个是可以直接运行的，是爬取网站的示例；
    运行命令：
    （1）scrapy.exe（或scrapy） runspider myspider3.py
    （2）输出到文件夹： scrapy.exe runspider myspider3.py -o items.json
    （3）输出到文件夹并且编码： scrapy.exe runspider myspider3.py -o lablist.json -s FEED_EXPORT_ENCODING=UTF-8

### lagou2项目：
    （1）是一个爬虫项目，可以设置爬取策略，并且下载图片
    （2）设置在settings.py文件夹里面：
    时间设置:DOWNLOAD_DELAY = 1
    图片位置:IMAGES_STORE='D:/demos/python_demo/lagou2/img' # 自行修改
    请求头设置：DEFAULT_REQUEST_HEADERS
    编码设置：FEED_EXPORT_ENCODING = 'utf-8'
    ……

    运行项目：
    scrapy list #查看写了哪些爬虫
    scrapy crawl lab_list#这是爬虫名字
    输出到文件夹:
    scrapy crawl lab_list -o items.json
    如果不需要下载图片，把pipelines.py里面的if那块全删除掉，只剩下return item就可以