# Python-crawler-tutorial-starts-from-zero **Repository Path**: dsym/Python-crawler-tutorial-starts-from-zero ## Basic Information - **Project Name**: Python-crawler-tutorial-starts-from-zero - **Description**: python爬虫教程,带你从零到一,包含js逆向,selenium, tesseract OCR识别,mongodb的使用,以及scrapy框架 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-08-10 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 分布式爬虫从零开始 ## 有点事情,拖更两天,不好意思了各位 - 在拟定计划中。。。。。。一定会做好。 - 在学习之前请务必掌握一些python基础知识,之后我们就可以开始了! - 项目预估时间20天左右,平均两天更新一章内容,敬请期待........ - 欢迎在issues中留言,如果文章中有错别字可以向我提pr,感谢各位! # 目录 - [01 - 爬虫预备知识](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E7%88%AC%E8%99%AB%E9%A2%84%E5%A4%87%E7%9F%A5%E8%AF%86.md) - [02 - 请求分析流程](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E8%AF%B7%E6%B1%82%E5%88%86%E6%9E%90.md) - [03 - requests模块的使用](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E7%BD%91%E7%BB%9C%E8%AF%B7%E6%B1%82%E6%A8%A1%E5%9D%97%E7%9A%84%E4%BD%BF%E7%94%A8.md) - [04 - 数据提取概念和数据的分类](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E6%95%B0%E6%8D%AE%E6%8F%90%E5%8F%96%E6%A6%82%E5%BF%B5%E5%92%8C%E6%95%B0%E6%8D%AE%E7%9A%84%E5%88%86%E7%B1%BB.md) - [05 - JSON](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/JOSN%20%E6%95%B0%E6%8D%AE%E6%8F%90%E5%8F%96.md) # 实例目录 - [01 - 豆瓣热门爬虫-入门](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/01-%E8%B1%86%E7%93%A3%E7%94%B5%E5%BD%B1.md) - [02 - 百度贴吧爬虫-入门](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/02-%E7%99%BE%E5%BA%A6%E8%B4%B4%E5%90%A7.md) - [03 - 百度翻译爬虫-逆向](https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/03-%E7%99%BE%E5%BA%A6%E7%BF%BB%E8%AF%91.md) # 文献整理 ## http知识 [维基百科](https://zh.wikipedia.org/wiki/%E8%B6%85%E6%96%87%E6%9C%AC%E4%BC%A0%E8%BE%93%E5%8D%8F%E8%AE%AE) [百度百科](https://baike.baidu.com/item/http) [来自简书](https://www.jianshu.com/p/a6d086a3997d) ## Chrome控制台 [官方教程](https://developers.google.com/web/tools/chrome-devtools/console/?hl=zh-cn) [来自知乎](https://zhuanlan.zhihu.com/p/39340856) ## Requests使用 [官方中文文档](http://docs.python-requests.org/zh_CN/latest/index.html) ## JSON [菜鸟教程](http://www.runoob.com/json/json-tutorial.html) ## XML [菜鸟教程](http://www.runoob.com/xml/xml-tutorial.html)