# Python-crawler **Repository Path**: chosan/Python-crawler ## Basic Information - **Project Name**: Python-crawler - **Description**: 从头开始 系统化的 学习如何写Python爬虫。 Python版本 3.6 - **Primary Language**: HTML - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-11-19 - **Last Updated**: 2021-11-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Python-crawler 从零开始系统化的学习写Python爬虫。 主要是记录一下自己写Python爬虫的经过与心得。 同时也是为了分享一下如何能更高效率的学习写爬虫。 IDE:Vscode Python版本: 3.6 每天的学习记录都会 同步更新到: * 微信公众号: findyourownway * 知乎专栏:https://zhuanlan.zhihu.com/Ehco-python * blog : www.ehcoblog.ml 详细学习路径: ### 一:Beautiful Soup 爬虫 * requests库的安装与使用 https://zhuanlan.zhihu.com/p/26681429 * 安装beautiful soup 爬虫环境 https://zhuanlan.zhihu.com/p/26683864 * beautiful soup 的解析器 https://zhuanlan.zhihu.com/p/26691931 * re库 正则表达式的使用 https://zhuanlan.zhihu.com/p/26701898 * bs4 爬虫实践: 获取百度贴吧的内容 https://zhuanlan.zhihu.com/p/26722495 * bs4 爬虫实践: 获取双色球中奖信息 https://zhuanlan.zhihu.com/p/26747717 * bs4 爬虫实践: 排行榜小说批量下载 https://zhuanlan.zhihu.com/p/26756909 * bs4 爬虫实践: 获取电影信息 https://zhuanlan.zhihu.com/p/26786056 * bs4 爬虫实践: 悦音台mv排行榜与反爬虫技术 https://zhuanlan.zhihu.com/p/26809626 ------ ### 二: Scrapy 爬虫框架 * Scrapy 爬虫框架的安装与基本介绍 https://zhuanlan.zhihu.com/p/26832971 * Scrapy 选择器和基本使用 https://zhuanlan.zhihu.com/p/26854842 * Scrapy 爬虫实践:天气预报&数据存储 https://zhuanlan.zhihu.com/p/26885412 * Scrapy 爬虫实践:代理的爬取和验证 https://zhuanlan.zhihu.com/p/26939527 * Scrapy 爬虫实践:糗事百科&爬虫攻防 https://zhuanlan.zhihu.com/p/26980300 * Scrapy 爬虫实践:重构排行榜小说爬虫&Mysql数据库 https://zhuanlan.zhihu.com/p/27027200 ------ ### 三: 浏览器模拟爬虫 * Selenium模拟浏览器 https://zhuanlan.zhihu.com/p/27115580 * 爬虫实践:获取快代理 https://zhuanlan.zhihu.com/p/27150025 * 爬虫实践:漫画批量下载 https://zhuanlan.zhihu.com/p/27155429 ### 四: 练手项目 * 爬虫实践:螺纹钢数据&Cookies https://zhuanlan.zhihu.com/p/27232687 * 爬虫实践:登录正方教务系统 https://zhuanlan.zhihu.com/p/27256315 * 爬虫应用: requests+django实现微信公众号后台 https://zhuanlan.zhihu.com/p/27625233 * 爬虫应用: 12306火车票信息查询 https://zhuanlan.zhihu.com/p/27969976 * 爬虫应用: 利用斗鱼Api抓取弹幕 https://zhuanlan.zhihu.com/p/28164017 * 爬虫应用: 获取支付宝账单信息 https://zhuanlan.zhihu.com/p/28537306 * 爬虫应用:IT之家热门段子(评论)爬取 https://zhuanlan.zhihu.com/p/28806210 * 爬虫应用:一号店 商品信息查询程序 https://zhuanlan.zhihu.com/p/28982497