# python-crawler-template **Repository Path**: exppoc/python-crawler-template ## Basic Information - **Project Name**: python-crawler-template - **Description**: Python 爬虫开发模板 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2023-02-16 - **Last Updated**: 2023-02-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # python-crawler-template > Python 爬虫开发模板 ------ ## 运行环境 ![](https://img.shields.io/badge/Python-3.8%2B-brightgreen.svg) ![](https://img.shields.io/badge/Platform-Linux%20amd64-brightgreen.svg) ![](https://img.shields.io/badge/Platform-Windows%20x64-brightgreen.svg) ## 使用说明 1. 创建 Github Repository 时选择这个仓库做模板 2. 修改 [`script/crawler-create.sql`](./script/crawler-create.sql) 建库脚本 3. 运行 [`python gen_pdm.py`](./gen_pdm.py) 脚本生成数据库 pdm 代码 4. 修改 [`src`](./src) 下的爬虫代码(`FIXME` 和 `TODO` 标记的都需要根据场景修改),运行 [`python main.py`](./main.py) 启动爬虫 5. 修改 [`autorun.yml`](./.github/workflows/autorun.yml),可通过 Github Actions 自动运行 6. 开启 Github Pages,指定目录为 master/docs