# python spider **Repository Path**: surpassgoodchao/python-spider ## Basic Information - **Project Name**: python spider - **Description**: 通过爬取豆瓣网最热门的电影,并将数据保存。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2023-04-18 - **Last Updated**: 2024-01-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # python spider #### 介绍 通过爬取豆瓣网最热门的电影,并将数据保存。 #### 软件架构 软件架构说明 #### 安装教程 1. xxxx 2. xxxx 3. xxxx #### 使用说明 1.urllib.request.urlopen函数。注意有些网页防止被爬,我们采用模拟浏览器打开/代理服务器 https://zhuanlan.zhihu.com/p/165241936 2 了解bs(beatifulSoup) 参考: https://zhuanlan.zhihu.com/p/394268763 3 正则表达是: https://zhuanlan.zhihu.com/p/49485967 #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)