1 Star 0 Fork 0

Tony / Python课程第七周作业

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

python课程第七周作业

项目介绍

问题描述 本周课程主要讲解Python网络爬虫的基础内容。具体有:Python中的正则表达式,网络爬虫基础,以及urllib、urllib3和requests库的使用。本周闯关作业具体如下(可下载资料包查看更详尽的内容): 1).分别使用userlib和requests爬取有道翻译的信息,要求输如英文后获取对应的中文翻译信息: 2 ). 分页爬取58同城的租房信息,信息内容要求有:【标题、图片、户型、价格】,并且获取指定页的所有租房信息:如URL地址:http://bj.58.com/dashanzi/chuzu/pn1/?ClickID=1 3). 爬取猫眼电影中榜单栏目中TOP100榜的所有电影信息(10页信息全部爬取),字段要求【序号、图片、电影名称、主演、时间、评分】,并将信息写入文件中: 具体参考URL地址:http://maoyan.com/board/4 解题提示 1、有道翻译信息的爬取可参考本周百度翻译信息爬取案例。 2、58同城的租房信息获取,首先先确定URL地址,编写爬虫程序,要使用正则表达式解析爬取的信息。 3、爬取猫眼电影中榜单栏目中TOP100榜的所有电影信息

软件架构

软件架构说明

安装教程

  1. xxxx
  2. xxxx
  3. xxxx

使用说明

  1. xxxx
  2. xxxx
  3. xxxx

参与贡献

  1. Fork 本项目
  2. 新建 Feat_xxx 分支
  3. 提交代码
  4. 新建 Pull Request

码云特技

  1. 使用 Readme_XXX.md 来支持不同的语言,例如 Readme_en.md, Readme_zh.md
  2. 码云官方博客 blog.gitee.com
  3. 你可以 https://gitee.com/explore 这个地址来了解码云上的优秀开源项目
  4. GVP 全称是码云最有价值开源项目,是码云综合评定出的优秀开源项目
  5. 码云官方提供的使用手册 http://git.mydoc.io/
  6. 码云封面人物是一档用来展示码云会员风采的栏目 https://gitee.com/gitee-stars/

空文件

简介

问题描述 本周课程主要讲解Python网络爬虫的基础内容。具体有:Python中的正则表达式,网络爬虫基础,以及urllib、urllib3和requests库的使用。本周闯关作业具体如下(可下载资料包查看更详尽的内容): 1).分别使用userlib和requests爬取有道翻译的信息,要求输如英文后获取对应的中文翻译信息: 2 ). 分页爬取58同城的租房信息,信息内容要求有:【标题、图片、户型、价格】,并且获取指定页的所有租房信息:如URL地址:http://bj.58.com/dashanzi/chuzu/pn1/?ClickID=1 3). 爬取猫眼电影中榜单栏目中TOP100榜的所有电影信息(10页信息全部爬取),字段要求【序号、图片、电影名称、主演、时间、评分】,... 展开 收起
Python
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
Python
1
https://gitee.com/tonymin/pythonhomework_seventhweek.git
git@gitee.com:tonymin/pythonhomework_seventhweek.git
tonymin
pythonhomework_seventhweek
Python课程第七周作业
master

搜索帮助