代码拉取完成,页面将自动刷新
问题描述 本周课程主要讲解Python网络爬虫的基础内容。具体有:Python中的正则表达式,网络爬虫基础,以及urllib、urllib3和requests库的使用。本周闯关作业具体如下(可下载资料包查看更详尽的内容): 1).分别使用userlib和requests爬取有道翻译的信息,要求输如英文后获取对应的中文翻译信息: 2 ). 分页爬取58同城的租房信息,信息内容要求有:【标题、图片、户型、价格】,并且获取指定页的所有租房信息:如URL地址:http://bj.58.com/dashanzi/chuzu/pn1/?ClickID=1 3). 爬取猫眼电影中榜单栏目中TOP100榜的所有电影信息(10页信息全部爬取),字段要求【序号、图片、电影名称、主演、时间、评分】,并将信息写入文件中: 具体参考URL地址:http://maoyan.com/board/4 解题提示 1、有道翻译信息的爬取可参考本周百度翻译信息爬取案例。 2、58同城的租房信息获取,首先先确定URL地址,编写爬虫程序,要使用正则表达式解析爬取的信息。 3、爬取猫眼电影中榜单栏目中TOP100榜的所有电影信息
软件架构说明
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。