# 入门爬虫__豆瓣电影TOP250 **Repository Path**: wang-yiyi-520/request_doubiantop250 ## Basic Information - **Project Name**: 入门爬虫__豆瓣电影TOP250 - **Description**: 爬取豆瓣电影TOP250的数据,包括电影详情连接、图片链接、影片中文名、影片外国名、评分、评价数、概况、相关信息。使用urllib库获取页面内容以及BeautifulSoup对html页面进行解析定位,并将爬取的数据生成excel表格,对表格数据进行数据可视化。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2022-07-03 - **Last Updated**: 2022-07-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 入门爬虫__豆瓣电影TOP250 #### 介绍 爬取豆瓣电影TOP250的数据,包括电影详情连接、图片链接、影片中文名、影片外国名、评分、评价数、概况、相关信息。使用urllib库获取页面内容以及BeautifulSoup对html页面进行解析定位,并将爬取的数据生成excel表格,对表格数据进行数据可视化。 #### 软件架构 软件架构说明 #### 使用说明 1. pip install bs4 2. pip install openpyxl 3. 在使用运行本文件之前,请先安装好上面两个依赖 4. douban.py:爬取数据并生成excel文件 5. data_analysis.py:根据excel文件绘制可视化数据图 6. 爬取好结果后会生成excel文件,请按自己需要修改excel文件保存路径,路径位于main()方法的savapath参数