# Data-final **Repository Path**: forevercan/data-final ## Basic Information - **Project Name**: Data-final - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-07-01 - **Last Updated**: 2021-07-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 数据分析期末项目 ## 一、数据源 [中国电影网电影](https://gitee.com/forevercan/data-final/tree/master/data) ## 二、数据分析目标 重点对数据集中的时间进行数据清洗,分离出影片上映年份和上映月份,便于在后续的数据分析中直接调用。将清洗出来的df进行多表合并,合成新的数据集。 ## 三、MVP加/价值主张宣言 根据中国电影网电影数据进行统计,结合电影数量、上映时间、电影类型、电影票房,为热衷于电影背后数据的人提供可视化分析。 ## 四、数据分析结果可视化 ### 数据分析思路及方法 - 首先需要读取表格,其次查看数据栏(查看是否有需要重命名的数据栏),可取其中几列比较重要的数据进行查看,观察其数据结构、特征,有没有哪里可以作为切入点,查看数据有没有交叉关系。对数据进行思考,写下剖析数据的思路。 - 第二步是最重要的一步,也是最关键的一步,即数据清洗。数据清洗初阶会用到一些简单的函数,如```groupby()、agg()、sort_index()、sort_values、loc[]、iloc[]、isin()```等,进阶则有可能接触到二维表格,通常会用到```pivot()、pivot_table()、merge()、reset_index()、set_index()```等,依据自己的想法去使用对应的函数进行清洗。 - 如果数据已经清洗完毕的话,达到你想要的结果,则可以开始做可视化图,通常用到的可视化模块有```pyecharts plotly matplotlib```,在这里我选择调用pyecharts,这个模块的样式较多,具体使用方法可参照以下链接。 - [pyecharts官方文档](http://pyecharts.org/) - [plotly官方手册](https://plotly.com/) - [matplotlib官方文档](https://matplotlib.org/) ### 数据分析成果 #### 1、历年来电影票房玫瑰图 ![历年来电影票房玫瑰图](https://gitee.com/forevercan/data-final/raw/master/%E5%8F%AF%E8%A7%86%E5%8C%96%E5%9B%BE%E7%89%87/%E5%8E%86%E5%B9%B4%E6%9D%A5%E7%94%B5%E5%BD%B1%E7%A5%A8%E6%88%BF%E7%8E%AB%E7%91%B0%E5%9B%BE.png) #### 2、每年电影数量柱状图 ![每年电影数量柱状图](https://gitee.com/forevercan/data-final/raw/master/%E5%8F%AF%E8%A7%86%E5%8C%96%E5%9B%BE%E7%89%87/%E6%AF%8F%E5%B9%B4%E7%94%B5%E5%BD%B1%E6%95%B0%E9%87%8F%E6%9F%B1%E7%8A%B6%E5%9B%BE.png) #### 3、各类型电影数量饼图 ![各类型电影数量饼图](https://gitee.com/forevercan/data-final/raw/master/%E5%8F%AF%E8%A7%86%E5%8C%96%E5%9B%BE%E7%89%87/%E5%90%84%E7%B1%BB%E5%9E%8B%E7%94%B5%E5%BD%B1%E6%95%B0%E9%87%8F%E9%A5%BC%E5%9B%BE.png) #### 4、各类型电影票房漏斗图 ![各类型电影票房漏斗图](https://gitee.com/forevercan/data-final/raw/master/%E5%8F%AF%E8%A7%86%E5%8C%96%E5%9B%BE%E7%89%87/%E5%90%84%E7%B1%BB%E5%9E%8B%E7%94%B5%E5%BD%B1%E7%A5%A8%E6%88%BF%E6%BC%8F%E6%96%97%E5%9B%BE.png) #### 5、各月份电影数量及票房雷达图 ![各月份电影数量及票房雷达图](https://gitee.com/forevercan/data-final/raw/master/%E5%8F%AF%E8%A7%86%E5%8C%96%E5%9B%BE%E7%89%87/%E5%90%84%E6%9C%88%E4%BB%BD%E7%94%B5%E5%BD%B1%E6%95%B0%E9%87%8F%E5%8F%8A%E7%A5%A8%E6%88%BF%E9%9B%B7%E8%BE%BE%E5%9B%BE.png)