# Python_数据分析 **Repository Path**: chen_jia_nan/python-data-analysis ## Basic Information - **Project Name**: Python_数据分析 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-07-03 - **Last Updated**: 2021-07-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Python_数据分析 # 如何选择你未来的城市--为即将毕业/已经毕业的大学生提供未来居住地的选择分析 ### 价值宣言 对于即将毕业和刚刚毕业正在迈入社会的大学生而言,独自生活工作的未来较为陌生,对于心仪的工作的省份/城市不熟悉不了解,无法轻易作出抉择,还在学习的学生对于工作地的选择有一定的想法,但对于其他未涉足过的省份不了解但又充满好奇,对此痛点,为即将毕业/已经毕业的大学生提供未来居住地的选择分析就尤为必要。帮助年轻人了解不同的省份情况,提供更有价值的分析说明。 | 项目 | 信息 | | :----: | :---- | | 名称 | 如何选择你未来的城市 | | 作用 | 为即将毕业/已经毕业的大学生提供未来居住地的选择分析 | | 数据来源 | [国家数据库](http://data.stats.gov.cn/) | ## 一、问题表述 #### 1.1 用户画像 - 准备迈入工作生活的毕业生,对于心仪的工作的省份不够熟悉不了解,无法轻易作出抉择 - 还在学习的学生对于工作地的选择有一定的想法,但对于其他未涉足过的省份不了解但又充满好奇 | 信息 | 画像 | | :----: | :---- | | 姓名 | 大桶 | | 年龄 | 22岁 | | 职业 | 毕业生未入职 | | 人物简介 | 刚刚毕业对于未来的工作生活充满了憧憬与向往,热爱生活,性格开朗 | | 用户痛点 | 不想在一直生活的城市工作却又不知道如何选择 | #### 1.2 使用场景 数据为即将大学毕业或于近期毕业的准社会工作者分析出几大热门就业城市的各项指标。 #### 1.4 解决谁的问题 解决即将毕业,但对于未来将居住的工作/生活生活不够了解的同学的问题;解决刚刚迈入社会需要换个地方生活的工作者的问题。 #### 1.5 核心价值与用户痛点 | 核心价值 | 用户痛点 | |:------:|:------:| | 帮助数据使用者了解陌生的省份 | 不够了解陌生的省份 | | 对比跟省份间的各种指标 | 无法获取省份数据进行对比 | | 清晰的数据展示 | 看不懂大量繁杂的数据 | | 综合的分析总结 | 追求经济但不对其他条件有顾虑 | | 深入分析各省份基础建设 | 想了解省份的基础设施建设是否完善| ## 二、解决方案表述 #### 2.1 数据流程图 数据分析项目将从国家数据库中得到的数据进行粗加工处理,利用pandas库对所导入的数据进行进一步的处理,将所得结果制成清晰的可视化图标对所得的结果进行分析总结,为使用者提供切实可行的建议。 ![数据流程图](https://gitee.com/chen_jia_nan/python-data-analysis/raw/master/pictures/data.png) ## 三、数据分析思路及方法 #### 3.1 数据分析思路 - 首页由近期的毕业季看到应届毕业生的就业之艰难,由此延伸至对于毕业生而言,其中对于就业工作地的选择也尤为重要,因此有了对于各省份相关信息的数据分析的想法 - 站在用户的角度而言,他们最关系的数据无非是**就业率、地区生产水平、人口密集程度、绿化建设、自然灾害**的相关情况,因此此次数据分析的思路,就由这几个方面着手 - 获取数据后通过课堂上学习的方法及网络上一些大佬提供的帮助例如: - [Anaconda jupyter notebook 简单更改前端样式](https://blog.csdn.net/And_ZJ/article/details/83591730) - [一文看懂pandas的透视表pivot_table](https://www.cnblogs.com/Yanjy-OnlyOne/p/11195621.html),对所得数据进行分析 - 得到的图表需要让用户清洗直观地看懂所分析的内容,从而产出可视化可用性强的图表 #### 3.2 数据分析方法 - 从[国家数据库](http://data.stats.gov.cn/)得到数据后,站在用户的角度,从用户最关心的几个纬度进行考量分析: - 经济水平 - 幸福指数 - 绿化覆盖率 - 读取数据,并将读取的数据进行查看,是否存在不必要或者对用户而言无意义的数据,是有存在对用户帮助极大,可以解决用户痛点的数据 - 清洗数据:这一步需要将上一步得到的无用数据进行清除处理,并对留下的重要的可分析的数据进行人文方面思考,如何分析得到对用户有用的,可帮助到用户的数据,利用函数对这些数据进行处理,有关参考文档 - [python pandas库——pivot使用心得](https://blog.csdn.net/qq_29118049/article/details/78804768) - 将得到的数据进行绘图,得到有助于用户理解的可视化图表,有关制图参考文档 - [pyecharts官方文档](http://pyecharts.org/) - [matplotlib官方文档](https://matplotlib.org/) #### 3.3 数据分析的人文或社会数据科学X数据分析论证相关性细节描述 - 就人文需求而言,对于即将毕业和刚刚毕业正在迈入社会的大学生,独自生活或者工作的经验较为陌生,对于心仪的工作的省份不了解,就有了这种清晰的数据分析的需求,对明了简单的可视化图表的需求。 - 就社会数据科学而言,现阶段的社会处于大数据极速发展的时代,没有什么是离不开数据,而对于没有数据分析经验的同学而言,即使有相关的数据可供他们了解,但因为数据本身的庞大与复杂性,他们无从知道什么是他们需要的,也无法得到自己所需要的内容,因此此项数据分析的结果,就可以帮助他们通过分析所得出的数据,得到自己想要的结果。 ## 四、数据分析流程及成果 #### 4.1 数据分析流程 - 通过将清洗后的数据进行拆分重组,将所需的数据:年份、地区、地区生产总值重新制表,对表格进行可视化作图,得出各省份间的经济水平对比 - 通过将清洗后的数据进行拆分重组,将所需的数据:地区、离婚率、结婚率生产总值重新制表,对表格进行可视化作图,得出各省份间的幸福指数对比 - 通过将清洗后的数据进行拆分重组,将所需的数据:年份、地区、绿化覆盖率总值重新制表,对表格进行可视化作图,得出各省份间的绿化覆盖率的变化情况 - 通过将清洗后的数据进行拆分重组,将所需的数据:年份、地区总值重新制表,对表格进行可视化作图,得出各省份间的危险程度 - 将得到的数据输入不同的图表类型,得到2017年不同省份的出生率与死亡率的概览 - 数据分析项目将从国家数据库中得到的数据进行粗加工处理:筛选出想要分析及有分析价值的数据,并将粗处理后的数据导入,利用pandas库对所导入的数据进行进一步的处理,根据分进合击的想法将数据拆解出你需要的,并可以将这些组建成新的表格,对次表进行更深层级的处理,将所得结果制成清晰的可视化图标,展现出易懂甚至可交互的数据,供数据分析项目使用者观看,最后对所得的结果进行分析总结,为使用者提供切实可行的建议。 #### 4.2 数据分析成果 - 用户可欲性:用户利用数据分析的成果,可以解决对于被迫选择的陌生的省份不够了解、获取省份相关数据并进行分析较为困难、没有清晰易懂的数据对各省份间的数据进行展示等痛点 - 技术可行性:数据分析通过一学期python数据分析课程所得到的知识能力与借助网络的力量解决出现的问题,即可实现 - 商业可行性:分析得到的成果有旷阔的用户市场,每年的应届毕业生、未毕业但对数据分析有需求以及已经工作但想要换个生活或者工作环境的群体都具有商业价值 #### 4.3 可视化图表 ![2017年不同省出生率概览](https://gitee.com/chen_jia_nan/python-data-analysis/raw/master/pictures/2017%E5%B9%B4%E4%B8%8D%E5%90%8C%E7%9C%81%E5%87%BA%E7%94%9F%E7%8E%87%E6%A6%82%E8%A7%88.png) ![2017年不同省死亡率概览](https://gitee.com/chen_jia_nan/python-data-analysis/raw/master/pictures/2017%E5%B9%B4%E4%B8%8D%E5%90%8C%E7%9C%81%E6%AD%BB%E4%BA%A1%E7%8E%87%E6%A6%82%E8%A7%88.png) ![2017年年末常驻人口(https://gitee.com/chen_jia_nan/python-data-analysis/raw/master/pictures/2017%E5%B9%B4%E5%B9%B4%E6%9C%AB%E5%B8%B8%E4%BD%8F%E4%BA%BA%E5%8F%A3.png) ![中国地区绿化覆盖率](https://gitee.com/chen_jia_nan/python-data-analysis/raw/master/pictures/%E5%B9%B8%E7%A6%8F%E6%8C%87%E6%95%B0%E5%88%86%E6%9E%90.png) ![各地失业人数分析](https://gitee.com/chen_jia_nan/python-data-analysis/raw/master/pictures/%E5%90%84%E5%9C%B0%E5%A4%B1%E4%B8%9A%E4%BA%BA%E6%95%B0%E5%88%86%E6%9E%90.png) ![城镇单位就业人员平均工资](https://gitee.com/chen_jia_nan/python-data-analysis/raw/master/pictures/%E5%9F%8E%E9%95%87%E5%8D%95%E4%BD%8D%E5%B0%B1%E4%B8%9A%E4%BA%BA%E5%91%98%E5%B9%B3%E5%9D%87%E5%B7%A5%E8%B5%84.png) #### 4.4 [ipnby文档](https://gitee.com/chen_jia_nan/python-data-analysis/blob/master/%E7%9C%81%E4%BB%BD%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90.ipynb) - 有认真制作,加入css样式 - 包含链接可供学习与参考 - 有根据数据分析绘制图表 ## 五、学习/实践心得总结及感谢 #### 总结 本次课程学会了对于数据的基本分析,意识到Python数据分析在工作以及生活中的重要性,虽然在学习过程中遇到很多困难,但是通过课本,网上教学视频以及同学帮助,稍微学会了一点点。数据分析很有用,但是我没学好! #### 感谢 - 感谢各位同学的帮助,指导与建议,一起加油 - 感谢网络的力量让我在迷茫的时候给我提供帮助,感谢愿意分享自己经验的大佬们