# pandas_final **Repository Path**: xinyilynn/pandas_final ## Basic Information - **Project Name**: pandas_final - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-07-18 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 项目名称:2013-2018中国水资源情况分析 [查看项目完整代码请下载文件,自行运行](https://gitee.com/xinyilynn/pandas_final/tree/master/%E6%B0%B4%E8%B5%84%E6%BA%90%E5%88%86%E6%9E%90) ## 数据分析项目MVP加/价值主张宣言: 通过分析中国各省的水资源水资源总量、地表水资源量、地下水资源量、地表水与地下水资源重复量、人均水资源量等数据,探究各省的水资源情况之间的差异,从优秀的省份学习,从的省水资源紧缺省份中反思。 ## 分析项目为什么要做? 水资源问题是当今世界上最受关注的焦点问题之一,我国幅员辽阔,水资源十分丰富,但人均占有量属于少,并且属于多水患国家,随着我国经济发展速度快速增长和水资源开发活动的大力开展,水资源保护压力越来越大。希望通过分析比较我国各省的水资源的情况,互相学习保护水资源的措施。 ## 是谁有需要解决的问题? * 用户画像:水行政主管部门,负责水资源开发、利用、节约和保护的有关工作。 ## 需求 * 用户使用场景:到每季度要提交报告的时间,希望得到直观的结果。 * 任务:需要快速撰写水资源报告 * 痛点:收集到的数据过多过杂,不能直观的得到结果 * 增长点:找到各省的差异,探究出现差异的原因。 ## 数据分析项目如何做分析? * 先将水资源分省数据时空交互地图制作出来,观察每个省份13-18年这五年间,每个省总体水资源的变化。 * 各省的地下水资源与地表水资源的变化,看看这之间有什么联系 * 从分散到总体,看看水资源整体的变化 ## 分析成果如何解决谁的问题? * 通过观看各省五年间的水资源变化情况,找到增长明显与下降明显的省份,拿来做对比。 * 从分省到全国,由表及里,看看哪一个标量导致了全国的用水情况的改变。 ## 数据分析思路及方法 思路: * 读取 “RES_Wtrsc.csv”水资源情况表,'RES_Wsau.csv'水资源使用情况表 * 对两个数据进行数据清洗、搭桥和分进合击来作出中国所有省份的表格,而因为表格中的中国省份名称于图资里的名不符,例如图资中的 上海是上海,而表格中为上海市,所以需要进行搭桥。 * 制作分省水资源情况的时空交互图,时空交互地图,地图。探究各省在五年间变化的趋势 * 制作各省地表水与地下水之间的重复率的差异。查看水资源丰富是否与重复率有关。 * 制作全国五年间的用水使用图,看看变化趋势,着重看哪一个变量发生了较大改变。 ## 方法: 首先将各个栏位换名称,方便接下来的数据清洗。 ![换栏位名称]( https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E9%87%8D%E5%91%BD%E5%90%8D%E6%A0%8F%E4%BD%8D.png) 查看各个栏位的数据类型,观察哪些是可以计算的,将不可计算的调整为可计算,反之亦然。 ![观察数据类型]( https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E8%A7%82%E5%AF%9F%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B.png) 提取出水资源各省的数据进行数据清洗和分进合击 ![数据清洗]( https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E8%BF%9B%E8%A1%8C%E6%95%B0%E6%8D%AE%E6%B8%85%E6%B4%97.png) ![分进合击]( https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E5%88%86%E8%BF%9B%E5%90%88%E5%87%BB.png) ## 数据分析流程及成果 * 分析流程1-分省水资源分析 * 在得到分进合击表之后,我进行了水资源总量的时空地图交互,希望最直接明白的得到各省之间的变化趋势 ![水资源总量的时空地图交互](https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E6%B0%B4%E8%B5%84%E6%BA%90%E6%80%BB%E9%87%8F%E6%97%B6%E7%A9%BA%E4%BA%A4%E4%BA%92%E5%9B%BE.png) 从时空交互图中可以看出,从2013-2018年间水资源总量变化明显。在13-17年间从较为丰沛的水资源总量逐渐减少,呈现下降趋势。但是在18年时全国总体水资源的量都有了明显的增加。 * 分析完水资源总量变化的趋势,我想去查看各省之间的人均水资源的差异,看看再总体水资源多的省份,是否人均水资源量也会多 ![人均水资源量地图]( https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E4%BA%BA%E5%9D%87%E6%B0%B4%E8%B5%84%E6%BA%90%E9%87%8F%E5%9C%B0%E5%9B%BE.png) 从地图信息看出来,除了西藏地区之外,全国的人均水资源都十分稀缺,人均水资源过少 * 分析完各省之间人均水资源量,我想去看看这水总资源量是否与地表水、地下水之间有关,所以我制作了地表水地下水的时空交互图,看看这5年来,这三个值的之间变化趋势。 ![地表地下时空交互]( https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E5%9C%B0%E8%A1%A8%E5%9C%B0%E4%B8%8B%E6%97%B6%E7%A9%BA%E4%BA%A4%E4%BA%92%E5%9B%BE.png) 根据上图看出2013-2018年,地表水资源与地上水资源变化量都很大,这也导致了水资源总量变化大 * 最后制作了各省地表水与地下水之间的折线图,更加直观的看到这两个值的重复率 ![折线图]( https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E6%8A%98%E7%8E%B0%E5%9B%BE.png) 可以看出大多数南方地区,地表水资源尤为丰富,北方地区地下水资源较为丰富。在平时的水资源开发中,需要注意合理运用。 * 分析流程2-总体水资源使用分析 * 读入中国用水情况数据,进行分进合击,分出三个表,分别关于用水情况,供水量,总供水与总用水。 * 首先分析总供水 ![总供水](https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E6%80%BB%E4%BE%9B%E6%B0%B4%E6%83%85%E5%86%B5.png) 由图我们可以看出,2013-2018年间,供水情况并没有过大的变化,但是可以看出,关于地下水供水量呈现出微小的下降趋势. * 之后将分析总用水 ![总用水](https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E6%80%BB%E7%94%A8%E6%B0%B4%E6%83%85%E5%86%B5.png) 由图我们可以看出,2013-2018年间,国家对于农业用水,工业用水都在逐年缓慢下降的,而生态用水是在呈现上升状态。 * 最后分析供水与用水的总量 ![总供用](https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E4%BE%9B%E7%94%A8%E6%B0%B4.png) 现在我国的水资源还处于一个供给平衡的状态 * 制作水资源情况饼状图 * 地表供水占比图 ![地表供水占比图](https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E5%9C%B0%E8%A1%A8%E4%BE%9B%E6%B0%B4.png) * 生态用水占比图 ![生态用水占比图](https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E7%94%9F%E6%80%81%E7%94%A8%E6%B0%B4.png) 这五年间主要的用水与供水的变化不大,但是需要注意的是生态用水呈现上升趋势 ## 数据分析流程及成果 ![数据流程图](https://gitee.com/xinyilynn/pandas_final/raw/master/image/%E6%95%B0%E6%8D%AE%E6%B5%81%E7%A8%8B%E5%9B%BE.png) * 结果分析 * 中国水资源的总量变化大 * 地表水资源与地下水资源要合理运用 * 中国人均水资源少,尤其是发达地区,如北京、上海等超级城市。但是西藏它不仅含有巨大的水资源储存量,人均水资源量也巨大,建议强化建设南水北调,西水东调工程。 * 发现国内的生态用水有上升趋势,注意在生态绿色环保中的支出 * 地下水供给呈下降趋势,要注意对于地下水的开发与利用,将地表与地下使用互相调和,达到一个平衡 **Viability商业可行性**:此类环境数据分析需求的金钱成本较低,各大数据网站均有公开的数据库查询(例,国家统计局、世界银行);此外,水资源的问题在方方面面的影响着国家发展。水资源的总量,人均水资源量等问题引起了社会各方面的关注。 **Feasibility技术可行性**:相关分析数据来自和鲸社区已整理好的数据,应用pandas对数据的各项指标进行拆分,比较分析,结合不同的维度查看数据情况;同时,运用pyecharts,plotly,matplotlib等模块进行可视化图表制作,进一步对国家分省水资源的情况进行可视化分析。 **Desirability用户可欲性**:水资源情况一直被世界各国关注,每个人都有义务去关心水资源的使用情况。从数据上了解从哪几个方面节约水资源,从各个维度上多方面的深入了解水资源。 ## 学习/实践心得总结及感谢 在本项目实践中,我学习到了混合心智模型加入设计流程后,我的想法更倾向于数字人文方面以可视化的方式讲故事,通过数据的分析来为自己的直觉观点进行支撑,分析与直觉并行。 感谢廖汉腾与许智超老师提供的关键代码,以及和鲸社区提供的国家分省水资源数据。https://www.kesci.com/home/dataset/5e86f34095b029002ca833cf/document 混合心智模型给我带来了好处,给我拓展了思路。每个学科之间都有交叉,并不是筑起围墙的。在文科的领域我可以借用工科,同时在工科领域我也可以借用文科的思维进行思考。 感谢网络上的python学习资料,感谢各位的无私分享 * [无面向对象](https://blog.csdn.net/u010916338/article/details/81747192) * [pandas中文网](https://www.pypandas.cn/) * [plotly官网](https://plotly.com/python/sliders/) * [merge合并](https://blog.csdn.net/Asher117/article/details/84725199) * [sort_values](https://blog.csdn.net/MsSpark/article/details/83154128) * [pivot](https://www.cnblogs.com/Yanjy-OnlyOne/p/11195621.html) * [stack()和unstack()](https://blog.csdn.net/qq_42874547/article/details/89056000) * [数据流程图制作](https://baijiahao.baidu.com/s?id=1659058146016515903&wfr=spider&for=pc) * [分进合击](https://gitee.com/xinyilynn/pandas/blob/master/week2_pandas.ipynb) * [切片](https://gitee.com/xinyilynn/pandas/blob/master/%E7%AC%AC%E5%85%AD%E5%91%A8.ipynb) * [loc](https://www.cnblogs.com/kylie-go/p/10303028.html) * [drop删除](https://blog.csdn.net/weixin_42575020/article/details/95338407) * [饼状图](https://www.cnblogs.com/zhuminghui/p/9418820.html) * [地图](https://www.zhihu.com/question/33783546/answer/960303400?utm_source=com.yinxiang) * [柱状图](https://blog.csdn.net/grey_csdn/article/details/70768919) * [LDA](https://blog.csdn.net/qq_39422642/article/details/78730662) * [随机森林](https://baike.baidu.com/item/%E9%9A%8F%E6%9C%BA%E6%A3%AE%E6%9E%97/1974765?fr=aladdin) * [pandas](https://blog.csdn.net/qq_34859482/article/details/80592741)