# 分省污染物排放情况数据分析 **Repository Path**: wangp06/Pandas_FL ## Basic Information - **Project Name**: 分省污染物排放情况数据分析 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2023-04-18 - **Last Updated**: 2023-04-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README |项目人|杨玉杏| |-|-| |时间|2020-7-18| |状态|完成| ### [项目代码网页](http://kelingt.gitee.io/pandas_fl/) # 项目:分省污染物排放情况数据分析 **项目价值主张**:利用国家统计局数据已记录有的污染物排放量数据分析各省的相关环境污染情况,以帮助相关部门对污染问题的防空与治理,了解今年来环境污染的治理成效,并未今后的治理方向提供参考数据。 ## 问题表述 ### 项目数据分析目的 环境污染问题一直是全球持续关注的问题。环境污染来自方方面面,最直观的来自人们生活生产需要而到之的排放污染。了解各项污染数据,有利于制定合理的环境治理战略,有利于社会的可持续发展。再次以中国2009-2018年的的污染物排放量数据为材料,分析各省的相关环境污染情况,全面了解中国环境治理方向,以帮助相关部门对污染问题的防空与治理,了解今年来环境污染的治理成效,并为今后的治理方向提供参考数据。 ### 画像 - 角色一:相关环境治理部门——在指定相关环境治理战略是,需要获取相关的数据信息并整理分析,为减少时间消耗需要已经备好的邮箱的分析成果必备方案制定。因此需要相关的数据分析结果来考虑环境治理的问题。 - 角色二:相关环保组织的研究学者——需要获取相关数据分析环境污染的问题,想社会反映世界污染现状,以为全球更好的可持续发展。因此因此需要相关的数据分析成果。 ## 解决方案表述 - **Viability商业可行性**:此类环境数据分析需求的金钱成本较低,各大数据网站均有公开的数据库查询(例,国家统计局、世界银行),单音词需要花费相对的时间成本;此外,环境污染的问题是实实在在影响着社会发展的,而污染排放影响着水域与大气的环境。水产业、渔业、农业等多多少少有以来水域环境,污水排放治理不合当,相关产业同样会受损严重,抑制发展,相关大气污染也是如此;另外,关于ESG风投,环境问题也是考量企业发展的重大指标。 - **Feasibility技术可行性**:相关分析数据来自中国国家统计局网站,应用Python-pandas对数据各项指标数据清晰拆分比较分析,结合不同的维度查看数据情况;同时,运用pyecharts,plotly,matplotlib等模块进行可视化图表制作,进一步对排放物的排放情况、治理情况、分省排放情况等污染问题并得到结论。 - **Desirability用户可欲性**:环境污染问题一直是全球持续关注的问题。环境污染来自方方面面,最直观的来自人们生活生产需要而到之的排放污染。了解各项污染数据,有利于制定合理的环境治理战略,有利于社会的可持续发展。相关环境治理部门——在指定相关环境治理战略是,需要获取相关的数据信息并整理分析,为减少时间消耗需要已经备好的邮箱的分析成果必备方案制定。 ![数据流程图](https://images.gitee.com/uploads/images/2020/0718/141746_6cd18ccd_3043318.png "流程图.png") ## 数据分析思路及方法 - 1. 收集获取有效的数据源,货架统计局数据无疑是相对准确和权威的,以避免相关的错漏。 - 2. 对数据分进合击,交叉分析,控件与时间对比,以求从中发现更多的成果。 - 3. 近数据整理分类,制作可视化图表,查看数据件的明显差异与变化,其中pyecharts,plotly,matplotlib等模块第良好的工具。 - 4. 先查看各类污染物分省排放差异;在列出相关的数据指标凉凉交叉比较分析,从中获取相关规律;在进行历年间地区的对比,获得污染排放量历年的变化曲线,以了解先前污染治理成效,以方便决策者从中获取相关治理优点,完善并改进 ## 数据分析流程及成果 - 1. 首先准备国家统计局数据,将数据以“排放物”为筛选索引,初步将数据整理拆分清理,分出相关排放物种类和排放量数据。 ![污染物排放分类](https://images.gitee.com/uploads/images/2020/0718/192840_75c6dd79_3043318.png "污染物排放分类.PNG") - 2. 进一步分进合击得到不同维度的数据排列对比。 - 3. 根据以上清晰所得数据,计算得到‘分省各污染物十年(2009-2018)平均污染物排放’表,结合pycharts模块制作**基础对比分析结果可视化图**。 ![历年平均污染物排放](https://images.gitee.com/uploads/images/2020/0718/193707_a4f645aa_3043318.png "历年平均污染物排放.PNG") ![基本对比图](https://images.gitee.com/uploads/images/2020/0718/193744_616bc62b_3043318.png "基础对比图.PNG") - 4. 根据‘污染物排放分类’表,以“化学需氧量”和“烟粉尘”对比分析,结合plotly模块**数据地图**。 ![化学需氧量分省排放分布](https://images.gitee.com/uploads/images/2020/0718/201340_d090d1e2_3043318.png "化学需氧量分省排放分布.png") ![烟粉尘分省排放分布](https://images.gitee.com/uploads/images/2020/0718/201414_f9e4b509_3043318.png "烟粉尘分省排放分布.png") - 5. 根据‘污染物排放分类’表,以“化学需氧量”排放数据变化为标准,结合matplotlib模块制作**时空交互图**。 ![历年化学需氧量排放](https://images.gitee.com/uploads/images/2020/0718/195731_f605ee47_3043318.png "历年化学需氧量排放.PNG") - 6. **成果结论**——(1)更据“基础对比图”和“数据地图”可以清楚了解到分省各污染物排放情况,并结合分析其中的规律与污染程度与预期。[“化学需氧量”](https://baike.sogou.com/v3757351.htm?fromTitle=%E5%8C%96%E5%AD%A6%E9%9C%80%E6%B0%A7%E9%87%8F)分省排放情况与人口分布,与城市化区域的关系较大,排污量大的地区主要是在高发展的人类聚集地;而像"烟粉尘"这类的配方真好相反,它主要排排放地位工业发展较高的省区,或者城市化发展较低多使用木柴焚烧生活的地区。其他微量有害污染成分;(2)“化学需氧量”排放是很亮污染程度的重要指标。以“化学需氧量”排放数据变化为标准,由“时空交互图”可以得知,“化学需氧量”排放量在2015年后极速下降,可以看出近十年的环境治理成效。 ## 学习/实践心得总结及感谢 本次数据来源是国家统计局,主要的获取来自老师的提供,感谢廖汉腾老师和许志超老师的指导和教学。本次项目主要运用的是python分析书写,具体只要使用模块有pandas(数据分析)和matplotlib、ploty、pyecharts(可视化图标制作),感谢[pyecharts使用文档](http://pyecharts.org/#/)的支持帮助。本次课程让我在现有python的基础上获取到了更多,补足了之前对数据分析的粗略了解的补足。pandas是数据分析中经常使用到的模块,也是非常好用的工具。在数据不停的分进合击创造了很多不同的可能,呈现出来的结果足以完善人们的思路。同时通过本次课程对于数据科学又有了更深刻的理解,关于设计思维与数据思维的思考又有了更清晰的了解;并且更加的了解到,只要你想任何的数据都可以运用分析。