# 大数据采集与清洗2021 **Repository Path**: cgh66/dataprocess ## Basic Information - **Project Name**: 大数据采集与清洗2021 - **Description**: 大数据采集与清洗课程专用 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 21 - **Created**: 2021-09-18 - **Last Updated**: 2021-09-18 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 大数据采集与清洗_2021 介绍 南京工业职业技术大学2020-2021第二续期 大数据1911班级《大数据采集与清洗》课程资料、作业和相关内容 作业 1.实现课堂实例:IT专业人员的信息表,用Python实现数据预处理如下: ​ (1)查看缺失值 ​ (2)将'Salary '列的空值用平均值补充 ​ (3)对'Salary'薪水这一列进行观察,自己用合适的区间进行数据规约 参考网站 1. numpy手册:https://numpy.org/devdocs/user/quickstart.html; RUNOOB站的Numpy栏目:https://www.runoob.com/numpy/numpy-tutorial.html 2. pandas手册:https://pandas.pydata.org/pandas-docs/stable/index.html pandas中文网:https://www.pypandas.cn/ 3. matplotlib手册:https://matplotlib.org/ RUNOOB的matplotlib板块:https://www.runoob.com/w3cnote/matplotlib-tutorial.html 4. markdown基本语法:https://www.markdown.xyz/basic-syntax/