# Data analysis-Python **Repository Path**: maifengyuan/python-data-analysis ## Basic Information - **Project Name**: Data analysis-Python - **Description**: 用户存放大二下数据分析课程作业 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-06-10 - **Last Updated**: 2022-11-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Python数据分析 #### 数据来源: [Kaggle](https://www.kaggle.com/) > 数据集:请通过压缩包:Data_analyFinal-Maify下载titanic_test/titanic_train #### 作品运用: 1. Flask实现数据分析网站 2. Pyechart交互式可视化图表 3. plt.figure静态图表 4. 机器学习:归回算法
#### 数据分析说明: ##### 交互式数据可视化 [使用工具](https://pyecharts.org/#/) > 制作图像类型:柱状图;饼图;曲线图;漏斗图;关系节点图
##### 数据清洗:去除包含NaN的行 ``` df1 = df_on.dropna(axis=0,how='any') ``` ##### 年龄段分类(根据心理年龄层次进行划分)并生成对应生还率(两个维度:性别+年龄): > 幼年:0-4 学前:4-8 学初:8-13 少:13-16 青年:16-31 中:31-51 老:51-101 ``` def Sr(sex_c,age_1,age_2): F1ag_2 = [] F1a = [] F1ag_1 = df1[df1["Sex"]==sex_c] for i in F1ag_1["Age"]: if i in range(age_1,age_2): F1ag_2.append(i) F1ag_a = len(F1ag_2) F1ag = F1ag_1[F1ag_1["Survived"]==1] for i in F1ag["Age"]: if i in range(age_1,age_2): F1a.append(i) F1ag_b = len(F1a) F1Sr = F1ag_b/F1ag_a return F1Sr ```
**数据汇总** ``` 女性 = [F1y_Sr,F1xc_Sr,F1xq_Sr,F1s_Sr,F1q_Sr,F1z_Sr,F1l_Sr] 男性 = [M1y_Sr,M1xc_Sr,M1xq_Sr,M1s_Sr,M1q_Sr,M1z_Sr,M1l_Sr] Female_res = [] Male_res = [] for i in 女性: fres = i*cal fres2 = str(fres) fres3 = fres2[:4] fres4 = float(fres3) Female_res.append(fres4) for i in 男性: mres = i*cal mres2 = str(mres) mres3 = mres2[:4] mres4 = float(mres3) Male_res.append(mres4) ```
##### 静态图表 > 主要方法:plt——subplot、figure
##### 机器学习入门