# Data analysis-Python
**Repository Path**: maifengyuan/python-data-analysis
## Basic Information
- **Project Name**: Data analysis-Python
- **Description**: 用户存放大二下数据分析课程作业
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-06-10
- **Last Updated**: 2022-11-20
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# Python数据分析
#### 数据来源:
[Kaggle](https://www.kaggle.com/)
> 数据集:请通过压缩包:Data_analyFinal-Maify下载titanic_test/titanic_train
#### 作品运用:
1. Flask实现数据分析网站
2. Pyechart交互式可视化图表
3. plt.figure静态图表
4. 机器学习:归回算法
#### 数据分析说明:
##### 交互式数据可视化
[使用工具](https://pyecharts.org/#/)
> 制作图像类型:柱状图;饼图;曲线图;漏斗图;关系节点图
##### 数据清洗:去除包含NaN的行
```
df1 = df_on.dropna(axis=0,how='any')
```
##### 年龄段分类(根据心理年龄层次进行划分)并生成对应生还率(两个维度:性别+年龄):
> 幼年:0-4 学前:4-8 学初:8-13 少:13-16 青年:16-31 中:31-51 老:51-101
```
def Sr(sex_c,age_1,age_2):
F1ag_2 = []
F1a = []
F1ag_1 = df1[df1["Sex"]==sex_c]
for i in F1ag_1["Age"]:
if i in range(age_1,age_2):
F1ag_2.append(i)
F1ag_a = len(F1ag_2)
F1ag = F1ag_1[F1ag_1["Survived"]==1]
for i in F1ag["Age"]:
if i in range(age_1,age_2):
F1a.append(i)
F1ag_b = len(F1a)
F1Sr = F1ag_b/F1ag_a
return F1Sr
```
**数据汇总**
```
女性 = [F1y_Sr,F1xc_Sr,F1xq_Sr,F1s_Sr,F1q_Sr,F1z_Sr,F1l_Sr]
男性 = [M1y_Sr,M1xc_Sr,M1xq_Sr,M1s_Sr,M1q_Sr,M1z_Sr,M1l_Sr]
Female_res = []
Male_res = []
for i in 女性:
fres = i*cal
fres2 = str(fres)
fres3 = fres2[:4]
fres4 = float(fres3)
Female_res.append(fres4)
for i in 男性:
mres = i*cal
mres2 = str(mres)
mres3 = mres2[:4]
mres4 = float(mres3)
Male_res.append(mres4)
```
##### 静态图表
> 主要方法:plt——subplot、figure
##### 机器学习入门