# Ames---房价预测(线性回归) **Repository Path**: edwinjiang703/ames ## Basic Information - **Project Name**: Ames---房价预测(线性回归) - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2018-05-31 - **Last Updated**: 2024-03-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Ames---房价预测(线性回归---Linear Regression) #### 分为三个文件 1 数据清洗以及特征工程 Ames---房价预测(线性回归)-- 训练数据特征处理.ipynb 特征处理过的训练集数据:final_train_data.csv 2 模型训练 Ames---房价预测(线性回归测试).ipynb 3 visuals.py 用于生成学习曲线 #### 特征工程做了如下一些操作: 1 缺失值的处理,根据不同的缺失值分别进行处理,并不是统统给一个均值。 2 特征编码和One-hot编码。 3 异常值的处理 4 数据标准化处理 #### 测试结果: 1 Ridge: The r2 score of RidgeCV on train sets is 0.92238083416 The r2 score of RidgeCV on validate sets is 0.905990657591 2 Lasso: The r2 score of LassoCV on train sets is 0.919458207534 The r2 score of LassoCV on validate sets is 0.909838060603 The r2 score of LassoCV on train sets is 0.921554463494 The r2 score of LassoCV on validate sets is 0.909457449753 LassoCV train sets rmse is 0.280081303385 LassoCV validate sets rmse is 0.321836509155 LassoCV train sets mse is 0.0784455365059 LassoCV validate sets mse is 0.103578738625