# Mathorcup2021 **Repository Path**: wgj439/mathorcup2021 ## Basic Information - **Project Name**: Mathorcup2021 - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-01-16 - **Last Updated**: 2022-01-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 时间变量的处理 对时间变量处理方法:通过python的 `time`库将日期变量转换为时间戳 ```python import time# 将日期转换为时间戳 data_train['tradetime']=data_train['tradetime'].apply(lambda x:None if x is None else time.mktime(time.strptime(x,"%Y-%m-%d"))) data_train['registerdate']=data_train['registerdate'].apply(lambda x:None if x is None else time.mktime(time.strptime(x,"%Y-%m-%d"))) data_train['licenseDate']=data_train['licenseDate'].apply(lambda x:None if x is None else time.mktime(time.strptime(x,"%Y-%m-%d"))) data_train[6]=data_train[6].apply(lambda x:None if x is np.nan else time.mktime(time.strptime(x,"%Y-%m-%d"))) ``` 可以在 `data_q1 copy.ipynb`中看到结果 但是回归结果不尽人意,拟合优度甚至是负的。 个人对xgboost的理解:xgboost是不用做特征缩放和缺失值处理的,因此将时间戳归一化是没有意义的。 ## 个人建议 舍弃了时间变量的拟合优度R2-score=0.95,其实已经相当准确,只要在论文中写上我们考虑了对时间变量的处理,发现处理后反而影响了模型拟合, 这样是不是会好一点?