根据活动的关键词(count_1, count_2, ..., count_100,count_other属性)做聚类,可采用KMeans聚类 尝试K=10,20,30,..., 100, 并计算各自CH_scores。
最近更新: 8年前数据说明: Rental Listing Inquiries数据集是Kaggle平台上的一个分类竞赛任务,需要根据公寓的特征来预测其受欢迎程度(用户感兴趣程度分为高、中、低三类)。其中房屋的特征x共有14维,响应值y为用户对该公寓的感兴趣程度。评价标准为logloss。 批改标准 独立调用xgboost或在sklearn框架下调用均可。 1.模型训练:超参数调优 a) 初步确定弱学习器数目: 20分 b) 对树的最大深度(可选)和min_children_weight进行调优(可选):20分 c) 对正则参数进行调优:20分 d) 重新调整弱学习器数目:10分 e) 行列重采样参数调整:10分 1.调用模型进行测试10分 2.生成测试结果文件10分
最近更新: 8年前Ames房价预测是Kaggle平台上的一个竞赛任务,需要根据房屋的特征来预测亚尼亚州洛瓦市(Ames,Lowa)的房价。其中房屋的特征x共有79维,响应值y为每个房屋的销售价格(SalePrice)。评价标准为预测值的对数和观测值的对数RMSE(Root-Mean-Squared-Error )。
最近更新: 8年前