# 第一周作业 **Repository Path**: lxlpfff/first_week_assignment ## Basic Information - **Project Name**: 第一周作业 - **Description**: 一、数据说明: Capital Bikeshare (美国Washington, D.C.的一个共享单车公司)提供的共享单车数据。数据包含每天的日期、天气等信息,需要预测每天的共享单车骑行量。 二、作业要求: 1. 对数据做数据探索分析(可参考EDA_BikeSharing.ipynb,不计分) 2. 适当的特征工程(可参考FE_BikeSharing.ipynb,不计分) 3. 对全体数据,随机选择其中80%做训练数据,剩下20%为测试数据,评价指标为RMSE。(10分) 4. 用训练数据训练最小二乘线性回归模型(20分)、岭回归模型、Lasso模型,其中岭回归模型(30分)和Lasso模型(30分)需采用5折交叉验证得到最佳正则超参数。 5. 比较用上述三种模型得到的各特征的系数,以及各模型在测试集上的性能。并简单说明原因。(10分) - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 1 - **Created**: 2018-10-31 - **Last Updated**: 2022-05-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 第一周作业 #### 项目介绍 一、数据说明: Capital Bikeshare (美国Washington, D.C.的一个共享单车公司)提供的共享单车数据。数据包含每天的日期、天气等信息,需要预测每天的共享单车骑行量。 二、作业要求: 1. 对数据做数据探索分析(可参考EDA_BikeSharing.ipynb,不计分) 2. 适当的特征工程(可参考FE_BikeSharing.ipynb,不计分) 3. 对全体数据,随机选择其中80%做训练数据,剩下20%为测试数据,评价指标为RMSE。(10分) 4. 用训练数据训练最小二乘线性回归模型(20分)、岭回归模型、Lasso模型,其中岭回归模型(30分)和Lasso模型(30分)需采用5折交叉验证得到最佳正则超参数。 5. 比较用上述三种模型得到的各特征的系数,以及各模型在测试集上的性能。并简单说明原因。(10分) #### 软件架构 软件架构说明 #### 安装教程 1. xxxx 2. xxxx 3. xxxx #### 使用说明 1. xxxx 2. xxxx 3. xxxx #### 参与贡献 1. Fork 本项目 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 码云特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. 码云官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解码云上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是码云最有价值开源项目,是码云综合评定出的优秀开源项目 5. 码云官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. 码云封面人物是一档用来展示码云会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)