# SVM算法以及决策树算法-上 **Repository Path**: kylewang_ai/week_9_basic_work ## Basic Information - **Project Name**: SVM算法以及决策树算法-上 - **Description**: 1. 为什么要引入核函数? 2. 给出合页损失的数学形式并画出图形。 3. 什么是支持向量?为什么SVM中只有一小部分的训练样本是支持向量(稀疏的)? 4. 决策树中特征分裂的准则有哪些? 5. SVM模型并没有概率解释。为了使SVM模型能输出概率,我们应该设置哪个参数? 6. 采用train_test_split,从将数据集中随机抽取10000条记录,用于下述作业中模型的训练(原始数据集太大,剩余数据抛弃)。 7. 根据6中得到的训练数据,训练线性SVM,并对超参数(正则惩罚项、C)进行超参数调优,并分析不同C对应的训练误差和交叉验证得到的测试误差的变化趋势。 8. 根据6中得到的训练数据,训练RBF核SVM,并对超参数(C和gamma)进行超参数调优,并分析参数C和gamma对模型复杂度的影响,以及对训练误差和交叉验证得到的测试误差的影响。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 0 - **Created**: 2019-05-26 - **Last Updated**: 2023-07-20 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 第九周基础作业 #### 介绍 1. 为什么要引入核函数?(10分) 2. 给出合页损失的数学形式并画出图形。(10分) 3. 什么是支持向量?为什么SVM中只有一小部分的训练样本是支持向量(稀疏的)?(10分) 4. 决策树中特征分裂的准则有哪些?(10分) 5. SVM模型并没有概率解释。为了使SVM模型能输出概率,我们应该设置哪个参数?(10分) 6. 采用train_test_split,从将数据集中随机抽取10000条记录,用于下述作业中模型的训练(原始数据集太大,剩余数据抛弃)。(10分) 7. 根据6中得到的训练数据,训练线性SVM,并对超参数(正则惩罚项、C)进行超参数调优,并分析不同C对应的训练误差和交叉验证得到的测试误差的变化趋势。(20分) 8. 根据6中得到的训练数据,训练RBF核SVM,并对超参数(C和gamma)进行超参数调优,并分析参数C和gamma对模型复杂度的影响,以及对训练误差和交叉验证得到的测试误差的影响。(20分) #### 软件架构 软件架构说明 #### 安装教程 1. xxxx 2. xxxx 3. xxxx #### 使用说明 1. xxxx 2. xxxx 3. xxxx #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 码云特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. 码云官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解码云上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是码云最有价值开源项目,是码云综合评定出的优秀开源项目 5. 码云官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. 码云封面人物是一档用来展示码云会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)