# knn_iris **Repository Path**: jiayaoyao666/knn_iris ## Basic Information - **Project Name**: knn_iris - **Description**: Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于三个种类中的哪一类。在MapReduce选择knn对该数据集进行分类预测,采用留出法对建模结果评估,70%数据为训练集,30%数据为测试集,评估标准采用accuracy。 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-11-15 - **Last Updated**: 2024-11-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # knn_iris #### 介绍 Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于三个种类中的哪一类。在MapReduce选择knn对该数据集进行分类预测,采用留出法对建模结果评估,70%数据为训练集,30%数据为测试集,评估标准采用accuracy。 #### 运行截图 ![输入图片说明](https://images.gitee.com/uploads/images/2021/1115/193613_7b5f179e_9006408.png "屏幕截图.png") #### 可视化 ![输入图片说明](https://images.gitee.com/uploads/images/2021/1115/192747_534332a7_9006408.png "屏幕截图.png") #### 算法评估(accuracy) 45个测试数据,k=1有2个错误预测,k=2有3个错误预测,k=3有2个错误预测,k=4有2个错误预测,k=5有1个错误预测,k=10有1个错误预测。 k=1:43/45=95.6% k=2:42/45=93.3% k=3:43/45=95.6% k=4:43/45=95.6% k=5:44/45=97.8% k=10:44/45=97.8% #### 使用说明 修改了书上的代码错误,做了小的一些修正。