# Python机器学习简单应用 **Repository Path**: SEMHAQ/python-machine-learning ## Basic Information - **Project Name**: Python机器学习简单应用 - **Description**: 利用 sklearn 机器学习库进行分类与预测。该仓库提出了两种预测算法和两种分类算法,预测算法方面,利用了 线性回归及支持向量机(SVM);分类算法方面,利用了 K-Means聚类算法及朴素贝叶斯分类算法 。 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: https://gitee.com/SEMHAQ/python-machine-learning - **GVP Project**: No ## Statistics - **Stars**: 10 - **Forks**: 0 - **Created**: 2022-10-06 - **Last Updated**: 2023-11-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Python机器学习简单应用 #### 介绍 利用 **sklearn** 机器学习库进行分类与预测。该仓库提出了两种预测算法和两种分类算法,预测算法方面,利用了 **线性回归及支持向量机(SVM)**;分类算法方面,利用了 **K-Means聚类算法及朴素贝叶斯分类算法** 。 #### 项目架构 需要用到的module有: **sklearn、pandas、numpy、matplotlib、seaborn** 。 #### 使用说明 sklearn中文社区:https://scikit-learn.org.cn/ 波士顿房价:http://lib.stat.cmu.edu/datasets/boston 所使用的到的数据集: **1、波士顿房价数据集(预测);2、鸢尾花数据集(分类)。** #### 波士顿房价数据集介绍 | 指标 | 解释 | |---|---| | CRIM | 城镇人均犯罪率 | | ZN | 住宅用地超过25000 sq.ft.的比例 | | INDUS | 城镇非零售商用土地的比例 | | CHAS | 边界是河流为1,否则0 | | NOX | 一氧化氮浓度 | | RM | 住宅平均房间数 | | AGE | 1940年之前建成的自用房屋比例 | | DIS | 到波士顿5个中心区域的加权距离 | | RAD | 辐射性公路的靠近指数 | | TAX | 每10000美元的全值财产税率 | | PTRATIO | 城镇师生比例 | | B | 计算方法为 1000($B_k$−0.63)$^2$ ,其中$B_k$是按城镇划分的非裔美国人的比例 | | LSTAT | 人口中地位低下者的比例 | | MEDV | 自住房的平均房价,单位:千美元 | #### 鸢尾花数据集介绍 iris_training.csv训练数据集,120条样本数据;iris_test.csv测试数据集,30条数据。 | 指标 | 解释 | |---|---| | Sepal Length | 花萼长度 | | Sepal Width | 花萼宽度 | | Petal Length | 花瓣长度 | | Petal Width | 花瓣宽度 | | 0 | 山鸢尾(Setosa) | | 1 | 变色鸢尾(Versicolor)| |2 | 维吉尼亚鸢尾(Virginical) |