# 机器学习原理及应用 **Repository Path**: StarRail-Evernight/machine-learning ## Basic Information - **Project Name**: 机器学习原理及应用 - **Description**: 机械工业出版社-吕云翔等《机器学习原理及应用》的一些代码。 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2024-10-30 - **Last Updated**: 2025-12-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: 机器学习 ## README # 《机器学习原理及应用》代码仓库 本仓库包含机械工业出版社-吕云翔等《机器学习原理及应用》教材的配套代码实现。代码涵盖了机器学习的各个主要算法和应用场景,旨在帮助读者更好地理解和实践机器学习的核心概念。 ## 仓库结构 代码按照教材章节组织,每个章节对应一个文件夹,包含该章节的核心算法实现和示例代码。此外,还包含了实验案例和期末参考代码,以便读者进行实践和复习。 ``` machine-learning/ ├── 第1章 机器学习概述/ # 机器学习基础概念和数据集加载 ├── 第2章 线性回归及最大熵模型/ # 线性回归、逻辑回归等算法实现 ├── 第3章 k-近邻算法/ # KNN算法的实现和应用 ├── 第4章 决策树模型/ # 决策树算法的实现和可视化 ├── 第5章 朴素贝叶斯分类器/ # 朴素贝叶斯算法的实现 ├── 第6章 支持向量机/ # SVM算法的实现和应用 ├── 第7章 集成学习/ # 集成学习方法如GBDT的实现 ├── 第8章 EM算法及其应用/ # EM算法和高斯混合模型的实现 ├── 第9章 降维算法/ # PCA、SVD等降维算法的实现 ├── 第10章 聚类算法/ # K均值等聚类算法的实现 ├── 实验/ # 综合实验案例 │ ├── data/ # 实验数据集 │ └── 案例1~7 # 各种应用场景的综合案例 └── 期末参考(上机)/ # 期末复习参考代码 ``` ## 主要内容 ### 第1章 机器学习概述 - 加载和查看经典数据集(如鸢尾花数据集) - 了解数据集的基本结构和属性 ### 第2章 线性回归及最大熵模型 - 线性回归模型的构造与训练 - 逻辑回归模型的实现 - 模型评估指标(准确率、召回率、精确率等) - 波士顿房价预测实例 ### 第3章 k-近邻算法 - KNN模型的构造与训练 - 距离度量和K值选择 - 鸢尾花分类实例 ### 第4章 决策树模型 - 决策树的构造与训练 - 决策树的可视化 - 葡萄酒数据集分类实例 ### 第5章 朴素贝叶斯分类器 - 朴素贝叶斯算法的实现 - 垃圾短信分类实例 ### 第6章 支持向量机 - SVM分类算法的实现 - SVR回归算法的实现 - 葡萄酒分类和波士顿房价预测实例 ### 第7章 集成学习 - GBDT模型的实现 - 模型参数调优 - 房价预测实例 ### 第8章 EM算法及其应用 - 高斯混合模型的实现 - 鸢尾花分类实例 ### 第9章 降维算法 - PCA降维算法的实现 - SVD图像压缩实例 - 降维后的数据分类 ### 第10章 聚类算法 - K均值聚类算法的实现 - 鸢尾花聚类实例 ### 实验案例 - 基于回归问题、XGBoost的房价预测 - 影评数据分析与电影推荐 - 汽车贷款违约的数据分析 - 构建KNN模型及其可视化 - 用户流失预警 ## 环境配置 本仓库的代码主要使用Python语言,并依赖以下主要库: - scikit-learn - pandas - numpy - matplotlib - xgboost - graphviz ## 使用方法 1. 克隆本仓库到本地 2. 安装所需的Python库 3. 按照章节顺序或根据自己的需求运行相应的代码文件 4. 实验案例可以作为综合练习,帮助巩固所学知识 ## 注意事项 - 代码中的数据集路径请根据实际情况进行调整 - 部分可视化功能可能需要安装额外的软件(如graphviz) - 运行代码时如有疑问,请参考教材中的相关章节 ## 免责声明 本仓库中的代码仅作为学习参考,请勿用于商业用途。如有任何问题或建议,请联系仓库维护者。