# project_deep_xiao **Repository Path**: windclub/project_deep_xiao ## Basic Information - **Project Name**: project_deep_xiao - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-08-07 - **Last Updated**: 2025-08-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 材料性能预测系统 ## 项目概述 本项目旨在使用神经网络模型预测材料的太阳反射率和红外发射率,基于材料的添加条件(高分子基体、无机添加剂、其余材料和加工方法)。项目包括数据处理、模型训练、遗传算法优化和SHAP分析四个主要部分。 ## 系统架构 ``` +----------------+ | 原始数据集 | +-------+--------+ | v +------------------+ +-------+--------+ | 数据可视化与分析 |<-| 数据处理 | +------------------+ +-------+--------+ | v +-------+--------+ | 模型训练 | +-------+--------+ | +-------v--------+ | 模型评估 | +-------+--------+ / \ / \ +-----------+ +------------+ | | v v +--------+-------+ +---------+------+ | 遗传算法优化 | | SHAP分析 | +--------+-------+ +---------+------+ | | v v +--------+-------+ +---------+------+ | 最佳参数组合 | | 特征重要性分析 | +----------------+ +----------------+ ``` ## 功能模块 1. **数据处理模块**:加载原始数据集,清洗数据,对分类特征进行独热编码,将数据集分为训练集和测试集,可视化数据分布和特征关系。 2. **模型训练模块**:实现了三种神经网络架构(MLP、残差网络和集成模型),使用自定义损失函数(MSE + 相关性损失)训练模型,实现了早停和学习率调度策略,比较不同模型的性能并选择最佳模型。 3. **遗传算法优化模块**:使用NSGA-III多目标遗传算法寻找最佳参数组合,以优化太阳反射率和红外发射率,分析最佳解和参数分布,可视化优化过程和结果。 4. **SHAP分析模块**:使用SHAP(SHapley Additive exPlanations)方法解释模型预测结果,帮助理解不同特征对预测太阳反射率和红外发射率的影响,可视化特征重要性和依赖关系,分析特征交互,分析特定样本(最佳预测和最差预测)。 ## 安装说明 ### 环境要求 - Python 3.8+ - PyTorch 2.4.1+ - CUDA(用于GPU加速,可选) ### 依赖库 ```bash pip install -r requirements.txt ``` `requirements.txt` 文件内容如下: ``` pandas==2.0.0 numpy==1.24.0 matplotlib==3.7.0 seaborn==0.12.0 scikit-learn==1.2.0 torch==2.4.1 openpyxl==3.1.0 pymoo==0.6.0 shap==0.41.0 ``` ## 使用方法 ### 运行完整流程 ```bash python main.py ``` 这将依次执行数据处理、模型训练、遗传算法优化和SHAP分析,并生成总结报告。 ### 运行特定步骤 ```bash # 跳过数据处理步骤 python main.py --skip-data-processing # 跳过模型训练步骤 python main.py --skip-model-training # 跳过遗传算法优化步骤 python main.py --skip-genetic-algorithm # 跳过SHAP分析步骤 python main.py --skip-shap-analysis # 只生成总结报告 python main.py --only-report ``` ### 单独运行各模块 ```bash # 数据处理 python data_processing.py # 模型训练 python train.py # 遗传算法优化 python genetic_algorithm.py # SHAP分析 python shap_analysis.py ``` ## 输出目录 - `output/`:数据处理结果 - `models/`:模型文件 - `figures/`:可视化结果 - `ga_results/`:遗传算法结果 - `shap_results/`:SHAP分析结果 - `summary_report.md`:总结报告 ## 文件说明 - `data_processing.py`:数据处理脚本 - `model.py`:神经网络模型定义 - `train.py`:模型训练脚本 - `genetic_algorithm.py`:遗传算法优化脚本 - `shap_analysis.py`:SHAP分析脚本 - `main.py`:主脚本,整合所有功能 - `README.md`:项目说明文档 - `requirements.txt`:依赖库列表 ## 注意事项 1. 确保原始数据集 `数据集0727.xlsx` 位于项目根目录。 2. 遗传算法优化和SHAP分析可能需要较长时间,请耐心等待。 3. 如果使用GPU加速,请确保已正确安装CUDA和PyTorch的GPU版本。 ## 结果解读 1. **模型评估结果**:查看 `output/best_model_info.json` 了解最佳模型的性能指标。 2. **遗传算法优化结果**:查看 `ga_results/final_results.csv` 了解最佳参数组合。 3. **SHAP分析结果**:查看 `shap_results/shap_analysis_report.md` 了解特征重要性分析。 4. **总结报告**:查看 `summary_report.md` 了解整个系统的总结和建议。