# python qimo **Repository Path**: wangzhibo369/python-qimo ## Basic Information - **Project Name**: python qimo - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-06-09 - **Last Updated**: 2025-06-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Python数据分析项目 - 自闭症谱系障碍(ASD)识别 ## 项目简介 本项目是一个基于机器学习的自闭症谱系障碍(ASD)识别系统。通过分析眼动追踪数据(包括视线坐标和面部表情),使用随机森林算法对ASD和典型发育(TD)群体进行分类识别。 ## 项目特点 - 🎯 **目标明确**:基于眼动数据进行ASD自动识别 - 📊 **数据丰富**:包含大量ASD和TD群体的眼动追踪数据 - 🤖 **机器学习**:采用随机森林分类算法 - 📈 **可视化分析**:提供详细的数据可视化和模型评估 - 🔧 **完整流程**:从数据预处理到模型评估的完整机器学习流程 ## 项目结构 ``` ├── python.ipynb # 主要分析代码(Jupyter Notebook) ├── SimHei.ttf # 中文字体文件(用于图表显示) ├── README.md # 项目说明文档 ├── ASD/ # ASD群体数据文件夹 │ ├── BSDASD_*.csv # BSDASD系列数据(82个文件) │ ├── KNASD_*.csv # KNASD系列数据(34个文件) │ └── ZK_*.csv # ZK系列数据(10个文件) └── TD/ # 典型发育群体数据文件夹 ├── DCXX_*.csv # DCXX系列数据 └── YXYEY_*.csv # YXYEY系列数据(107个文件) ``` ## 数据说明 ### 数据集概况 - **ASD组**:126个样本文件 - **TD组**:约150个样本文件 - **数据类型**:CSV格式的眼动追踪数据 - **主要特征**: - `Gaze_X`, `Gaze_Y`:视线坐标 - `Expression`:面部表情分类 ### 特征工程 项目从原始数据中提取以下特征: 1. **视线统计特征**: - 视线X、Y坐标的均值和标准差 2. **表情频率特征**: - 各种面部表情出现的频率 3. **标签编码**: - ASD组:标签为1 - TD组:标签为0 ## 技术栈 ### 核心库 - **数据处理**:`pandas`, `numpy` - **机器学习**:`scikit-learn` - **数据可视化**:`matplotlib`, `seaborn` - **进度显示**:`tqdm` ### 机器学习模型 - **主要算法**:随机森林分类器(Random Forest Classifier) - **评估指标**: - 准确率(Accuracy) - 分类报告(Classification Report) - 混淆矩阵(Confusion Matrix) - ROC曲线和AUC值 ## 使用方法 ### 环境要求 ```bash pip install pandas numpy scikit-learn matplotlib seaborn tqdm ``` ### 运行步骤 1. 确保所有数据文件在正确的文件夹中(ASD/和TD/) 2. 确保SimHei.ttf字体文件在项目根目录 3. 打开并运行 `python.ipynb` 4. 按顺序执行所有代码单元 ### 主要功能模块 1. **数据导入和预处理** 2. **特征提取函数定义** 3. **自动文件发现和批量处理** 4. **机器学习模型训练** 5. **模型评估和可视化** ## 结果展示 项目提供以下分析结果: - 📊 数据分布可视化 - 🎯 模型性能评估 - 📈 特征重要性分析 - 🔍 混淆矩阵热力图 - 📉 ROC曲线分析 ## 核心代码特性 ### 自动化处理 - 自动发现和处理ASD、TD文件夹中的所有CSV文件 - 智能跳过损坏或数据不足的文件 - 进度条显示处理状态 ### 健壮性设计 - 异常处理机制,确保单个文件错误不影响整体处理 - 数据验证,过滤无效样本 - 缺失值处理 ### 中文支持 - 集成中文字体设置 - 图表完美显示中文标签和标题 ## 应用前景 本项目可应用于: - 🏥 **医疗辅助诊断**:协助医生进行ASD早期筛查 - 🔬 **科学研究**:为ASD相关研究提供数据分析工具 - 🎓 **教育培训**:作为机器学习和数据科学的教学案例 - 💡 **技术展示**:展示眼动数据在行为分析中的应用 ## 贡献指南 欢迎提交Issue和Pull Request来改进项目: 1. Fork本项目 2. 创建特性分支 3. 提交更改 4. 发起Pull Request ## 许可证 本项目仅供学习和研究使用。 ## 联系方式 如有问题或建议,欢迎通过Gitee Issues联系。 --- > 📝 **注意**:本项目基于眼动追踪数据进行ASD识别研究,仅供学术研究使用,不能替代专业医学诊断。