# yolo12手势识别 **Repository Path**: kunnge/yolo12-gesture-recognition ## Basic Information - **Project Name**: yolo12手势识别 - **Description**: 使用yolo12n模型识别图片+mediapipe识别手的21个关键点+xgboost分类器 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-10-01 - **Last Updated**: 2025-10-01 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 使用 数据标识软件下载链接: https://pan.baidu.com/s/1cBjvgk_jopc-xnYbkitfdA?pwd=kunj 提取码: kunj 别人训练好的手势模型YOLOv10x_gestures.pt下载链接: https://pan.baidu.com/s/1z7Vd6uyuBotq2T76twVwww?pwd=kunj 提取码: kunj 直接运行utils.py即可 启动有两种: - camera_use_model()使用别人训练好的模型进行识别 - camera_my_model()自己训练的模型进行识别 # 目录结构 ``` handGestureRecognition/ ├── classifier.py ├── classifierResult/ ├── classifierSet/ │ ├── dislike/ │ ├── grip/ │ ├── like/ │ ├── middle_finger/ │ └── ok/ ├── data.yaml ├── handDataSet.py ├── music/ ├── runs/ ├── task.py ├── train.py ├── trainSet/ ├── utils.py └── yolo12n.pt ├── YOLOv10x_gestures.pt ``` # 文件和文件夹说明 ## `classifier.py` 此 Python 脚本包含手势分类器的代码。 ## `classifierResult/` 此目录存储分类器训练的结果,特别是训练好的模型。 - `hand_gesture_xgb_model_complex_15.pkl`: 一个用于手势识别的训练好的 XGBoost 模型。`.pkl` 扩展名表示它是一个 Python pickle 文件,用于序列化 Python 对象。 - `hand_gesture_xgb_model_complex_16.pkl`: 另一个训练好的 XGBoost 模型,可能是不同版本或使用不同参数训练的。 - 你可以根据自己的需要训练自己的模型 ## `classifierSet/` 此目录是用于训练和评估手势分类器的数据集。它包含不同手势类别的子目录,每个子目录都包含图像文件。 - `dislike/`: 包含“不喜欢”手势的图像。 - `grip/`: 包含“抓握”手势的图像。 - `like/`: 包含“喜欢”手势的图像。 - `middle_finger/`: 包含“中指”手势的图像。 - `ok/`: 包含“OK”手势的图像。 ## `data.yaml` 此 YAML 文件可能包含数据集的配置,例如训练和验证图像的路径,以及手势的类别名称列表。这在基于 YOLO 的项目中很常见。 ## `handDataSet.py` 此 Python 脚本使用hagRIDv2_512数据集类,用于处理手势图像。它将负责加载图像、应用转换并为机器学习模型准备它们。 ## `music/` 此目录包含各种 MP3 音频文件,每个文件都以特定的手势或动作命名。这些文件用于音频反馈或作为响应手势的交互式应用程序的一部分。 ## `runs/` 此目录通常由机器学习框架(如 YOLO)使用,用于存储实验运行,包括训练日志、保存的模型和检测结果。 - `detect/`: 包含与对象检测任务相关的结果。 - `train/`: 检测模型的训练日志和工件。 ## `task.py` 用于训练xgboost模型 ## `train.py` 训练用于手势识别的机器学习模型(例如 YOLO 模型)的主要入口点。它将处理数据集的加载、模型的定义、训练循环的设置以及训练模型的保存。 ## `trainSet/` 此目录包含专门为训练和验证准备的结构化数据集。 - `images/`: 包含用于训练和验证的图像文件。 - `train/`: 训练图像。 - `val/`: 验证图像。 - `labels/`: 包含与图像对应的标签文件(例如,YOLO 格式)。 - `train/`: 训练标签。 - `val/`: 验证标签。 - `train.cache`: 训练标签的缓存文件,加快数据加载速度。 - `val.cache`: 验证标签的缓存文件。 ## `utils.py` 实现了使用模型进行特定手势识别并进行播放音乐 ## `YOLOv10x_gestures.pt` 别人训练好的手势识别模型 ## `yolo12n.pt` 图像识别的基础模型,使用该模型的基础上训练手势识别模型