# YOLOv4_PyTorch **Repository Path**: iyangming/yolov4_pytorch ## Basic Information - **Project Name**: YOLOv4_PyTorch - **Description**: PyTorch版本YOLO-v4 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 2 - **Created**: 2025-09-07 - **Last Updated**: 2025-09-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## YOLOV4 - PyTorch的实现 ## 实现的内容 - [x] 主干特征提取网络:DarkNet53 => CSPDarkNet53 - [x] 特征金字塔:SPP,PAN - [x] 训练用到的小技巧:Mosaic数据增强、Label Smoothing平滑、CIOU、学习率余弦退火衰减 - [x] 激活函数:使用Mish激活函数 ## 所需环境 torch>=1.2.0 ## 小技巧的设置 在train.py文件下: 1. mosaic参数可用于控制是否实现Mosaic数据增强。 2. Cosine_scheduler可用于控制是否使用学习率余弦退火衰减。 3. label_smoothing可用于控制是否Label Smoothing平滑。 ## 文件下载 训练所需的yolo4_weights.pth可在百度网盘中下载或通过实验室服务器直接获取。 ``` 链接: https://pan.baidu.com/s/1WlDNPtGO1pwQbqwKx1gRZA 提取码: p4sc ``` * yolo4_weights.pth是coco数据集的权重。 * yolo4_voc_weights.pth是voc数据集的权重。 VOC数据集下载地址如下: ``` VOC2007+2012训练集 链接: https://pan.baidu.com/s/16pemiBGd-P9q2j7dZKGDFA 提取码: eiw9 ``` ``` VOC2007测试集 链接: https://pan.baidu.com/s/1BnMiFwlNwIWG9gsd4jHLig 提取码: dsda ``` 以上所有文件均可通过服务器直接获取: `/home/a409/users/hujinsong/my_data/yolo_voc` ## 预测步骤 ### a、使用预训练权重 1. 将预训练yolo4_weights.pth或者yolo4_voc_weights.pth放入model_data,运行predict.py,输入 ```python img/street.jpg ``` 2. 在predict.py里面进行设置可以进行fps测试和video视频检测。 ### b、使用自己训练的权重 1. 按照训练步骤训练。 2. 在yolo.py文件里面,在如下部分修改model_path和classes_path使其对应训练好的文件;**model_path对应logs文件夹下面的权值文件,classes_path是model_path对应分的类**。 ```python _defaults = { "model_path": 'model_data/yolo4_weights.pth', "anchors_path": 'model_data/yolo_anchors.txt', "classes_path": 'model_data/coco_classes.txt', "model_image_size" : (416, 416, 3), "confidence": 0.5, "cuda": True } ``` 3. 运行predict.py,输入 ```python img/street.jpg ``` 4. 在predict.py里面进行设置可以进行fps测试和video视频检测。 ## 训练步骤 1. 本文使用VOC格式进行训练。 2. 训练前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。 3. 训练前将图片文件放在VOCdevkit文件夹下的VOC2007文件夹下的JPEGImages中。 4. 在训练前利用voc2yolo4.py文件生成对应的txt。 5. 再运行根目录下的voc_annotation.py,运行前需要将classes改成你自己的classes。**注意不要使用中文标签,文件夹中不要有空格!** ```python classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"] ``` 6. 此时会生成对应的2007_train.txt,每一行对应其**图片位置**及其**真实框的位置**。 7. **在训练前需要务必在model_data下新建一个txt文档,文档中输入需要分的类,在train.py中将classes_path指向该文件**,示例如下: ```python classes_path = 'model_data/new_classes.txt' ``` model_data/new_classes.txt文件内容为: ```python cat dog ... ``` 8. 运行train.py即可开始训练。 ## 评估步骤 1. 本文使用VOC格式进行评估。 2. 评估前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。 3. 评估前将图片文件放在VOCdevkit文件夹下的VOC2007文件夹下的JPEGImages中。 4. 在评估前利用voc2yolo4.py文件生成对应的txt,评估用的txt为VOCdevkit/VOC2007/ImageSets/Main/test.txt,需要注意的是,如果整个VOC2007里面的数据集都是用于评估,那么直接将trainval_percent设置成0即可。 5. 在yolo.py文件里面,在如下部分修改model_path和classes_path使其对应训练好的文件;**model_path对应logs文件夹下面的权值文件,classes_path是model_path对应分的类**。 6. 运行get_dr_txt.py和get_gt_txt.py,在./input/detection-results和./input/ground-truth文件夹下生成对应的txt。 7. 运行get_map.py即可开始计算模型的mAP。 ## 视频教程 * [Pytorch 搭建自己的YoloV4目标检测平台](https://www.bilibili.com/video/BV1Q54y1D7vj?p=10) * [目标检测当中的数据增强_mosaic](https://www.bilibili.com/video/BV1ZA411b7L8?from=search&seid=17439884125253939876) ## Reference * https://github.com/qqwweee/keras-yolo3/ * https://github.com/Cartucho/mAP * https://github.com/Ma-Dan/keras-yolo4 * [YOLOv4 中的数据增强](https://blog.csdn.net/algorithmPro/article/details/107724342)