# YOLOv4_PyTorch

**Repository Path**: iyangming/yolov4_pytorch

## Basic Information

- **Project Name**: YOLOv4_PyTorch
- **Description**: PyTorch版本YOLO-v4
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 1
- **Forks**: 2
- **Created**: 2025-09-07
- **Last Updated**: 2025-09-07

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

## YOLOV4 - PyTorch的实现


## 实现的内容

- [x] 主干特征提取网络：DarkNet53 => CSPDarkNet53
- [x] 特征金字塔：SPP，PAN
- [x] 训练用到的小技巧：Mosaic数据增强、Label Smoothing平滑、CIOU、学习率余弦退火衰减
- [x] 激活函数：使用Mish激活函数

## 所需环境
torch>=1.2.0

## 小技巧的设置
在train.py文件下：   
1. mosaic参数可用于控制是否实现Mosaic数据增强。   
2. Cosine_scheduler可用于控制是否使用学习率余弦退火衰减。   
3. label_smoothing可用于控制是否Label Smoothing平滑。

## 文件下载
训练所需的yolo4_weights.pth可在百度网盘中下载或通过实验室服务器直接获取。  
```
链接: https://pan.baidu.com/s/1WlDNPtGO1pwQbqwKx1gRZA 提取码: p4sc  
```
* yolo4_weights.pth是coco数据集的权重。  
* yolo4_voc_weights.pth是voc数据集的权重。

VOC数据集下载地址如下：  
```
VOC2007+2012训练集    
链接: https://pan.baidu.com/s/16pemiBGd-P9q2j7dZKGDFA 提取码: eiw9    
```

```
VOC2007测试集   
链接: https://pan.baidu.com/s/1BnMiFwlNwIWG9gsd4jHLig 提取码: dsda   
```

以上所有文件均可通过服务器直接获取： `/home/a409/users/hujinsong/my_data/yolo_voc`

## 预测步骤
### a、使用预训练权重
1. 将预训练yolo4_weights.pth或者yolo4_voc_weights.pth放入model_data，运行predict.py，输入  
```python
img/street.jpg
```
2. 在predict.py里面进行设置可以进行fps测试和video视频检测。  

### b、使用自己训练的权重
1. 按照训练步骤训练。  
2. 在yolo.py文件里面，在如下部分修改model_path和classes_path使其对应训练好的文件；**model_path对应logs文件夹下面的权值文件，classes_path是model_path对应分的类**。  
```python
_defaults = {
    "model_path": 'model_data/yolo4_weights.pth',
    "anchors_path": 'model_data/yolo_anchors.txt',
    "classes_path": 'model_data/coco_classes.txt',
    "model_image_size" : (416, 416, 3),
    "confidence": 0.5,
    "cuda": True
}
```

3. 运行predict.py，输入  
```python
img/street.jpg
```

4. 在predict.py里面进行设置可以进行fps测试和video视频检测。  

## 训练步骤
1. 本文使用VOC格式进行训练。  
2. 训练前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。  
3. 训练前将图片文件放在VOCdevkit文件夹下的VOC2007文件夹下的JPEGImages中。  
4. 在训练前利用voc2yolo4.py文件生成对应的txt。  
5. 再运行根目录下的voc_annotation.py，运行前需要将classes改成你自己的classes。**注意不要使用中文标签，文件夹中不要有空格！**   
```python
classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse", "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]
```
6. 此时会生成对应的2007_train.txt，每一行对应其**图片位置**及其**真实框的位置**。  
7. **在训练前需要务必在model_data下新建一个txt文档，文档中输入需要分的类，在train.py中将classes_path指向该文件**，示例如下：   
```python
classes_path = 'model_data/new_classes.txt'    
```
model_data/new_classes.txt文件内容为：   
```python
cat
dog
...
```
8. 运行train.py即可开始训练。

## 评估步骤
1. 本文使用VOC格式进行评估。  
2. 评估前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。  
3. 评估前将图片文件放在VOCdevkit文件夹下的VOC2007文件夹下的JPEGImages中。  
4. 在评估前利用voc2yolo4.py文件生成对应的txt，评估用的txt为VOCdevkit/VOC2007/ImageSets/Main/test.txt，需要注意的是，如果整个VOC2007里面的数据集都是用于评估，那么直接将trainval_percent设置成0即可。  
5. 在yolo.py文件里面，在如下部分修改model_path和classes_path使其对应训练好的文件；**model_path对应logs文件夹下面的权值文件，classes_path是model_path对应分的类**。  
6. 运行get_dr_txt.py和get_gt_txt.py，在./input/detection-results和./input/ground-truth文件夹下生成对应的txt。  
7. 运行get_map.py即可开始计算模型的mAP。

## 视频教程
* [Pytorch 搭建自己的YoloV4目标检测平台](https://www.bilibili.com/video/BV1Q54y1D7vj?p=10)
* [目标检测当中的数据增强_mosaic](https://www.bilibili.com/video/BV1ZA411b7L8?from=search&seid=17439884125253939876)

## Reference

* https://github.com/qqwweee/keras-yolo3/  
* https://github.com/Cartucho/mAP  
* https://github.com/Ma-Dan/keras-yolo4  
* [YOLOv4 中的数据增强](https://blog.csdn.net/algorithmPro/article/details/107724342)