YOLOv3-推理指导

YOLOv3-推理指导
概述
推理环境准备
快速上手
模型推理性能&精度

概述

YOLOv3是一种端到端的one-stage目标检测模型。相比YOLOv2，YOLOv3采用了一个新的backbone-Darknet-53来进行特征提取工作，这个新网络比Darknet-19更加强大，也比ResNet-101或者ResNet-152更加高效。同时，对于一张输入图片，YOLOv3可以在3个不同尺度预测物体框，每个尺度预测三种大小的边界框，通过多尺度联合预测的方式有效提升了小目标的检测精度。

版本说明（目前已适配以下版本）：

url=https://github.com/ultralytics/yolov3/tree/v9.6.0
tag=v9.1/v9.6.0
model_name=yolov3

推理环境准备

该模型需要以下插件与驱动
表 1 版本配套表

配套	版本	环境准备指导
固件与驱动	22.0.4	Pytorch框架推理环境准备
CANN	6.0.0	推理应用开发学习文档
Python	3.7.5	-
PyTorch	1.10.1	-
说明：Atlas 300I Duo 推理卡请以CANN版本选择实际固件与驱动版本。	\	\

快速上手

获取源码

获取Pytorch源码

git clone https://github.com/ultralytics/yolov3.git
cd yolov3
git checkout v9.1/v9.6.0  # 切换到所用版本

获取OM推理代码
将推理部署代码放到yolov3源码相应目录下。

 Yolov3_for_Pytorch
 └── common             放到yolov3下
   ├── util               模型/数据接口
   └── patch              v9.1/v9.6.0 模型修改
 ├── model.yaml         放到yolov3下 
 ├── pth2onnx.sh        放到yolov3下
 ├── onnx2om.sh         放到yolov3下
 ├── om_val.py          放到yolov3下
 └── requirements.txt   放到yolov3下

安装依赖
```
pip3 install -r requirements.txt
```

准备数据集

该模型使用 coco2017 val数据集进行精度评估，在yolov3源码根目录下新建coco文件夹，数据集放到coco里，文件结构如下：

coco
├── val2017
   ├── 00000000139.jpg
   ├── 00000000285.jpg
   ……
   └── 00000581781.jpg
├── instances_val2017.json
└── val2017.txt

val2017.txt中保存.jpg的相对路径，请自行生成该txt文件，文件内容实例如下：

./val2017/00000000139.jpg
./val2017/00000000285.jpg
……
./val2017/00000581781.jpg

模型推理

模型推理提供两种方式，区别如下：

nms后处理脚本（nms_script）
直接用官网export.py导出onnx模型，模型结构和官网一致，推理流程也和官方一致，NMS后处理采用脚本实现。
nms后处理算子（nms_op）
为提升模型端到端推理性能，我们对上一步导出的onnx模型做了修改，增加后处理算子，将NMS后处理的计算集成到模型中。后处理算子存在阈值约束，要求conf>0.1。

1 模型转换

将模型权重文件.pth转换为.onnx文件，再使用ATC工具将.onnx文件转为离线推理模型.om文件。

获取权重文件
在链接中找到所需版本下载，也可以使用下述命令下载。
```
wget https://github.com/ultralytics/yolov3/releases/download/v${tag}/${model}.pt
```
- 命令参数说明：
  - ${tag}：模型版本，可选[9.1/9.6.0]
  - ${model}：模型大小，可选yolov3
导出ONNX模型
运行bash pth2onnx.sh导出动态shape的ONNX模型，模型参数在model.yaml中设置。
```
bash pth2onnx.sh --tag 9.6.0 --model yolov3 --nms_mode nms_script  # nms_script
bash pth2onnx.sh --tag 9.6.0 --model yolov3 --nms_mode nms_op  # nms_op
```
- 命令参数说明：
  - --tag：模型版本，可选[[9.1/9.6.0], 默认9.6.0。
  - --model：模型大小，可选yolov3, 默认yolov3。
  - --nms_mode：模型推理方式，可选[nms_op/nms_script], 默认nms_op。nms_op方式下，pth导出onnx模型过程中会增加NMS后处理算子，后处理算子的参数class_num、conf_thres和iou_thres在model.yaml中设置。

使用ATC工具将ONNX模型转OM模型
3.1 配置环境变量

source /usr/local/Ascend/ascend-toolkit/set_env.sh

说明：
该脚本中环境变量仅供参考，请以实际安装环境配置环境变量。详细介绍请参见《CANN 开发辅助工具指南 (推理)》。

3.2 执行命令查看芯片名称（${soc_version}）

npu-smi info
# 该设备芯片名为Ascend310P3 （自行替换）
回显如下：
+-------------------+-----------------+------------------------------------------------------+
| NPU     Name      | Health          | Power(W)     Temp(C)           Hugepages-Usage(page) |
| Chip    Device    | Bus-Id          | AICore(%)    Memory-Usage(MB)                        |
+===================+=================+======================================================+
| 0       310P3     | OK              | 15.8         42                0    / 0              |
| 0       0         | 0000:82:00.0    | 0            1074 / 21534                            |
+===================+=================+======================================================+
| 1       310P3     | OK              | 15.4         43                0    / 0              |
| 0       1         | 0000:89:00.0    | 0            1070 / 21534                            |
+===================+=================+======================================================+

3.3 导出非量化OM模型
运行onnx2om.sh导出OM模型。

bash onnx2om.sh --tag 9.6.0 --model yolov3 --nms_mode nms_script --bs 4 --soc Ascend310P3  # nms_script
bash onnx2om.sh --tag 9.6.0 --model yolov3_nms --nms_mode nms_op --bs 4 --soc Ascend310P3  # nms_op

atc命令参数说明（参数见onnx2om.sh）：
- --model：ONNX模型文件
- --output：输出的OM模型
- --framework：5代表ONNX模型
- --input_format：输入数据的格式
- --input_shape：输入数据的shape
- --soc_version：处理器型号
- --log：日志级别
- --compression_optimize_conf：模型量化配置，使用说明参考该链接

2 开始推理验证

安装ais-infer推理工具
ais-infer工具获取及使用方式请点击查看 [ais_infer 推理工具使用文档]
执行推理 & 精度验证
运行om_val.py推理OM模型，模型参数在model.yaml中设置，结果默认保存在predictions.json。
```
python3 om_val.py --tag 9.6.0 --model=yolov3_bs4.om --nms_mode nms_script --batch_size=4  # nms_script
python3 om_val.py --tag 9.6.0 --model=yolov3_nms_bs4.om --nms_mode nms_op --batch_size=4  # nms_op
```
- 命令参数说明：
  - --tag：模型版本，可选[9.1/9.6.0], 默认9.6.0。
  - --model：模型大小，可选yolov3, 默认yolov3。
  - --nms_mode：模型推理方式，可选[nms_op/nms_script], 默认nms_op。
  - --batch_size: 模型推理batch大小，默认4。
  - --cfg_file：模型推理参数设置，默认读取文件model.yaml。

性能验证
可使用ais_infer推理工具的纯推理模式验证不同batch_size的OM模型的性能，参考命令如下：

python3 -m ais_bench --model=yolov3_bs4.om --loop=1000 --batchsize=4  # nms_script
python3 -m ais_bench --model=yolov3_nms_bs4.om --loop=1000 --batchsize=4  # nms_op

模型推理性能&精度

调用ACL接口推理计算，性能&精度参考下列数据。

方式一 nms后处理脚本（nms_script）

模型tag	芯片型号	最优Batch	数据集	阈值	精度 (mAP@0.5)	OM模型性能 (fps)
9.1	300I PRO	4	coco val2017	conf=0.001 iou=0.6	63.3	219.893
9.6.0	300I PRO	4	coco val2017	conf=0.001 iou=0.6	65.9	165.652

方式二 nms后处理算子（nms_op)

模型tag	芯片型号	最优Batch	数据集	阈值	精度 (mAP@0.5)	OM模型性能 (fps)
9.1	300I PRO	4	coco val2017	conf=0.4 iou=0.5	44.6	205.382
9.6.0	300I PRO	4	coco val2017	conf=0.4 iou=0.5	54.4	162.236

Ascend/modelzoo-GPL

YOLOv3-推理指导

概述

推理环境准备

快速上手

获取源码

准备数据集

模型推理

1 模型转换

2 开始推理验证

模型推理性能&精度

简介

发行版

贡献者

语言

近期动态

Ascend/modelzoo-GPL .gitee-modal { width: 500px !important; }

YOLOv3-推理指导

概述

推理环境准备

快速上手

获取源码

准备数据集

模型推理

1 模型转换

2 开始推理验证

模型推理性能&精度

简介

发行版

贡献者

语言

近期动态

搜索帮助

Ascend/modelzoo-GPL