models: Models of MindSpore

Retinanet 描述
模型架构
数据集
环境要求
脚本说明
- 脚本和示例代码
- 脚本参数
- 训练过程
  - 用法
  - 运行
  - 结果
- 评估过程
  - 用法
  - 运行
  - 结果
- 模型导出
  - 用法
  - 运行
- 推理过程
  - 用法
  - 运行
  - 结果
- 模型说明
随机情况的描述
ModelZoo 主页
迁移学习

Retinanet 描述

RetinaNet算法源自2018年Facebook AI Research的论文 Focal Loss for Dense Object Detection。该论文最大的贡献在于提出了Focal Loss用于解决类别不均衡问题，从而创造了RetinaNet（One Stage目标检测算法）这个精度超越经典Two Stage的Faster-RCNN的目标检测网络。

论文 Lin T Y , Goyal P , Girshick R , et al. Focal Loss for Dense Object Detection[C]// 2017 IEEE International Conference on Computer Vision (ICCV). IEEE, 2017:2999-3007.

数据集

数据集可参考文献：

COCO2017(https://cocodataset.org/)

数据集大小：19.3G, 123287张80类彩色图像
- 训练：19.3G, 118287张图片
- 测试：1814.3M, 5000张图片
数据格式：RGB图像.
- 注意：数据将在src/dataset.py 中被处理

face-mask-detection (https://www.kaggle.com/datasets/andrewmvd/face-mask-detection) (迁移学习使用)

数据集大小：397.65MB, 853张3类彩色图像
数据格式：RGB图像.
- 注意：数据将在src/dataset.py 中被处理

环境要求

硬件（Ascend，GPU）
- 使用Ascend处理器准备硬件环境。
架构
- MindSpore
想要获取更多信息，请检查以下资源：
- MindSpore 教程
- MindSpore Python API

在推理之前需要在昇腾910环境上完成模型的导出。推理时要将iscrowd为true的图片排除掉。在cpp_infer目录下保存了去排除后的图片id。还需要修改config.py文件中的coco_root、val_data_type、instances_set配置项，值分别取coco数据集的目录，推理所用数据集的目录名称，推理完成后计算精度用的annotation文件，instances_set是用val_data_type拼接起来的，要保证文件正确并且存在。

bash run_infer_cpp.sh [MINDIR_PATH] [DATA_PATH] [DEVICE_TYPE] [DEVICE_ID]

运行

 bash run_infer_cpp.sh ./retinanet.mindir ./dataset/coco2017/val2017 Ascend 0

结果

推理的结果保存在当前目录下，在acc.log日志文件中可以找到类似以下的结果。

 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.350
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.509
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.385
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.139
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.368
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.509
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.303
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.413
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.415
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.155
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.435
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.608

========================================

mAP: 0.3499478734634595

模型说明

性能

训练性能

参数	Ascend	GPU
模型名称	Retinanet	Retinanet
运行环境	Ascend 910；CPU 2.6GHz，192cores；Memory 755G；系统 Euler2.8	Rtx3090;Memory 512G
上传时间	10/01/2021	17/02/2022
MindSpore 版本	1.2.0	1.5.0
数据集	123287 张图片	123287 张图片
Batch_size	32	32
训练参数	src/config.py	config/default_config_gpu.yaml
优化器	Momentum	Momentum
损失函数	Focal loss	Focal loss
最终损失	0.582	0.57
精确度 (8p)	mAP[0.3475]	mAP[0.3499]
训练总时间 (8p)	23h16m54s	51h39m6s
脚本	链接	链接

推理性能

参数	Ascend	GPU
模型名称	Retinanet	Retinanet
运行环境	Ascend 910；CPU 2.6GHz，192cores；Memory 755G；系统 Euler2.8	Rtx3090;Memory 512G
上传时间	10/01/2021	17/02/2022
MindSpore 版本	1.2.0	1.5.0
数据集	5k 张图片	5k 张图片
Batch_size	32	32
精确度	mAP[0.3475]	mAP[0.3499]
总时间	10 mins and 50 seconds	13 mins and 40 seconds

数据集处理

数据集下载地址

下载数据集后解压至retinanet根目录下，使用data_split脚本划分出80%的训练集和20%的测试集

运行脚本示例
python data_split.py

数据集结构
└─dataset
  ├─train
  ├─val
  ├─annotation

训练前，先创建MindRecord文件，以face_mask_detection数据集为例，yaml文件配置好facemask数据集路径和mindrecord存储路径
# your dataset dir
dataset_root: /home/mindspore/retinanet/dataset/
# mindrecord dataset dir
mindrecord_dir: /home/mindspore/retinanet/mindrecord

# 生成训练数据集
python create_data.py  --config_path
(例如：python create_data.py  --config_path  './config/finetune_config.yaml')

# 生成测试数据集
测试数据集可以在训练完成由eval脚本自动生成

迁移学习训练过程

需要先从Mindspore Hub下载预训练的ckpt

# 在finetune_config.yaml设置预训练模型的ckpt
pre_trained: "/home/mindspore/retinanet/retinanet_ascend_v170_coco2017_official_cv_acc35.ckpt"

#运行迁移学习训练脚本
python train.py --config_path  './config/finetune_config.yaml'
如果需要保存日志信息，可使用如下命令：
python train.py --config_path ./config/finetune_config.yaml > log.txt 2>&1

结果展示

训练结果将存储在示例路径中。checkpoint将存储在 ./ckpt 路径下，训练loss输出示例如下：

epoch: 1 step: 42, loss is 4.347288131713867
lr:[0.000088]
Train epoch time: 992053.072 ms, per step time: 23620.311 ms
Epoch time: 164034.415, per step time: 358.154
epoch: 3 step: 42, loss is 1.8387094736099243
lr:[0.000495]
Train epoch time: 738396.280 ms, per step time: 17580.864 ms
epoch: 4 step: 42, loss is 1.3805917501449585
lr:[0.000695]
Train epoch time: 742051.709 ms, per step time: 17667.898 ms

迁移学习推理过程

#运行迁移学习训练脚本
python eval.py --config_path  './config/finetune_config.yaml'

结果展示

 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.538
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.781
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.634
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.420
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.687
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.856
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.284
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.570
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.574
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.448
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.737
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.872

========================================

mAP: 0.5376701115352185

迁移学习quick_start

运行eval脚本后，会生成instances_val.json 和 predictions.json文件，需要修改quick_start.py脚本中instances_val.json 和 predictions.json文件的路径后再运行

# 运行quick_start脚本示例
python quick_start.py --config_path './config/finetune_config.yaml'

结果说明 图中颜色的含义分别是：

浅蓝：真实标签的mask_weared_incorrect
浅绿：真实标签的with_mask
浅红：真实标签的without_mask
蓝色：预测标签的mask_weared_incorrect
绿色：预测标签的with_mask
红色：预测标签的without_mask

MindSpore/models

Retinanet 描述

模型架构

数据集

环境要求

脚本说明

脚本和示例代码

脚本参数

训练过程

用法

运行

结果

评估过程

用法

结果

模型导出

用法

运行

推理过程

用法

运行

结果

模型说明

性能

训练性能

推理性能

随机情况的描述

ModelZoo 主页

迁移学习

迁移学习训练流程

数据集处理

迁移学习训练过程

迁移学习推理过程

迁移学习quick_start

简介

发行版

贡献者 (601)

语言

近期动态

MindSpore/models .gitee-modal { width: 500px !important; }

用法

运行

结果

用法

结果

用法

运行

用法

运行

结果

训练性能

推理性能

数据集处理

迁移学习训练过程

迁移学习推理过程

迁移学习quick_start

简介

发行版

开源评估指数源自 OSS-Compass 评估体系，评估体系围绕以下三个维度对项目展开评估：

贡献者 (601)

语言

近期动态

搜索帮助

MindSpore/models