# AI_CV_Homework4

**Repository Path**: chrisshane/AI_CV_Homework4

## Basic Information

- **Project Name**: AI_CV_Homework4
- **Description**: AI_CV训练营第四次作业 yolo3
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-01-23
- **Last Updated**: 2021-01-23

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# AI_CV_Homework4

1. 什么是目标检测（10分） D

A 分类的高级应用 
B 回归预测 
C 物体分割 
D 检测物体位置并且分类 

2. YoloV3的优点是什么？（多选）（10分） ABCD

A.速度快 
B.端到端 
C结构简单 
D正确率高 

3. YoloV2也使用了anchor计算？（10分） A

A 是 
B 否 

4. kmean算法是在YoloV3哪个阶段使用的？（10分） A

A 生成anchor 
B 生成label 
C 输入数据 
D 创建模型 

5. yoloV3的grid是什么意思？（多选）（10分） BD

A 是anchor的另一个称呼 
B 网络的网格，最终的预测就是按照网格为单位进行预测和学习 
C 是对输入数据尺寸的resize 
D 是最终网络输出的尺寸大小 

6. 请简单简述YoloV3的多尺度输出的优点。（20分） 

在基础网络部分常常会生成比原图小数十倍的特征图，导致小物体的特征描述不容易被检测网络捕捉。

通过输入更大、更多尺寸的图片进行训练，能够在一定程度上提高检测模型对物体大小的鲁棒性，仅在测试阶段引入多尺度，也可享受大尺寸和多尺寸带来的增益，是提升精度最明显的技巧之一。

7.展示最终在云端训练的输出信息的截图和预测的图片截图。（30分）. 

见上传的文件。
文件效果是使用原始的参数，lr=1e-3,epochs=50, batch_size=6 ,不使用Kmeans生成anchors，训练后测试的效果
(anchors: 10,13,  16,30,  33,23,  30,61,  62,45,  59,119,  116,90,  156,198,  373,326)
train loss：27.0738    val loss:27.1188
可以识别目标个数，但方框的大小不是很理想。

此外还尝试了以下组合，但均无法识别出object
(1)lr=5e-5,epochs=35, batch_size=6 ,使用Kmeans生成anchors
train loss：36.8910    val loss:38.4143
(2)lr=5e-5,epochs=35, batch_size=6 ,不使用Kmeans生成anchors
train loss：35.8498    val loss:36.4196
(3)lr=5e-4,epochs=35, batch_size=6 ,不使用Kmeans生成anchors

备注：
kmeans 计算出的anchor：
K anchors:
 [[ 21  47]
 [ 39  91]
 [ 44  31]
 [ 75  60]
 [ 83 127]
 [124 225]
 [198 127]
 [228 281]
 [392 292]]