# AI_CV_Homework4 **Repository Path**: chrisshane/AI_CV_Homework4 ## Basic Information - **Project Name**: AI_CV_Homework4 - **Description**: AI_CV训练营第四次作业 yolo3 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-01-23 - **Last Updated**: 2021-01-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # AI_CV_Homework4 1. 什么是目标检测(10分) D A 分类的高级应用 B 回归预测 C 物体分割 D 检测物体位置并且分类 2. YoloV3的优点是什么?(多选)(10分) ABCD A.速度快 B.端到端 C结构简单 D正确率高 3. YoloV2也使用了anchor计算?(10分) A A 是 B 否 4. kmean算法是在YoloV3哪个阶段使用的?(10分) A A 生成anchor B 生成label C 输入数据 D 创建模型 5. yoloV3的grid是什么意思?(多选)(10分) BD A 是anchor的另一个称呼 B 网络的网格,最终的预测就是按照网格为单位进行预测和学习 C 是对输入数据尺寸的resize D 是最终网络输出的尺寸大小 6. 请简单简述YoloV3的多尺度输出的优点。(20分) 在基础网络部分常常会生成比原图小数十倍的特征图,导致小物体的特征描述不容易被检测网络捕捉。 通过输入更大、更多尺寸的图片进行训练,能够在一定程度上提高检测模型对物体大小的鲁棒性,仅在测试阶段引入多尺度,也可享受大尺寸和多尺寸带来的增益,是提升精度最明显的技巧之一。 7.展示最终在云端训练的输出信息的截图和预测的图片截图。(30分). 见上传的文件。 文件效果是使用原始的参数,lr=1e-3,epochs=50, batch_size=6 ,不使用Kmeans生成anchors,训练后测试的效果 (anchors: 10,13, 16,30, 33,23, 30,61, 62,45, 59,119, 116,90, 156,198, 373,326) train loss:27.0738 val loss:27.1188 可以识别目标个数,但方框的大小不是很理想。 此外还尝试了以下组合,但均无法识别出object (1)lr=5e-5,epochs=35, batch_size=6 ,使用Kmeans生成anchors train loss:36.8910 val loss:38.4143 (2)lr=5e-5,epochs=35, batch_size=6 ,不使用Kmeans生成anchors train loss:35.8498 val loss:36.4196 (3)lr=5e-4,epochs=35, batch_size=6 ,不使用Kmeans生成anchors 备注: kmeans 计算出的anchor: K anchors: [[ 21 47] [ 39 91] [ 44 31] [ 75 60] [ 83 127] [124 225] [198 127] [228 281] [392 292]]