# AI_CV_Homework9

**Repository Path**: chrisshane/ai_-cv_-homework9

## Basic Information

- **Project Name**: AI_CV_Homework9
- **Description**: AI_CV训练营第九次作业 MTCNN
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-04-18
- **Last Updated**: 2021-04-18

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# AI_CV_Homework9

问题描述
一：选择题
1.本次人脸识别项目总共有几个模块：（10分）C

A.一个
B.两个
C.三个
D.四个

2.MTCNN由什么组成（10分）D

A.P-Net
B.O-Net
C.R-Net
D.P-Net,R-Net,O-Net

3.MTCNN模型中使用了哪种方法：（10分）A

A.图像金字塔原理
B.几何变换
C.增加噪声
D.马赛克数据增强

4.Bounding-Box regression的作用是什么？（10分）B

A.预测图像
B.边框回归
C.提高系统的运算速度
D.进行筛选图像

二：简答题
1.请阐述人脸检测和人脸识别的定义和区别？（20分）

定义：
人脸检测是指对于任意一幅给定的图像/视频帧，采用一定的策略对其进行搜索以确定其中是否含有人脸，如果是则返回人脸的位置、大小和姿态。
是能够识别数字图像中人脸的存在的计算机技术。
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。说简单点，人脸识别解决“这是谁的脸”问题。

区别：

人脸检测是人脸识别的关键环节。先进行人脸检测，获得人脸图像信息，然后再进行人脸识别，确定身份信息。
人脸识别系统都使用人脸检测，但并不是所有的人脸检测系统都有人脸识别组件。

2.请具体解释一下NMS和Bounding-Box regression？（20分）

NMS(Non-maximum suppression)，即非极大值抑制，在目标检测中使用率很高。
在目标检测中，不论是最初的region proposal，还是后来的anchor box，不可避免的一个问题就是对于同一个物体，会预测出多个bounding box。而NMS所做的就是去除掉多余的bounding box，只保留和ground truth重叠度最高的bounding box。
该算法的主要思想是：将所有框的得分排序，选中最高分及其对应的框；遍历其余的框，如果和当前最高分框的重叠面积(IOU)大于一定阈值，我们就将框删除；从未处理的框中继续选一个得分最高的，重复上述过程。

bounding box regression（边框回归）回归的目标是使得预测的物体窗口向groundtruth窗口相接近。并不是直接学习坐标，而是学习变形比例：包括两个部分，一个是对边框(x, y)进行移动，一个是对边框大小(w, h)进行缩放。


3.什么是困难样本挖掘，在MTCNN中如何体现的？（20分）

hard example mining(困难样本挖掘) 对每次检测到loss较大的前几个样本进行计算loss,重新训练。
核心思想：用分类器对样本进行分类，把其中错误分类的样本(hard negative)放入负样本集合再继续训练分类器。

MTCNN中，在P-NET与R-NET间,R-NET与O-NET间都进行了困难样本挖掘，对每次检测到loss较大的70%样本重新训练。