# FaceRecognition

**Repository Path**: HuaweiAtlas/FaceRecognition

## Basic Information

- **Project Name**: FaceRecognition
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: GPL-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 15
- **Forks**: 15
- **Created**: 2019-12-10
- **Last Updated**: 2025-02-13

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

[EN](README.en.md)|CN

## 人脸识别demo

本人脸识别demo运行于Atlas 300/500产品，接收纯视频流数据（**不支持含有音频的多媒体流**），对视频中的人脸进行检测并进行特征匹配，输出匹配信息并在前端显示，主要流程如下：

(1)Host侧接受RTSP视频流，发送到Device侧，通过硬件解码模块进行解码，同时将解码结果传送回host侧；
(2)通过目标检测模型进行人脸检测；
(3)对于检测到的人脸通过关键点检测模型提取关键点，并进行仿射变换矫正；
(4)使用模型提取人脸特征；
(5)使用一种人脸跟踪算法通过减少(3)和(4)的计算量来显著降低端到端计算量；
(6)输出视频流和人脸识别结果的结构化信息进行同步并显示。

[TOC]

### 支持的产品

Atlas 300 (Model 3000), Atlas 300 (Model 3010), Atlas 500

### 支持的版本

 1.31.T15.B150 或 1.3.5.B896 或 1.32.T7.B070 

可通过执行以下命令获取

```
npu-smi info
```

请在编译和运行前确保认**Atlas驱动软件版本与编译使用的DDK版本号一致**，否则可能导致编译的程序无法正常运行。

### 操作系统

Atlas 300: Ubuntu 16.04 或 CentOS 7.4
Atlas 500: EulerOS 2.0

### 目录结构

```
├── build
│   ├── build_local_atlas300.sh
│   ├── build_local_atlas500.sh
│   └── cmake
├── depository
│   ├── config
│   ├── featurelib
│   └── models
├── src
│   ├── common
│   ├── device
│   └── host
```

所有源文件位于src目录中；在depository中包含所有依赖项目；build目录包含编译脚本。

### 运行方法

#### 1.建立标准人脸库

在depository目录下新建featurelib文件夹，并在depository/featurelib目录下新建名为Featurelib.bin的人脸库。Featurelib.bin为二进制文件，内容为多个人脸特征（每个人脸512维，float32类型）的连续排列存放，如下所示：

```
特征向量1向量特征向量2特征向量3...特征向量n
```

用户可通过开源人脸特征提取模型提取人脸特征向量，并写入二进制文件；或使用python脚本随机生成特定字节长度（人脸个数x512x4）的二进制文件。

注：本人脸识别demo的人脸比对功能仅做调试使用。

#### 2.修改配置文件

本工程共有两个配置文件，位于depository/config下。其中graph.config为Matrix引擎使用的graph配置文件，setup.config 为demo输入视频流的配置文件。下两表分别总结了这两个配置文件的主要配置项及说明。

​                                                                       表1：graph.config配置说明

| 配置项                 | 所属engine                                               | 说明                                                         |
| ---------------------- | -------------------------------------------------------- | ------------------------------------------------------------ |
| rtsp_link              | StreamDataOutputEngine                                   | 设定输出内容接收地址，使用rtsp协议。格式为rtsp://aa.bbb.ccc.ddd/live.sdp，其中aa.bbb.ccc.ddd为接收rtsp视频流的ip地址 |
| feature_lib_path       | StreamDataOutputEngine                                   | 特征库二进制文件路径                                         |
| feature_len            | StreamDataOutputEngine                                   | 特征库中每个特征的长度（特征向量元素个数）                   |
| feature_num            | StreamDataOutputEngine                                   | 特征库特征数量                                               |
| batch_size             | FaceDetectionEngine FaceLandmarkEngine FaceFeatureEngine | 引擎使用的模型输入的batchsize，用于校验模型的实际值          |
| input_channel          | FaceDetectionEngine FaceLandmarkEngine FaceFeatureEngine | 引擎使用的模型输入的通道数，用于校验模型的实际值             |
| input_width            | FaceDetectionEngine FaceLandmarkEngine FaceFeatureEngine | 引擎使用的模型输入的宽，用于校验模型的实际值                 |
| input_height           | FaceDetectionEngine FaceLandmarkEngine FaceFeatureEngine | 引擎使用的模型输入的高，用于校验模型的实际值                 |
| max_face_num_per_frame | FaceDetectionEngine FaceLandmarkEngine                   | 每帧最大保留人脸框数量，使用时必须确保FaceDetectionEngine和FaceLandmarkEngine两个引擎中的值保持一致 |
| adjacencyThreshold     | SORTEngine                                               | SORT算法中匈牙利匹配算法的阈值，建议设定为0.2左右            |
| trackThreshold         | SORTEngine                                               | 跟踪策略阈值，建议设定为0.6~0.8                              |

​                                                                            表2：setup.config 配置说明

| 配置项          | 说明                                                         |
| --------------- | ------------------------------------------------------------ |
| device_id       | 指定所运行的Ascend 310设备ID，请确保device_id不超过您设备上的Ascend 310 id号 |
| used_cam_num    | 指定从cam list中的前used_cam_num个视频流拉取视频流,本程序最多支持12路视频流输入 |
| cam#（#为编号） | 每个视频流的地址，只支持H.264或H.265视频流                   |

#### 3.模型转换

本程序的FaceDetectionEngine 、FaceLandmarkEngine 和FaceFeatureEngine分别依赖三个不同的DaVinci模型，请于depository/models目录下的三个子文件夹中分别运行转换脚本进行模型转换。下表列出了这三个模型的说明。

| 模型文件名称                                 | 放置目录                     | 主要功能       |
| -------------------------------------------- | ---------------------------- | -------------- |
| resnet18.pb                                  | depository/models/resnet18   | 人脸特征提取   |
| resnet10.pb                                  | depository/models/resnet10   | 人脸关键点检测 |
| yolov3tiny_b4.prototxt/yolov3tiny.caffemodel | depository/models/yolov3tiny | 人脸检测       |

需要特别说明的是，resnet18.pb和resnet10.pb均需要转换为batchsize分别等于1、4、8的3个不同DaVinci模型。因此本程序共有7个DaVinci模型文件。

#### 4.编译

##### 4.1 Atlas 300 (3010或3000)

请根据使用的产品选择以下的一种编译方式进行编译。

(1) 确认编译环境

若用户使用3010 型号的Atlas 300（x86）,请于x86环境编译；若用户使用3000 型号的Atlas 300（arm）,请于arm环境编译。

(2)编译第三方依赖

用户需要编译的唯一第三方依赖包为FFmpeg（版本4.2.2），请下载对应版本的源码包并根据本仓的《Compiling guide of third-party open source softwares》进行编译。

(3) 配置并运行编译脚本

进入build目录

```
cd build
```

修改编译脚本build_local_atlas300.sh的配置项，用户需要正确配置以下配置项：

| build_local_atlas300.sh配置项 | 说明                                                         |
| ----------------------------- | ------------------------------------------------------------ |
| FFMPEG_PATH                   | 编译好的FFmpeg路径，其子目录应包含lib和include文件夹         |
| DDK_PATH                      | DDK根目录                                                    |
| ddk_host_lib_suffix           | 编译依赖的host侧lib文件夹相对于DDK_PATH的路径，**请确认该目录下的so文件均具有正确的软链接（特别是protobuf、opencv_world和gflags）** |
| ddk_device_lib_suffix         | 编译依赖的device侧lib文件夹相对于DDK_PATH的路径              |

执行脚本进行编译

```
./build_local_atlas300.sh
```

##### 4.2 Atlas 500

(1) 确认交叉编译环境

请于x86环境进行交叉编译。

(2)交叉编译第三方依赖

用户需要自行交叉编译的第三方依赖包为FFmpeg（版本4.2.2）、opencv（对于Atlas软件版本1.31.T15.B150或1.32.T7.B070 请使用版本4.1.1，Atlas软件版本1.3.5.B896请使用版本3.4.6）、gflags（版本2.2.2），请下载对应版本的源码包并根据本仓的《Compiling guide of third-party open source softwares》进行交叉编译。

(3) 配置并运行编译脚本

进入build目录

```
cd build
```

修改编译脚本build_local_atlas500.sh的配置项，用户需要正确配置以下配置项：

| build_local_atlas500.sh配置项 | 说明                                                         |
| ----------------------------- | ------------------------------------------------------------ |
| FFMPEG_PATH                   | 编译好的FFmpeg路径，其子目录应包含lib和include文件夹         |
| DDK_PATH                      | DDK根目录                                                    |
| ddk_host_lib_suffix           | 编译依赖的host侧lib文件夹相对于DDK_PATH的路径, **请将opencv、gflags交叉编译生成的so文件拷贝到该目录下**，**并同时确认该目录下的so文件均具有正确的软链接（特别是protobuf、opencv_world和gflags）** |
| ddk_device_lib_suffix         | 编译依赖的device侧lib文件夹相对于DDK_PATH的路径              |
| EULER_CROSS_PATH              | EulerOS交叉编译工具根目录                                    |

执行脚本进行编译

```
./build_local_atlas500.sh
```

#### 5.本地开启RTSP媒体服务器

请使用具有RTSP媒体服务功能的第三方软件以将本地H.264或H.265的视频进行推流。

#### 6.开启流媒体转发服务

本demo已提供基于RTSP的可视化视频流输出。若用户需要观看可视化结果，需在运行人脸识别demo前开启流媒体转发服务。一种较为便捷的方法是在桌面端（ip地址为graph.config中rtsp_link中的地址）安装并运行具有流媒体转发功能的第三方软件。

注意，若用户不需要或不具备上述条件，必须在运行人脸识别demo时显式关闭视频流输出功能，关闭方式请看下一节说明。

#### 7.运行

于bin目录下运行facedemo_main。运行前请确保当前用户已加入HwHiAiUser用户组并已切换到该用户组。

```
cd bin
./facedemo_main
```

运行可使用的参数如下表所示：

| 选项   | 意义                                                         | 默认值              |
| ------ | ------------------------------------------------------------ | ------------------- |
| -graph | graph.config路径，字符串                                     | ./data/graph.config |
| -setup | setup.config路径，字符串                                     | ./data/setup.config |
| -disp  | 是否将人脸识别结果通过视频流输出，整数。大于等于1为是，其他为否。 | 1                   |

#### 8.可视化

确保disp大于等于1，且已在桌面端开启流媒体转发服务。在桌面端安装并使用支持RTSP流媒体播放的播放器打开graph.config中的rtsp_link。