diff --git a/contrib/BertTextClassification/README.md b/contrib/BertTextClassification/README.md
index 877a73156f86373e20ddcfb721cf0aef28518242..119c125448c3f56c9d3434aadf92759eb6d4d0df 100644
--- a/contrib/BertTextClassification/README.md
+++ b/contrib/BertTextClassification/README.md
@@ -2,34 +2,43 @@
 
 ## 1. 介绍
 
+### 1.1 简介
 文本分类插件基于 MindXSDK 开发，在晟腾芯片上进行文本分类，将分类结果保存。输入一段新闻，可以判断该新闻属于哪个类别。
 该模型支持5个新闻类别：体育、健康、军事、教育、汽车。
 
-### 1.1 支持的产品
+### 1.2 支持的产品
 
 本项目以昇腾Atlas310卡为主要的硬件平台。
 
-### 1.2 支持的版本
+### 1.3 支持的版本
 
-支持的SDK版本为2.0.4。
-支持的CANN版本为5.0.4。
+推荐系统为ubuntu 18.04。
 
-### 1.3 软件方案介绍
+表1.1 环境依赖软件和版本：
 
-基于MindX SDK的文本分类业务流程为：待分类文本通过预处理，将文本根据字典vocab.txt进行编码，组成numpy形式的向量，将向量通过 appsrc 插件输入，然后由模型推理插件mxpi_tensorinfer得到每种类别的得分，再通过后处理插件mxpi_classpostprocessor将模型输出的结果处理，最后得到该文本的类别。本系统的各模块及功能描述如表1.1所示：
+| 软件名称 | 版本   |
+| -------- | ------ |
+| cmake    | 3.10.2   |
+| mxVision | 2.0.4  |
+| python   | 3.9.2  |
+| CANN     | 5.0.4  |
+
+### 1.4 软件方案介绍
+
+基于MindX SDK的文本分类业务流程为：待分类文本通过预处理，将文本根据字典vocab.txt进行编码，组成numpy形式的向量，将向量通过 appsrc 插件输入，然后由模型推理插件mxpi_tensorinfer得到每种类别的得分，再通过后处理插件mxpi_classpostprocessor将模型输出的结果处理，最后得到该文本的类别。本系统的各模块及功能描述如表1.2所示：
 
 
-表1.1 系统方案各子系统功能描述：
+表1.2 系统方案各子系统功能描述：
 
 | 序号 | 子系统 | 功能描述     |
 | ---- | ------ | ------------ |
 | 1    | 文本输入    | 读取输入文本 |
 | 2    | 文本编码    | 根据字典对输入文本编码 |
 | 3    | 模型推理    | 对文本编码后的张量进行推理 |
-| 5    | 后处理      | 从模型推理结果中寻找对应的分类标签 |
-| 7    | 保存结果    | 将分类结果保存文件|
+| 4    | 后处理      | 从模型推理结果中寻找对应的分类标签 |
+| 5    | 保存结果    | 将分类结果保存文件|
 
-### 1.4 代码目录结构与说明
+### 1.5 代码目录结构与说明
 
 本工程名称为文本分类，工程目录如下图所示：  
 
@@ -91,20 +100,12 @@
             test.sh
             test_input.py
 ```
-### 1.5 技术实现流程图
+### 1.6 技术实现流程图
 
 ![image](sdk/flowChart.png)
 
 
-## 2 环境依赖
-
-推荐系统为ubuntu 18.04，环境依赖软件和版本如下表：
-
-| 软件名称 | 版本   |
-| -------- | ------ |
-| cmake    | 3.10.2   |
-| mxVision | 2.0.4  |
-| python   | 3.9.2  |
+## 2 设置环境变量
 
 确保环境中正确安装mxVision SDK。
 
@@ -132,7 +133,7 @@ LD_LIBRARY_PATH：添加ascend-toolkit和MindX SDK提供的库目录路径。
 ASCEND_OPP_PATH：atc转换工具需要的目录。 
 ```
 
-## 3 模型转换
+## 3 准备模型
 
 **步骤1** 请参考https://mindx.sdk.obs.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/BertTextClassification/bert_text_classification.pb  
 下载模型的pb文件，存放到开发环境普通用户下的任意目录，例如：$HOME/models/bert_text_classification。
@@ -212,11 +213,11 @@ make
 python3 test.py
 ```
 
-**步骤4** mxBase项目中，将mxBase目录下main.cpp中main方法的全部代码注释，替换为下面代码后执行（即main函数中仅包含以下代码），得到mxBase的精度测试结果。
+**步骤4** mxBase项目中，将mxBase目录下main.cpp中main方法的全部代码注释，替换为下面代码（即main函数中仅包含以下代码），参考第4小节 编译与运行 中的步骤4重新编译并运行，得到mxBase的精度测试结果。
 
 ```
 Test::test_accuracy();
 ```
 
-## 6 其他问题
+## 6 常见问题
 1.本项目的设计为限制输入样例为txt文件，其他文件如图片、音频输入则会报错。
\ No newline at end of file
diff --git a/contrib/EdgeDetectionPicture/CMakeLists.txt b/contrib/EdgeDetectionPicture/CMakeLists.txt
index 3928c17d701784863e6d9b84789407f27010d495..c038f426989abfe0df33a4a95cc2b8a227c48e1b 100644
--- a/contrib/EdgeDetectionPicture/CMakeLists.txt
+++ b/contrib/EdgeDetectionPicture/CMakeLists.txt
@@ -9,7 +9,13 @@ set(TARGET edge_detection_picture)
 add_compile_options(-std=c++11 -fPIE -fstack-protector-all -fPIC -Wl,-z,relro,-z,now,-z,noexecstack -s -pie -Wall)
 add_definitions(-D_GLIBCXX_USE_CXX11_ABI=0 -Dgoogle=mindxsdk_private)
 
-set(MX_SDK_HOME "$ENV{MX_SDK_HOME}")
+set(MX_SDK_HOME /root/SDK/mxVision)
+
+set(cpprest_DIR ${MX_SDK_HOME}/opensource/lib/libcpprest.so)
+if(EXISTS ${cpprest_DIR})
+	target_link_libraries(edge_detection_picture cpprest)
+	add_definitions(_DMX_VERSION_5)
+endif()
 
 include_directories(
         ${MX_SDK_HOME}/include
diff --git a/contrib/EdgeDetectionPicture/README.md b/contrib/EdgeDetectionPicture/README.md
index e00f69a20be355c1a3d718c2da7393cdb64a5338..ec2f72b9981f5b2e53d366181d730b699120c508 100644
--- a/contrib/EdgeDetectionPicture/README.md
+++ b/contrib/EdgeDetectionPicture/README.md
@@ -2,17 +2,24 @@
 # RCF模型边缘检测
 
 ## 1 介绍
+
+#### 1.1 简介
 本开发样例是基于mxBase开发的端到端推理的C++应用程序，可在昇腾芯片上进行 图像边缘提取，并把可视化结果保存到本地。
 其中包含Rcf模型的后处理模块开发。 主要处理流程为： Init > ReadImage >Resize > Inference >PostProcess >DeInit
 
-#### 1.1 支持的产品
+#### 1.2 支持的产品
 昇腾310(推理)
 
-#### 1.2 支持的版本
+#### 1.3 支持的版本
 本样例配套的CANN版本为7.0.0，MindX SDK版本为5.0.0
 MindX SDK安装前准备可参考《用户指南》，[安装教程](https://gitee.com/ascend/mindxsdk-referenceapps/blob/master/docs/quickStart/1-1%E5%AE%89%E8%A3%85SDK%E5%BC%80%E5%8F%91%E5%A5%97%E4%BB%B6.md)
+| 软件                 | 版本          | 说明                          | 
+| ------------------- | ------------ | ---------------------------- |
+| mxVision            | 5.0.0        | mxVision软件包                |
+| Ascend-CANN-toolkit | 7.0.0        | Ascend-cann-toolkit开发套件包 |
+
 
-#### 1.3 代码目录结构与说明
+#### 1.4 代码目录结构说明
 本sample工程名称为EdgeDetectionPicture，工程目录如下图所示：
 
 ```
@@ -32,16 +39,7 @@ MindX SDK安装前准备可参考《用户指南》，[安装教程](https://git
 └── License
 ```
 
-## 2 环境依赖
-环境依赖软件和版本如下表：
-
-
-
-| 软件                | 版本         | 说明                          | 获取方式                                                     |
-| ------------------- | ------------ | ----------------------------- | ------------------------------------------------------------ |
-| mxVision            | 5.0.0        | mxVision软件包                | [链接](https://www.hiascend.com/software/Mindx-sdk) |
-| Ascend-CANN-toolkit | 7.0.0        | Ascend-cann-toolkit开发套件包 | [链接](https://www.hiascend.com/software/cann/commercial)    |
-| 操作系统            | Ubuntu 18.04 | 操作系统                      | Ubuntu官网获取                                               |
+## 2 设置环境变量
 
 在编译运行项目前，需要设置环境变量：
 
@@ -50,12 +48,11 @@ MindX SDK安装前准备可参考《用户指南》，[安装教程](https://git
   ```
   . {cann_install_path}/ascend-toolkit/set_env.sh
   . {sdk_install_path}/mxVision/set_env.sh
-  
   ```
 
 
 
-## 3 模型转换
+## 3 准备模型
 
 **步骤1** 模型获取
 下载RCF模型 。[下载地址](https://mindx.sdk.obs.cn-north-4.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/EdgeDetectionPicture/model.zip)
@@ -120,7 +117,7 @@ vim eval_edge.py
 (5) 测试精度
 
 ``` shell
-python main.py  --result_dir path/to/result  --gt_dir paht/to/BSR/BSDS500/data/groundTruth/test 
+python main.py  --result_dir path/to/result  --gt_dir path/to/BSR/BSDS500/data/groundTruth/test 
 
 ```
 注: 
@@ -147,4 +144,12 @@ ModuleNotFoundError: No module named 'impl.toolbox'
 
 方法二:
 执行命令: unset PYTHONPATH
+```
+### 6.2 检测代码无法修改问题：
+问题描述:
+修改检测代码中, 出现无法修改问题
+
+解决措施:
+```
+使用 sudo vim filename进行修改
 ```
\ No newline at end of file
diff --git a/contrib/EdgeDetectionPicture/rcfDetection/RcfDetection.cpp b/contrib/EdgeDetectionPicture/rcfDetection/RcfDetection.cpp
index a8a84460c7a506e8b7cf4d34c0da439da1353074..ab1796d7262ff8d7461b8451a5e55e83e4e2e42e 100644
--- a/contrib/EdgeDetectionPicture/rcfDetection/RcfDetection.cpp
+++ b/contrib/EdgeDetectionPicture/rcfDetection/RcfDetection.cpp
@@ -39,8 +39,13 @@ void RcfDetection::SetRcfPostProcessConfig(const InitParam &initParam,
     configData.SetJsonValue("MODEL_TYPE", std::to_string(initParam.modelType));
     configData.SetJsonValue("INPUT_TYPE", std::to_string(initParam.inputType));
     configData.SetJsonValue("CHECK_MODEL", checkTensor);
-    auto jsonStr = configData.GetCfgJson().serialize();
-    config["postProcessConfigContent"] = jsonStr;
+    #ifdef MX_VERSION_5
+        auto jsonStr = configData.GetCfgJson().serialize();
+        config["postProcessConfigContent"] = jsonStr;
+    #else 
+        auto jsonStr = configData.GetCfgJson();
+	config["postProcessConfigContent"] = jsonStr;
+    #endif
 }
 
 APP_ERROR RcfDetection::Init(const InitParam &initParam)
diff --git a/contrib/TSM/README.md b/contrib/TSM/README.md
index 7356a5817e95e3b71e646b78bad726b9b8c5f77f..cc2c0f52b1051413f85aabcb1cf15bdf864c869d 100644
--- a/contrib/TSM/README.md
+++ b/contrib/TSM/README.md
@@ -1,23 +1,30 @@
 # TSM视频分类参考设计
 
 ## 1 介绍
-使用TSM模型，基于Kinetics-400数据集，在MindX SDK环境下实现视频分类功能。将测试视频传入脚本进行前处理，模型推理，后处理等功能，最终得到模型推理的精度和性能。
 
-### 1.1 支持的产品
+### 1.1 简介
+使用TSM模型，在MindX SDK环境下实现视频分类功能。将测试视频传入脚本进行前处理，模型推理，后处理等功能，最终得到模型推理的结果。
 
-以昇腾Atlas310卡为主要的硬件平台
+### 1.2 支持的产品
 
-### 1.2 支持的版本
+以昇腾Atlas310卡为主要的硬件平台
 
-CANN：7.0.RC1
+### 1.3 支持的版本
+环境依赖软件和版本如下表：
 
-SDK：mxVision 5.0.RC3（可通过cat SDK目录下的 version.info 查看）
+| 软件名称     | 版本     |
+|----------|--------|
+| cmake    | 3.5+   |
+| mxVision | 5.0.RC3 |
+| Python   | 3.9    |
+| torch    | 1.10.0 |
+| ffmpeg   | 4.2.1  |
 
-### 1.3 软件方案介绍
+### 1.4 软件方案介绍
 
 项目主要由离线精度测试文件，在线功能测试文件，离线单视频推理性能测试文件，模型文件，测试数据集预处理文件组成。
 
-### 1.4 代码目录结构与说明
+### 1.5 代码目录结构与说明
 
 ```text
 ├── TSM
@@ -37,39 +44,19 @@ SDK：mxVision 5.0.RC3（可通过cat SDK目录下的 version.info 查看）
     ├── speed_gpu.py                     // 离线单视频推理GPU性能脚本
 ```
 
-### 1.5技术实现流程
-
-离线推理流程：
-
-![离线推理流程](./offline.png)
+### 1.6技术实现流程
 
 在线推理流程：
 
 ![离线推理流程](./online.png)
 
-### 1.6特性及适用场景
-
-离线模型：
-
-本案例中的 TSM 模型适用于Kinetics数据集中的400类视频分类，并可以返回测试集视频的精度值及单视频识别的种类、性能。
-
-在以下两种情况视频分类情况不太好：1. 视频长度过短（小于3s）。 2. 视频帧率过低。
+### 1.7特性及适用场景
 
 在线模型：
 
 本案例中的在线模型适用于26中手势识别，并可以返回识别手势的名称。
 
-## 2 环境依赖
-
-推荐系统为ubuntu 18.04，环境依赖软件和版本如下表
-
-| 软件名称     | 版本     |
-|----------|--------|
-| cmake    | 3.5+   |
-| mxVision | 5.0.RC3 |
-| Python   | 3.9    |
-| torch    | 1.10.0 |
-| ffmpeg   | 4.2.1  |
+## 2 设置环境变量
 
 - 环境变量搭建
 
@@ -108,194 +95,7 @@ export PATH=/usr/local/ffmpeg/bin:$PATH
 export LD_LIBRARY_PATH=/usr/local/ffmpeg/lib:$LD_LIBRARY_PATH
 ```
 
-## 3  离线推理
-
-**步骤1** Kinetics-400数据集下载
-
-参考[Kinetics-400 数据准备](https://github.com/PaddlePaddle/PaddleVideo/blob/develop/docs/zh-CN/dataset/k400.md#%E4%B8%8B%E8%BD%BDvideo%E6%95%B0%E6%8D%AE)中的脚本下载操作，在代码根目录的"download_data"目录下准备"download.sh"数据集下载脚本和"val_link.list"验证集链接列表文件。
-
-```text
-├── TSM
-    ├── download_data
-        ├── download.sh                  // 下载数据集脚本
-        ├── k400_extractor.sh            // 解压数据集脚本
-        ├── val_link.list    
-```
-
-进入代码根目录的"download_data"目录下，执行以下命令下载数据集压缩包val_part1.tar、val_part2.tar、val_part3.tar：
-
-```Shell
-bash download.sh val_link.list
-```
-
-然后执行以下命令解压数据集到代码根目录下：
-
-```Shell
-bash k400_extractor.sh
-```
-
-数据集结构如下：
-
-```text
-├── TSM
-    ├── data
-        ├── abseiling
-        ├── air_drumming
-        ├── ...
-        ├── zumba
-```
-
-**步骤2** 数据集预处理
-
-1、视频抽帧
-
-在代码根目录执行以下命令创建所需目录：
-
-```Shell
-mkdir tools
-mkdir ops
-```
-
-下载[“temporal-shift-module-master.zip”](https://github.com/mit-han-lab/temporal-shift-module/tree/master)代码包并上传服务器解压，将代码包中"tools"目录下的"vid2img_kinetics.py"、"gen_label_kinetics.py"、"kinetics_label_map.txt"三个文件拷贝至参考设计代码根目录的“tools”目录下。
-
-```text
-├── TSM
-    ├── tools 
-        ├── gen_label_kinetics.py        // label生成脚本
-        ├── vid2img_kinetics.py          // 视频抽帧脚本
-        ├── kinetics_label_map.txt
-```
-
-将代码包中"ops"目录下的"basic_ops.py"、"dataset.py"、"dataset_config.py"、"models.py"、"temporal_shift.py"、"transforms.py"六个文件拷贝至参考设计代码根目录的“ops”目录下。
-
-```text
-    ├── ops
-        ├── basic_ops.py
-        ├── dataset.py                   // 数据集构建脚本
-        ├── dataset_config.py            // 数据集配置脚本
-        ├── models.py                    // 模型搭建脚本 
-        ├── temporal_shift.py
-        ├── transforms.py
-```
-
-修改“tools”目录下的 vid2img_kinetics.py 内容，将77、78行注释。
-
-```text
-
-77行 #class_name = 'test'
-78行 #class_process(dir_path, dst_dir_path, class_name)
-
-``` 
-
-在参考设计代码根目录下，执行以下命令对数据集视频进行抽帧并生成图片：
-
-```shell
-mkdir dataset
-cd ./tools
-python3 vid2img_kinetics.py [video_path] [image_path]
-e.g.
-python3 vid2img_kinetics.py ../data ../dataset/
-```
-
-修改“tools”目录下gen_label_kinetics.py 内容。
-
-```text
-
-# 11行 dataset_path = '../dataset'           # 放视频抽帧后的图片路径
-# 12行 label_path = '../label'               # 存放label路径
-# 25行 files_input = ['kinetics_val.csv']
-# 26行 files_output = ['val_videofolder.txt']
-# 37行 folders.append(items[1])
-# 57行 output.append('%s %d %d'%(os.path.join('../dataset/',os.path.join(categories_list[i], curFolder)), len(dir_files), curIDX))
-
-``` 
-
-在“tools”目录下，执行以下命令生成标签文件：
-
-```shell
-python3 gen_label_kinetics.py
-```
-
-**步骤3** 模型转换
-
-下载[离线模型](https://mindx.sdk.obs.cn-north-4.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/TSM/offline_models.zip) TSM.onnx, 将下载好的模型放在“${TSM代码根目录}/model”目录下。
-
-将模型转换为om模型，在“model”目录下，执行以下命令生成om模型
-
-```shell
-bash onnx2om.sh
-```
-
-**步骤4** 精度测试
-
-修改${TSM代码根目录}/ops/dataset_config.py 脚本中参数root_data、filename_imglist_train和filename_imglist_val，若仅进行离线精度测试则可忽略filename_imglist_train设置。
-
-```shell
-import os
-
-ROOT_DATASET = './labels/'    # 标签文件所在路径
-
-...
-
-def return_kinetics(modality):
-    filename_categories = 400
-    if modality == 'RGB':
-        root_data = ROOT_DATASET                                # 训练集根目录
-        filename_imglist_train = 'train_videofolder.txt'        # 训练数据集标签
-        filename_imglist_val = 'val_videofolder.txt'            # 测试数据集标签
-        prefix = 'img_{:05d}.jpg'
-    else:
-        raise NotImplementedError('no such modality:' + modality)
-    return filename_categories, filename_imglist_train, filename_imglist_val, root_data, prefix
-```
-
-在参考设计代码根目录下，运行精度测试脚本
-
-```shell
-python3 offline_infer.py kinetics
-```
-
-原模型精度值为71.1%，实测精度值为71.01%，符合精度偏差范围，精度达标。
-
-**步骤5** 性能测试
-
-将用来测试的单视频放在参考设计代码根目录下，如视频“test_speed.mp4”，运行性能测试脚本
-
-修改speed_gpu.py与speed.py参数，'./test_speed.mp4'为测试视频，测试视频类别需在Kinetics-400数据集的400个种类内且视频长度至少为3s。
-
-```python
-def main():
-    cmd = 'ffmpeg  -i \"{}\" -threads 1 -vf scale=-1:331 -q:v 0 \"{}/img_%05d.jpg\"'.format('./test_speed.mp4', './image')
-    subprocess.call(cmd, shell=True,
-                    stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
-    files = os.listdir(r"./image/")
-```
-
-GPU性能(Tesla_V100S_PCIE_32GB)
-
-在参考设计代码根目录下，运行GPU性能测试脚本
-
-```shell
-python3 speed_gpu.py kinetics --test_segments=8 --test_crops=1 --batch_size=1
-```
-
-注：speed_gpu.py脚本需在GPU环境上运行，NPU环境无法运行。
-
-得到单视频纯推理性能为0.08sec/video
-
-SDK性能
-
-在参考设计代码根目录下，运行SDK性能测试脚本
-
-```shell
-python3 speed.py
-```
-
-注：speed.py脚本需在NPU环境上运行。
-
-得到单视频纯推理性能为0.189sec/video
-
-## 4 在线推理
+## 3 在线推理
 
 **步骤1** 安装[视频流工具](https://gitee.com/ascend/docs-openmind/blob/master/guide/mindx/sdk/tutorials/reference_material/Live555%E7%A6%BB%E7%BA%BF%E8%A7%86%E9%A2%91%E8%BD%ACRTSP%E8%AF%B4%E6%98%8E%E6%96%87%E6%A1%A3.md)
 
diff --git a/contrib/VCOD_SLTNet/README.md b/contrib/VCOD_SLTNet/README.md
deleted file mode 100644
index e7d69da0cc9e498cd21f723cd86ef287262bfd74..0000000000000000000000000000000000000000
--- a/contrib/VCOD_SLTNet/README.md
+++ /dev/null
@@ -1,272 +0,0 @@
-# 视频伪装物体检测
-
-## 1 介绍
-
-基于 MindX SDK 实现 SLT-Net 模型的推理，在 MoCA-Mask 数据集上 Sm 达到大于 0.6。输入连续几帧伪装物体的视频序列，输出伪装物体掩膜 Mask 图。
-
-
-### 1.1 支持的产品
-
-支持昇腾310芯片
-
-
-### 1.2 支持的版本
-
-CANN：7.0.RC1
-
-SDK：mxVision 5.0.RC3（可通过cat SDK目录下的 version.info 查看）
-
-
-### 1.3 软件方案介绍
-
-
-本方案中，先通过 `torch2onnx.py` 脚本将 PyTorch 版本的伪装视频物体检测模型 SLT-Net 转换为 onnx 模型；然后通过 `inference.py` 脚本调用晟腾om模型，将输入视频帧进行图像处理，最终生成视频伪装物体的掩膜 Mask 图。
-
-
-### 1.4 代码目录结构与说明
-
-本sample工程名称为 VCOD_SLTNet，工程目录如下图所示：
-
-```
-──VCOD_SLTNet
-    ├── flowchart.jpeg
-    ├── inference.py   # 推理文件
-    ├── torch2onnx.py  # 模型转换脚本
-    └── README.md
-```
-
-
-### 1.5 技术实现流程图
-
-![Flowchart](./flowchart.jpeg)
-
-图1 视频伪装物体检测流程图
-
-
-### 1.6 特性及适用场景
-
-对于伪装视频数据的分割任务均适用，输入视频需要转换为图片序列输入到模型中，具体可以参考 MoCA 数据格式与目录结构（如下所示），详见 [SLT-Net](https://xueliancheng.github.io/SLT-Net-project/) 与 [MoCA 数据集主页](https://www.robots.ox.ac.uk/~vgg/data/MoCA/)。
-
-
-```
---data
-    └── TestDataset_per_sq           # 测试数据集
-        ├── flower_crab_spider_1     # 不同场景
-            ├── GT                   # Ground Truth
-                ├── 00000.png
-                ├── .....
-            └── Imgs                 # 输入图片序列
-                ├── 00000.jpg
-                ├── .....
-        ......
-
-```
-
-
-## 2 环境依赖
-
-环境依赖软件和版本如下表：
-
-| 软件名称 | 版本   |
-| -------- | ------ |
-| MindX SDK  | 5.0.RC3 |
-| Python |   3.9.2     |
-|  CANN        |  7.0RC1    |
-| PyTorch | 1.12.1 |
-| numpy | 1.21.5 |
-| imageio | 2.22.3| 
-| Pillow | 9.3.0 | 
-| cv2 | 4.5.5 |
-| timm | 0.4.12 |
-| tqdm | 4.64.1 |
-
-
-## 3. 数据准备
-
-### 3.1 准备相关文件
-
-1、SLT-Net代码包准备
-
-点击访问 [SLT-Net](https://github.com/XuelianCheng/SLT-Net) 并下载 SLT-Net-master.zip 代码压缩包，上传服务器并解压得到“SLT-Net-master”目录及文件；
-
-2、SLT-Net模型文件准备
-
-方法一：通过访问 [SLT-Net 模型官方链接](https://drive.google.com/file/d/1_u4dEdxM4AKuuh6EcWHAlo8EtR7e8q5v/view) 下载模型压缩包 (注意，需要访问 Google Drive )，解压后将 `Net_epoch_MoCA_short_term_pseudo.pth` 模型拷贝至 `SLT-Net-master` 目录下；
-
-方法二：下载 [models.zip 备份模型压缩包](https://mindx.sdk.obs.cn-north-4.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/sltnet/models.zip) 并解压获得 `sltnet.pth`、`sltnet.onnx`、`sltnet.om` 三个模型文件，将 `sltnet.pth` 模型拷贝至 `SLT-Net-master` 目录下
-
-
-3、数据集准备
-
-通过访问[MoCA官方链接](https://xueliancheng.github.io/SLT-Net-project/)下载 `MoCA_Video` 数据集，或者通过[数据集备份链接](https://mindx.sdk.obs.cn-north-4.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/sltnet/MoCA_Video.zip)来下载 `MoCA_Video.zip` 数据集压缩包并解压；
-
-
-### 3.2 模型转换
-
-1、SLT-Net代码预处理
-
-进入 `SLT-Net-master/lib` 目录下，对 `__init__.py`、`short_term_model.py`、`pvtv2_afterTEM.py`三个文件做以下修改：
-
-1）`__init__.py`文件注释如下：
-
-```
-from .short_term_model import VideoModel as VideoModel_pvtv2
-# from .long_term_model import VideoModel as VideoModel_long_term
-```
-
-注：因为长期模型依赖 CUDA，并且需要在 CUDA 平台进行编译，而本项目基于 MindX SDK 实现，因此使用短期模型。并且，短期模型的评价指标满足预期。
-
-
-2）修改 `short_term_model.py` 文件中，如下代码行：
-
-修改
-
-```
-def forward(self, x):
-    image1, image2, image3 = x[:, :3], x[:, 3:6], x[:, 6:]  # 替换之前的 image1, image2, image3 = x[0],x[1],x[2]
-    fmap1=self.backbone.feat_net(image1)
-    fmap2=self.backbone.feat_net(image2)
-    fmap3=self.backbone.feat_net(image3)
-```
-
-修改
-
-```
-    def __init__(self, args):
-        super(ImageModel, self).__init__()
-        self.args = args
-        # self.backbone = Network(pvtv2_pretrained=self.args.pvtv2_pretrained, imgsize=self.args.trainsize)
-        self.backbone = Network(pvtv2_pretrained=self.args.pvtv2_pretrained, imgsize=352)   # 指定图片大小
-
-    ....
-
-        # self.backbone = Network(pvtv2_pretrained=False, imgsize=self.args.trainsize)
-        self.backbone = Network(pvtv2_pretrained=False, imgsize=352)   # 指定图片大小
-        if self.args.pretrained_cod10k is not None:
-            self.load_backbone(self.args.pretrained_cod10k )
-```
-
-
-删除
-
-```
-if self.args.pretrained_cod10k is not None:
-    self.load_backbone(self.args.pretrained_cod10k )
-```
-
-
-3）`pvtv2_afterTEM.py` 文件注释如下：
-
-```
-from timm.models import create_model
-#from mmseg.models import build_segmentor
-#from mmcv import ConfigDict
-import pdb
-```
-
-
-修改“SLT-Net-master/mypath.py”文件如下：
-
-```
-elif dataset == 'MoCA':
-    return './dataset/MoCA-Mask/' # 将此处路径修改指定为“MoCA_Video”目录的相对路径
-```
-
-
-可参考已经完成修改的 [SLT_Net_MindXsdk_torch](https://github.com/shuowang-ai/SLT_Net_MindXsdk_torch)，也可直接使用该项目进行下面的 onnx 模型转换操作，替代以上步骤。
-
-
-2、模型转换
-
-步骤一、pth模型转onnx模型
-
-将 `VCOD_SLTNet` 代码包中的 `torch2onnx.py` 脚本拷贝至 `SLT-Net-master` 目录下，并在 `SLT-Net-master` 目录下执行以下命令将 pth 模型转换成 onnx 模型：
-
-```
-python torch2onnx.py --pth_path ${pth模型文件路径} --onnx_path ./sltnet.onnx
-```
-
-参数说明：
-
-pth_path：pth模型文件名称及所在路径
-
-onnx_path：生成输出的onnx模型文件
-
-
-注意，timm 的版本为 `0.4.12`，其他版本可能有兼容性问题。
-
-
-步骤二、简化onnx文件（可选操作）
-
-```
-python -m onnxsim --input-shape="1,9,352,352" --dynamic-input-shape sltnet.onnx sltnet_sim.onnx
-```
-
-步骤三、onnx模型转om模型
-
-```
-atc --framework=5 --model=sltnet.onnx --output=sltnet --input_shape="image:1,9,352,352" --soc_version=Ascend310 --log=error
-```
-
-注意：
-
-1. 若想使用转换好的onnx模型或om模型，可通过下载 [models.zip备份模型压缩包](https://mindx.sdk.obs.cn-north-4.myhuaweicloud.com/mindxsdk-referenceapps%20/contrib/sltnet/models.zip) 解压获得转换好的 onnx 模型或 om 模型。
-
-2. pth模型转onnx模型，onnx模型转om模型，均可能花费约1小时左右，视不同运行环境而定。如无报错，请耐心等待。
-
-
-## 4. 运行推理
-
-
-使用如下命令，运行 `inference.py` 脚本：
-
-```
-python inference.py --datapath ${MoCA_Video数据集路径} --save_root ./results/ --om_path ./sltnet.om --testsize 352 --device_id 0
-```
-
-参数说明：
-
-datapath：下载数据以后，目录中 `TestDataset_per_sq` 的上一级目录，
-
-save_root：结果保存路径
-
-om_path：om 模型路径
-
-testsize：图片 resize 的大小，当前固定为 352
-
-device_id：设备编号
-
-
-注意，该脚本无需放入修改的 SLT-Net 目录，在任意位置均可执行，只需设置好上述参数即可。
-
-
-运行输出如下：
-
-```
-  0%|                                                                                                       | 0/713 [00:00<?, ?it/s]>  ./results/arctic_fox/Pred/00000.png
-  0%|▏                                                                                              | 1/713 [00:00<10:31,  1.13it/s]>  ./results/arctic_fox/Pred/00005.png
-  0%|▎                                                                                              | 2/713 [00:01<09:01,  1.31it/s]>  ./results/arctic_fox/Pred/00010.png
-  0%|▍                                                                                              | 3/713 [00:02<08:30,  1.39it/s]>  ./results/arctic_fox/Pred/00015.png
-  1%|▌                                                                                              | 4/713 [00:02<08:13,  1.44it/s]>  ./results/arctic_fox/Pred/00020.png
-```
-
-将展示剩余运行时间以及生成图片的路径。
-
-
-## 5. 精度评估
-
-点击访问 [SLT_Net_MindXsdk_torch](https://github.com/shuowang-ai/SLT_Net_MindXsdk_torch) 并下载 `SLT_Net_MindXsdk_torch-master.zip` 代码压缩包，上传服务器并解压获得 `SLT_Net_MindXsdk_torch-master` 目录及相关文件；
-
-进入 `SLT_Net_MindXsdk_torch-master` 目录，修改 `eval_python/run_eval.py` 脚本中的 `gt_dir` 为本地的 `MoCA_Video/TestDataset_per_sq/` 目录的绝对路径，`pred_dir` 为预测结果目录的绝对路径，并执行以下命令进行精度评估：
-
-```
-python eval_python/run_eval.py
-```
-
-完成评估后的结果如下：
-
-{'Smeasure': 0.6539, 'wFmeasure': 0.3245, 'MAE': 0.0161, 'adpEm': 0.6329, 'meanEm': 0.7229, 'maxEm': 0.7554, 'adpFm': 0.3025, 'meanFm': 0.3577, 'maxFm': 0.3738}
-
-评测结果高于交付所要求的 Smeasure 0.6 的指标。
-
-注：评估还可参考基于 基于 [MATLAB](https://github.com/XuelianCheng/SLT-Net/tree/master/eval) 的 SLT-Net 的评测代码或参考基于 Python 的 [PySODEvalToolkit](https://github.com/lartpang/PySODEvalToolkit) 的评测代码。