109 Star 878 Fork 1.5K

MindSpore/models

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

目录

[TOC]

SPC-Net 概述

SPC-Net(Style Projected Clustering Network) 提出了一种基于风格表征的语义分割方法。

现有的语义分割方法通过将各种图像正则化到规范的特征空间来提高网络泛化能力。虽然这个过程有助于提升网络的泛化,但它不可避免地削弱了网络特征的表示能力。与现有方法相比,我们利用图像之间的差异来构建一个更好的表示空间,提取并存储不同的风格特征作为表示的基。然后通过将特征投影到这个已知的空间来实现对未知图像的泛化。大量实验表明,所提出的方法具有最先进的分割性能表现,在多个未知场景下平均提高了3.6个点的mIoU。

CVPR2023论文 Style Projected Clustering for Domain Generalized Semantic Segmentation

模型架构

SPC-Net的模型结构如下:

framework

数据集

  • 合成数据:

    • GTAV (Playing for Data: Ground Truth from Computer Games) [paper][website]
    • Synthia (The SYNTHIA Dataset: A Large Collection of Synthetic Images for Semantic Segmentation of Urban Scenes) [paper][website]
  • 真实数据:

    • IDD (IDD: A Dataset for Exploring Problems of Autonomous Navigation in Unconstrained Environments) [paper][website]
    • Cityscapes (The Cityscapes Dataset for Semantic Urban Scene Understanding) [paper][website]
    • BDD (BDD100K: A Diverse Driving Dataset for Heterogeneous Multitask Learning) [paper][website]
    • Mapillary (The Mapillary Vistas Dataset for Semantic Understanding of Street Scenes) [paper][website]

环境要求

快速入门

以下是代码运行的说明及示例:

python eval.py --root DATA_PATH
               --dataset DATASET_NAME
               --num NUMBER_SOURCE_DATASET
# For example
python eval.py --root /path/to/Datasets
               --dataset cityscapes
               --num 2

可以在这里下载训练好的模型文件,提取码为"weih"。

代码说明

.
├─network
    ├─kaiming_normal.py             # 参数初始化方法定义
    ├─network.py                    # SPC-Net模型定义
    ├─Resnet.py                     # ResNet模型定义
    ├─styleRepIN.py                 # 风格表征模块定义
├──src
    ├──cityscapes_labels.py         # 数据集标签定义
    ├──dataset.py                   # 数据集定义
    ├──utils.py                     # 画图、指标计算函数定义
├──models                           # 模型存储路径
├──eval.py                          # 测试脚本
├──requirements.txt                 # python库配置
└──README_CN.md                     # README文件

性能

在单卡V100 GPU上,测试2048x1024分辨率的图像,平均推理时延在10ms以内。

ModelZoo 主页

请浏览官网主页

马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/mindspore/models.git
git@gitee.com:mindspore/models.git
mindspore
models
models
master

搜索帮助