Ascend/ModelZoo-TensorFlow

基本信息
概述
训练环境准备
快速上手
迁移学习指导
高级参考

基本信息

应用领域（Application Domain）： Image Synthesis

版本（Version）：1.1

修改时间（Modified）：2022.04.11

大小（Size）：6.9M

框架（Framework）：TensorFlow_2.4.1

模型格式（Model Format）：ckpt

精度（Precision）：Mixed

应用级别（Categories）：Research

描述（Description）：基于wasserstein loss的生成对抗网络

概述

传统GAN网络理论上来说，如果两个分布不相交，则JS散度将不再是连续的，因此将不可微，从而导致梯度为0。WGAN通过使用wasserstein loss解决了这个问题，使得loss函数在任何地方都连续且可微。

参考论文：

https://arxiv.org/abs/1701.07875
参考实现：

https://github.com/Zhaopudark/GANs_TensorflowV2
适配昇腾 AI 处理器的实现：

https://gitee.com/ascend/ModelZoo-TensorFlow/tree/master/TensorFlow2/built-in/GAN_ID2351_for_TensorFlow2.X

通过Git获取对应commit_id的代码方法如下：

git clone {repository_url}    # 克隆仓库的代码
cd {repository_name}    # 切换到模型的代码仓目录
git checkout  {branch}    # 切换到对应分支
git reset --hard ｛commit_id｝     # 代码设置到对应的commit_id
cd ｛code_path｝    # 切换到模型代码所在路径，若仓库下只有该模型，则无需切换

默认配置

主要训练超参（单卡）：
- batch_size: 128
- epochs: 400
- lr: 0.001

支持特性

特性列表	是否支持
分布式训练	否
混合精度	是
数据并行	否

混合精度训练

昇腾910 AI处理器提供自动混合精度功能，可以针对全网中float32数据类型的算子，按照内置的优化策略，自动将部分float32的算子降低精度到float16，从而在精度损失很小的情况下提升系统性能并减少内存使用。

开启混合精度

  npu_device.global_options().precision_mode='allow_mix_precision'
  npu_device.open().as_default()

训练环境准备

硬件环境和运行环境准备请参见《CANN软件安装指南》
运行以下命令安装依赖。

pip3 install requirements.txt

说明：依赖配置文件requirements.txt文件位于模型的根目录

快速上手

数据集准备

用户需自行下载MNIST训练数据集，应有如下结构

cifar10/
├── mnist.npz
├── t10k-images.idx3-ubyte
├── t10k-labels.idx3-ubyte
├── train-images.idx3-ubyte
├── train-labels.idx3-ubyte
└── ...

模型训练

单击“立即下载”，并选择合适的下载方式下载源码包。
开始训练
1. 启动训练之前，首先要配置程序运行相关环境变量。
  
  环境变量配置信息参见：
  
  Ascend 910训练平台环境变量设置
2. 单卡训练
  
  2.1 配置train_full_1p.sh脚本中data_path（脚本路径GAN_ID2351_for_TensorFlow2.X/test/train_full_1p.sh）,请用户根据实际路径配置，数据集参数如下所示：
```
 --data_path=/home/MNIST
```
  2.2 1p指令如下:
```
 bash train_full_1p.sh --data_path=/home/MNIST
```

迁移学习指导

数据集准备。
1. 获取数据。请参见“快速上手”中的数据集准备。
模型训练。

参考“模型训练”中训练步骤。
模型评估。

参考“模型训练”中验证步骤。

高级参考

脚本和示例代码

convmixer_ID2501_for_TensorFlow2.X/
├── LICENSE
├── modelzoo_level.txt
├── README.md
├── requirements.txt
├── tf_v2_03_WGAN.py
├── test
│   ├── train_full_1p.sh
│   ├── train_performance_1p_static_eval.sh
│   ├── train_performance_1p_dynamic_eval.sh

脚本参数

--data_path       训练数据集路径
--train_epochs         训练epoch设置
--batch_size     训练bs设置

训练过程

通过“模型训练”中的训练指令启动单卡训练。
将训练脚本（train_full_1p.sh）中的data_path设置为训练数据集的路径。具体的流程参见“模型训练”的示例。
模型存储路径为“curpath/output/ASCEND_DEVICE_ID”，包括训练的log文件。
以多卡训练为例，loss信息在文件curpath/output/{ASCEND_DEVICE_ID}/train_${ASCEND_DEVICE_ID}.log中。

推理/验证过程

NA

Ascend/ModelZoo-TensorFlow

基本信息

概述

默认配置

支持特性

混合精度训练

开启混合精度

训练环境准备

快速上手

数据集准备

模型训练

迁移学习指导

高级参考

脚本和示例代码

脚本参数

训练过程

推理/验证过程

简介

发行版

贡献者

语言

近期动态

Ascend/ModelZoo-TensorFlow .gitee-modal { width: 500px !important; }

基本信息

概述

默认配置

支持特性

混合精度训练

开启混合精度

训练环境准备

快速上手

数据集准备

模型训练

迁移学习指导

高级参考

脚本和示例代码

脚本参数

训练过程

推理/验证过程

简介

发行版

贡献者

语言

近期动态

搜索帮助

Ascend/ModelZoo-TensorFlow