使用离线调试器

概述

本教程介绍如何在离线模式下使用调试器。

操作流程

准备Dump数据。Dump的使用方式详见使用Dump功能在Graph模式调试；
使用离线调试器进行调试分析。

如果需要UI页面，可以通过MindInsight的离线调试器入口启动调试器。操作流程为：

1）启动MindInsight，并通过启动参数指定summary-base-dir为某一次训练的summary-dir或多次训练的summary-dir的父目录（summary-dir为dump配置中的{path}的父目录）；

2）从训练列表中找到离线调试器入口，点击“离线调试器”，进入调试器页面，开始进行调试分析。

如果不需要UI页面，也可以通过离线调试器的API接口来分析。离线调试器的API详见mindinsight.debugger 。操作流程为：

1）通过mindinsight.debugger.DumpAnalyzer实例化离线调试器，将dump_dir指定为某一次训练的dump路径（dump配置中的{path}）；

2）使用离线调试器API调试分析。

如果没有特别说明，下文中的离线调试器均指的是有UI页面的离线调试器。

离线调试器环境准备

使用MindSpore的Dump功能准备离线数据。Dump的使用方式详见使用Dump功能在Graph模式调试。

需要注意的是，一个summary-dir目录下只能存放一个dump目录。例如，某一次训练的Dump配置文件中的path为“/home/workspace/data/dump_dir”，那么本次训练dump数据保存以后，再启动其它训练时，Dump配置文件中的path就不能指定为“/home/workspace/data”的子目录。

然后，启动MindInsight，指定summary-base-dir为某一次训练的summary-dir或多次训练的summary-dir的父目录，即可在UI页面中查询到离线调试器的入口。

MindInsight启动命令：

mindinsight start --port {PORT} --summary-base-dir {SUMMARY_BASE_DIR} --offline-debugger-mem-limit {OFFLINE_DEBUGGER_MEMORY_LIMIT} --max-offline-debugger-session-num {MAX_OFFLINE_DEBUGGER_SESSION_NUMBER}

参数含义如下:

参数名	属性	功能描述	参数类型	默认值	取值范围
`--port {PORT}`	可选	指定Web可视化服务端口。	Integer	8080	1~65535
`--summary-base-dir {SUMMARY_BASE_DIR}`	必选	Dump配置中的{path}路径的上一层或上两层。例如，Dump配置文件中的path为“/home/workspace/data/dump_dir”，summary-base-dir可以设置为“/home/workspace/data”或“/home/workspace”。	String	./	-
`--offline-debugger-mem-limit <OFFLINE_DEBUGGER_MEMORY_LIMIT>`	可选	指定单个离线调试器会话内存使用上限（单位MB），当出现内存不足导致MindInght离线调试器运行问题时，需要用户根据内存情况设置。	Integer	16*1024	6*1024~int32上限
`--max-offline-debugger-session-num <MAX_OFFLINE_DEBUGGER_SESSION_NUMBER>`	可选	指定离线调试器会话数上限，会话数指的是能同时使用离线调试器调试的训练作业个数。	Integer	2	1~2

更多启动参数请参考MindInsight相关命令。

然后，打开MindInsight页面，从离线调试器入口进入调试器界面。

debugger_offline_entry

图1：离线调试器入口

离线调试器页面介绍

离线调试器界面与在线调试器大致相同。在线调试器的页面介绍详见在线调试器页面介绍。不同的是，离线调试器会在计算图的上方显示图执行历史，并且可以重置训练轮次。

图执行历史

离线调试器在计算图的上方显示图执行历史，显示离线数据情况和轮次信息，如图2所示。在是否有数据下拉框可以选择展示全部图执行历史或者只展示有数据的执行历史。在图名称下拉框可以选择只展示对应图名称的执行历史。

debugger_offline_graph_excution_history

图2：图执行历史

训练轮次重置

如图3所示，点击当前轮次右边的编辑图标，就会出现一个编辑框，如图4所示，输入需要重置的轮次，点击对钩符号即可。重置之后，可以查看新轮次的张量值、对已设置的监测点重新检查等。

debugger_offline_reset

图3：重置训练轮次

debugger_offline_edit

图4：重置训练轮次编辑状态