diff --git a/profiler/msprof_analyze/docs/img/pp_chart_operation_steps.png b/profiler/msprof_analyze/docs/img/pp_chart_operation_steps.png index 64b5704cdf167c27d135c311759ef092574ba6ff..57185dadf0ac7dfcc842483476822a97ea6e309d 100644 Binary files a/profiler/msprof_analyze/docs/img/pp_chart_operation_steps.png and b/profiler/msprof_analyze/docs/img/pp_chart_operation_steps.png differ diff --git a/profiler/msprof_analyze/docs/pp_chart.md b/profiler/msprof_analyze/docs/pp_chart.md index 8535c1bbe0dd4dc9ec33e3ee28bd5e79b55935fa..0958a2b987505a688199a6dd219efe680d08bd9f 100644 --- a/profiler/msprof_analyze/docs/pp_chart.md +++ b/profiler/msprof_analyze/docs/pp_chart.md @@ -20,9 +20,9 @@ pp流水图指的是将实际pp域内的流水排布进行可视化呈现,可 tips:若用户只关注pp流水图,可以设置采集参数profiler_level为Level_none;若还关注前反向、通信以及send和recv的关联关系,设置采集参数profiler_level为Level1或更高级别。 -**约束:**: -* 采集数据时,需要将profiling数据导出格式export_type设置为db。 -* 以下仅为打点示例,需要根据用户实际代码,准确找到前反向函数的位置,参考下面用装饰器的方式实现打点。 +**约束** +* 采集数据时,需要将profiling数据导出格式export_type设置为db,msprof_tx开关打开。 +* 场景一和二仅为打点示例,需要根据用户实际代码,准确找到前反向函数的位置,参考下面用装饰器的方式实现打点。 * 若项目使用 Megatron 框架:可直接按照场景一的方法进行打点操作;若项目使用 Mindspeed 框架:需先确认是否开启 DualPipeV 功能,若已开启,则按照场景二的方法进行打点操作;若无法明确区分,如果能找到对应项目中与打点相关的两个核心文件,在这两个文件的打点代码位置处,添加对应的打点逻辑,确保覆盖所有可能场景。 @@ -46,11 +46,11 @@ forward_step = step_wrapper(forward_step, "forward_step") backward_step = step_wrapper(backward_step, "backward_step") ``` -2. 保存上述脚本文件后,执行训练。训练完成后,在xxx目录下生成性能数据文件目录,用于后续mstt工具分析。 +2. 保存上述脚本文件后,执行训练。训练完成后,在设置的输出路径下生成性能数据文件,用于后续mstt工具分析。 **场景二:** -1. DualPipeV,找到前反向代码,在```mindspeed/core/pipeline_parallel/dualpipev/dualpipev_schedules.py```里面添加如下代码(添加在```forward_backward_pipeline_with_cutinhalf```函数定义的前面): +1. DualPipeV,找到前反向代码,在```mindspeed/core/pipeline_parallel/dualpipev/dualpipev_schedules.py```里面添加如下代码(添加在```forward_backward_pipelining_with_cutinhalf```函数定义的前面): ```python import torch_npu def step_wrapper(func, msg: str): @@ -98,7 +98,7 @@ prof.add_metadata_json('pp_info', json.dumps( )) ``` -2. 保存上述脚本文件后,执行训练。训练完成后,在xxx目录下生成xxx_ascend_pt性能数据文件目录,用于后续mstt工具分析。 +2. 保存上述脚本文件后,执行训练。训练完成后,在设置的输出路径下生成性能数据文件,用于后续mstt工具分析。 ### 2. msprof-analyze工具分析