diff --git a/docs/mindstudio/docs/source_zh_cn/feature/performance.md b/docs/mindstudio/docs/source_zh_cn/feature/performance.md index f975624596c9c86ef6de57a2c0dc35ffb5bb46db..3325e133171d783c95a302b205e4deb575dee0ac 100644 --- a/docs/mindstudio/docs/source_zh_cn/feature/performance.md +++ b/docs/mindstudio/docs/source_zh_cn/feature/performance.md @@ -36,27 +36,27 @@ MindStudio Training Tools工具链中的MindStudio Insight工具、msprof-analyz MindStudio Insight - 时间线界面 + 时间线界面 将模型在host、device上的运行详细情况平铺在时间轴上,直观呈现host侧的API耗时情况以及device侧的task耗时,并将host与device进行关联呈现。 帮助用户快速识别host瓶颈或device瓶颈,同时提供各种筛选分类、专家建议等功能,支撑用户进行深度调优。 - 算子界面 + 算子界面 呈现计算算子和通信算子耗时数据。 帮助开发者快速分析由算子耗时导致的性能瓶颈。 - 概览界面 + 概览界面 提供通信域识别、划分和耗时拆解、分析功能。支持自动识别通信域和用户自行配置通信域。支持按照通信域对比stage耗时、计算耗时和通信耗时。 分析同一通信域内的切分是否均匀,是否存在通信慢卡和慢链路问题,帮助开发者快速识别问题。 - 通信界面 + 通信界面 展示集群中全网链路性能以及所有节点的通信性能。 通过集群通信与计算重叠时间的分析,可以找出集群训练中的慢主机或慢节点。 - 内存界面 + 内存界面 提供执行过程中内存信息的可视化呈现。 查看整体内存趋势,以及通过框选峰值区域快速定位到内存消耗过大的算子。 @@ -78,7 +78,7 @@ MindStudio Training Tools工具链中的MindStudio Insight工具、msprof-analyz msleaks - 内存分析 + 内存分析 提供Step内和Step间的内存异常检测能力,包括Step内内存泄漏分析和Step间内存对比分析。 适用于分析内存泄漏异常的场景。 diff --git a/docs/mindstudio/docs/source_zh_cn/guide/get_start.md b/docs/mindstudio/docs/source_zh_cn/guide/get_start.md index dd55b3f85844621b9b095a7ea46b87743208c92b..da69c35981efaad3f8e895a3403f4d6554e7c4da 100644 --- a/docs/mindstudio/docs/source_zh_cn/guide/get_start.md +++ b/docs/mindstudio/docs/source_zh_cn/guide/get_start.md @@ -2,7 +2,7 @@ [![查看源文件](https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/website-images/r2.7.1/resource/_static/logo_source.svg)](https://gitee.com/mindspore/docs/blob/r2.7.1/docs/mindstudio/docs/source_zh_cn/guide/get_start.md) -为方便开发者快速上手使用调试调优工具,[《开发工具快速入门》](https://www.hiascend.com/document/detail/zh/mindstudio/81RC1/msquickstart/atlasquick_train_0004.html)介绍了精度调试、性能调优过程中工具常用功能的用法,包含使用msprobe工具进行训练前配置检查、训练状态监控、精度数据采集和比对、精度预检,使用Profiler进行性能数据采集,使用msprof-analyze和MindStudio Insight工具进行性能分析等。 +为方便开发者快速上手使用调试调优工具,[《开发工具快速入门》](https://www.hiascend.com/document/detail/zh/mindstudio/82RC1/msquickstart/atlasquick_train_0004.html)介绍了精度调试、性能调优过程中工具常用功能的用法,包含使用msprobe工具进行训练前配置检查、训练状态监控、精度数据采集和比对、精度预检,使用Profiler进行性能数据采集,使用msprof-analyze和MindStudio Insight工具进行性能分析等。 @@ -12,40 +12,40 @@ - + - + - + - + - + - + - + - + - +
模型精度调试训练前配置检查训练前配置检查 在训练前或精度比对前,对比两个不同环境下,可能影响训练精度的配置差异。
训练状态监控训练状态监控 收集和聚合模型训练过程中的网络层、优化器、通信算子的中间值,帮助诊断模型训练过程中计算、通信、优化器各部分出现的异常情况。
精度数据采集精度数据采集 采集模型训练过程中API或Module层级的前反向输入输出数据。支持采集的数据包括Module的层次关系、Module或API的输入输出的真实数据和统计值信息、Module或API的调用栈等等。
精度预检精度预检 在执行训练前使用,会扫描在昇腾NPU环境下训练模型的API,输出精度情况的诊断和分析。综合判定API在NPU上的精度是否达标,从而找出NPU中存在精度问题的API。
compare精度比对compare精度比对 比对功能依赖精度数据采集工具采集的数据,计算模型整网NPU侧和标杆设备(如CPU、GPU、NPU等)的误差指标(如余弦相似度、相对误差小于千分之一的比例、最大值误差等,标记可疑的精度异常API或Module,快速定位精度问题根因。
分级可视化构图比对分级可视化构图比对 通过 TensorBoard 直观展示图结构、节点数据、依赖关系等。
模型性能调优性能数据采集性能数据采集 采集原始性能数据,用于精准定位模型训练或推理过程中的性能瓶颈(如算子耗时、内存占用、设备通信延迟等),帮助开发者优化模型执行效率。
msprof-analyze工具分析性能数据msprof-analyze工具分析性能数据 对采集到的性能数据进行统计分析,并给出相关的调优建议。
MindStudio Insight工具可视化性能数据MindStudio Insight工具可视化性能数据 可视化呈现真实软硬件运行数据,多维度分析性能瓶颈点。
diff --git a/docs/mindstudio/docs/source_zh_cn/guide/large_model.md b/docs/mindstudio/docs/source_zh_cn/guide/large_model.md index 8f4259bf9353f7c81faf879ae4f6ae4936ba68de..7f49f2c72620c5b7d662a65cc9adaa1d925eccd6 100644 --- a/docs/mindstudio/docs/source_zh_cn/guide/large_model.md +++ b/docs/mindstudio/docs/source_zh_cn/guide/large_model.md @@ -15,9 +15,9 @@ ## 基于MindSpeed加速库的调试调优指南 -[MindSpeed](https://gitcode.com/Ascend/MindSpeed-Core-MS/blob/r0.3.0/README.md)是MindSpore支持的昇腾训练加速库,提供了丰富的加速算法和模型。 +[MindSpeed](https://gitcode.com/Ascend/MindSpeed-Core-MS/blob/r0.4.0/README.md)是MindSpore支持的昇腾训练加速库,提供了丰富的加速算法和模型。 -针对MindSpeed加速库,以及[MindSpeed-LLM大模型套件](https://gitcode.com/Ascend/MindSpeed-LLM/blob/2.1.0/README.md),我们也提供了调试调优指南。 +针对MindSpeed加速库,以及[MindSpeed-LLM大模型套件](https://gitcode.com/Ascend/MindSpeed-LLM/blob/2.2.0/README.md),我们也提供了调试调优指南。 -- [MindSpeed精度调试指南](https://gitcode.com/Ascend/MindSpeed-Core-MS/blob/r0.3.0/docs/precision_opt.md) -- [MindSpeed性能调优指南](https://gitcode.com/Ascend/MindSpeed-Core-MS/blob/r0.3.0/docs/performance_opt.md) +- [MindSpeed精度调试指南](https://gitcode.com/Ascend/MindSpeed-Core-MS/blob/r0.4.0/docs/precision_opt.md) +- [MindSpeed性能调优指南](https://gitcode.com/Ascend/MindSpeed-Core-MS/blob/r0.4.0/docs/performance_opt.md) diff --git a/docs/mindstudio/docs/source_zh_cn/overview.md b/docs/mindstudio/docs/source_zh_cn/overview.md index f40533c79f4a179dd288338e7461ab180c6b2f33..f47ba15938701139964ae26020d24f54a4e2f1b2 100644 --- a/docs/mindstudio/docs/source_zh_cn/overview.md +++ b/docs/mindstudio/docs/source_zh_cn/overview.md @@ -32,13 +32,13 @@ 安装msprof-anaylze - msleaks + msleaks CANN包提供的命令行工具,用于模型训练内存问题定位,提供Step内和Step间的内存异常检测能力,包括Step内内存泄漏分析和Step间内存对比分析。 安装MindSpore - MindStudio Insight + MindStudio Insight 可视化性能调优工具,提供时间线视图、算子耗时、通信瓶颈分析等功能,辅助快速分析模型性能瓶颈。 - 安装MindStudio Insight
查询版本配套关系 + 安装MindStudio Insight
查询版本配套关系 diff --git a/docs/mindstudio/docs/source_zh_cn/version/mindstudio_insight.md b/docs/mindstudio/docs/source_zh_cn/version/mindstudio_insight.md index 63c6c1cc8a41c46fabf4638c268ac99ea401b4e8..1252c777277c6d875e864747d966f35c39c1972c 100644 --- a/docs/mindstudio/docs/source_zh_cn/version/mindstudio_insight.md +++ b/docs/mindstudio/docs/source_zh_cn/version/mindstudio_insight.md @@ -7,7 +7,7 @@ MindStudio Insight可视化工具,需要与采集性能数据时使用的MindS | MindStudio Insight | MindSpore | |:----------------------------------------------------:|:-------------------------------------------:| -| [8.1.RC1](https://www.hiascend.com/developer/download/community/result?module=sto+cann&sto=8.1.RC1&cann=8.2.RC1) | [2.7.0](https://www.mindspore.cn/versions#2.7.0) | +| [8.2.RC1](https://www.hiascend.com/developer/download/community/result?module=sto+cann&sto=8.2.RC1&cann=8.3.RC1) | [2.7.1](https://www.mindspore.cn/versions#2.7.1) | 历史版本配套关系: