348 Star 1.6K Fork 1K

MindSpore/docs

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
startup_method.rst 2.68 KB
一键复制 编辑 原始数据 按行查看 历史
宦晓玲 提交于 2025-08-05 14:44 +08:00 . modify links

分布式并行启动方式

查看源文件
.. toctree::
  :maxdepth: 1
  :hidden:

  msrun_launcher
  dynamic_cluster
  mpirun
  rank_table

启动方式

目前GPU、Ascend和CPU分别支持多种启动方式。主要有msrun、动态组网、mpirunrank table四种方式:

  • msrunmsrun 是动态组网的封装,允许用户使用单命令行指令在各节点拉起分布式任务,安装MindSpore后即可使用。此方式不依赖第三方库以及配置文件,具有容灾恢复功能,安全性较好,支持三种硬件平台。建议用户优先使用此种启动方式。
  • 动态组网:动态组网需要用户手动拉起多进程以及导出环境变量,是 msrun 的具体实现,Parameter Server训练模式建议使用此方式,其余分布式场景建议使用 msrun
  • mpirun:此方式依赖开源库OpenMPI,启动命令简单,多机需要保证两两之间免密登录,推荐有OpenMPI使用经验的用户使用此种启动方式。
  • rank table:此方式需要在Ascend硬件平台使用,不依赖第三方库。手动配置rank_table文件后,就可以通过脚本启动并行程序,多机脚本一致,方便批量部署。

四种启动方式的硬件支持情况如下表:

  GPU Ascend CPU
msrun 支持 支持 支持
动态组网 支持 支持 支持
mpirun 支持 支持 不支持
rank table 不支持 支持 不支持
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
1
https://gitee.com/mindspore/docs.git
git@gitee.com:mindspore/docs.git
mindspore
docs
docs
r2.7.0

搜索帮助