61 Star 117 Fork 114

Ascend/mind-cluster

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

Ascend Operator

组件介绍

  • Ascend Operator 支持mindspore、pytorch、tensorflow三个AI框架在Kubernetes上进行分布式训练的插件。CRD(Custom Resource Definition)中定义了AscendJob任务,用户只需配置yaml文件, 即可轻松实现分布式训练。

编译Ascend Operator

  1. 通过git拉取源码,获得ascend-operator。

    示例:源码放在/home/mind-cluster/component/ascend-operator目录下

  2. 执行以下命令,进入构建目录,执行构建脚本,在“output“目录下生成二进制ascend-operator、yaml文件和Dockerfile。

    cd /home/mind-cluster/component/ascend-operator/build/

    chmod +x build.sh

    ./build.sh

  3. 执行以下命令,查看output生成的软件列表。

    ll /home/mind-cluster/component/ascend-operator/output

    drwxr-xr-x 2 root root     4096 Jan 29 19:12 ./
    drwxr-xr-x 9 root root     4096 Jan 29 19:09 ../
    -r-x------ 1 root root 43524664 Jan 29 19:09 ascend-operator
    -r-------- 1 root root   372080 Jan 29 19:09 ascend-operator-v6.0.0.yaml
    -r-------- 1 root root      482 Jan 29 19:12 Dockerfile
    

说明

  1. 当前容器方式部署本组件,本组件的认证鉴权方式为ServiceAccount, 该认证鉴权方式为ServiceAccount的token明文显示,如果需要加密保存,请自行修改
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Go
1
https://gitee.com/ascend/mind-cluster.git
git@gitee.com:ascend/mind-cluster.git
ascend
mind-cluster
mind-cluster
master

搜索帮助