Atlas 800T A2 及之后版本无需 deepspeed_npu 插件,直接安装,直接使用,建议使用新版 DeepSpeed。
首先卸载旧版 DeepSpeed 以及 deepspeed_npu(如没有可跳过此步骤)。
pip3 uninstall deepspeed_npu
pip3 uninstall deepspeed
安装最新版本 DeepSpeed:
方式一:
pip3 install deepspeed
方式二:
git clone https://github.com/microsoft/DeepSpeed.git
cd DeepSpeed
pip3 install -e ./
使用方式与原生一致,具体可参考官方文档与示例。
官方文档:http://www.deepspeed.ai/
官方代码仓:https://github.com/microsoft/DeepSpeed
官方示例仓:https://github.com/microsoft/DeepSpeedExamples
Ascend NPU 适配 Deepspeed 插件
通过 deepspeed_npu,你可以在 Ascend910 芯片上使用 Deepspeed,并基于 Deepspeed 进行开发。
deepspeed_npu 目前仅支持 Deepspeed 版本 0.9.2:https://github.com/microsoft/DeepSpeed/tree/v0.9.2
pip3 install deepspeed==0.9.2
git clone https://gitee.com/ascend/DeepSpeed.git -b v0.9.2 deepspeed_npu
cd deepspeed_npu
pip3 install .
作为 Python 包,deepspeed_npu 与其他 python 包一样,可通过 pip 命令卸载:
pip uninstall deepspeed_npu
在模型启动文件中 import deepspeed_npu,并配合 deepspeed / torch 使用,例如
import torch
import torch_npu
import deepspeed
import deepspeed_npu
...
目前,deepspeed_npu 主要支持以下特性:
请参考 Deepspeed 官方文档获取这些特性的详细说明:https://www.deepspeed.ai/
DeepSpeed 用例参考: https://github.com/microsoft/DeepSpeedExamples
deepspeed_npu
:文件夹下的各个文件都对应原生的文件,如 adaptor_xxx_yyy.py 文件对应原生的 xxx.yyy.py 文件。deepspeed_npu.csrc_npu
:文件夹下为相关特性的动态编译 C++ 文件,与原生的 csrc 文件夹相对应。如 csrc_npu/adam 文件夹对应原生的 csrc/adam 文件夹。deepspeed_npu 以 monkey patching / 装饰器等方式替换/修改 DeepSpeed 原有函数实现,并不提供对外接口,用户只需要import deepspeed_npu
,做到无感迁移原有模型代码。
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。