登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
登录
注册
代码拉取完成,页面将自动刷新
当前仓库属于暂停状态,部分功能使用受限,详情请查阅
仓库状态说明
开源项目
>
人工智能
>
机器学习/深度学习
&&
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
88
Star
649
Fork
1.4K
Ascend
/
pytorch
暂停
代码
Issues
41
Pull Requests
350
Wiki
统计
流水线
服务
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
发行版
最新版
v7.1.0.2-pytorch2.5.1
31c6152
2025-09-09 19:37
对比
release v7.1.0.2-pytorch2.5.1
shaoyf
基于V7.1.0-pytorch2.5.1修复部分场景问题
最后提交信息为:
!24139
[bugfix] resolve deadlock and device inconsistent problem.
v7.1.0.2-pytorch2.6.0
eef1d5a
2025-09-09 19:37
对比
release v7.1.0.2-pytorch2.6.0
shaoyf
基于V7.1.0-pytorch2.6.0修复部分场景问题
最后提交信息为:
!24140
[bugfix] resolve deadlock and device inconsistent problem.
v7.1.0.2-pytorch2.1.0
ef59fd4
2025-09-09 19:33
对比
release v7.1.0.2-pytorch2.1.0
shaoyf
基于V7.1.0-pytorch2.1.0修复部分场景问题
最后提交信息为:
!24138
[bugfix] resolve deadlock and device inconsistent problem.
预览版本
v7.0.0.1-pytorch2.4.0
3788e4f
2025-08-20 21:23
对比
release v7.0.0.1-pytorch2.4.0
shaoyf
基于v7.0.0-pytorch2.4.0修复部分软件问题
最后提交信息为:
!24031
modify verison
预览版本
v7.0.0.1-pytorch2.1.0
76913c9
2025-08-20 20:51
对比
release v7.0.0.1-pytorch2.1.0
shaoyf
基于v7.0.0-python2.1.0版本修复部分软件问题
最后提交信息为:
!24045
[bugfix] resolve deadlock and device inconsistent problem.
预览版本
v7.2.RC1.alpha001-pytorch2.8.0
090d1a0
2025-08-12 11:50
对比
v7.2.RC1.alpha001-pytorch2.8.0
dilililiwhy
• PyTorch 2.8.0适配预览版本(非正式版本),继承2.7.1特性,基于PrivateUse1特性,支持eager模式分布式、混合精度训练等基础能力 • 新增部分API支持及特性支持,暂未支持inductor相关功能 • 配套CANN 8.3.RC1.alpha001:https://www.hiascend.com/developer/download/community/result?module=cann
最后提交信息为:
!23695
[torch_2.8.0] 修复单CPU场景PROF文件权限校验
v7.1.0.1-pytorch2.6.0
ac3b116
2025-08-04 17:49
对比
release v7.1.0.1-pytorch2.6.0
shaoyf
Bugfix • 修复自定义算子包与CANN中算子同名导致调用算子不正确的问题
最后提交信息为:
!23555
update post to 2.6.0.post1
v7.1.0.1-pytorch2.5.1
2cffa3e
2025-08-04 17:48
对比
release v7.1.0.1-pytorch2.5.1
shaoyf
Bugfix • 修复自定义算子包与CANN中算子同名导致调用算子不正确的问题
最后提交信息为:
!23554
update post to 2.5.1.post2
v7.1.0.1-pytorch2.1.0
ed4c514
2025-08-04 15:30
对比
release v7.1.0.1-pytorch2.1.0
shaoyf
Bugfix • 修复自定义算子包与CANN中算子同名导致调用算子不正确的问题
最后提交信息为:
!23553
update post to 14
v7.1.0-pytorch2.6.0
41d2476
2025-07-23 18:22
对比
release v7.1.0-pytorch2.6.0
shaoyf
一.新增说明 新增特性 • Ascend Extension for PyTorch flight recorder支持PyTorch2.6.0版本 • Ascend Extension for PyTorch 新增支持aclgraph特性,降低CPU下发耗时 • Ascend Extension for PyTorch 增强Parallel Store,优化TCP Store性能 • Ascend Extension for PyTorch 内存快照新增支持获取aarch64架构的C++调用栈 二.删除说明 无 三. 变更说明 1.接口变更说明 • 环境变量“P2P_HCCL_BUFFSIZE”默认值变更为20,单位MB,该变动可能会导致以下两个问题: - 若升级后出现oom,可在模型脚本中将此变量设置为0 - 若之前未对p2p创建独立通信域,配置该环境变量后,会对p2p创建独立的通信域,若模型侧存在send/recv下发间隔时间长的场景,可能会出现超时,此时需要将HCCL_CONNECT_TIMEOUT的时间配置得更长,推荐配置值为600s,具体需根据模型脚本设置 • 自定义算子torch_npu.npu_grouped_matmul入参要求变更,group_list为Tensor类型时,入参group_type需要显示传入 • 新增torch.npu.NPUGraph等接口支持aclgraph特性 • 新增支持torch.logit原生接口、新增torch_npu.utils.set_thread_affinity等自定义接口 四. 已知问题 无 五. 特殊声明 • 虚拟内存与单进程多卡需要在Ascend HDK 24.1.RC3以上的版本才能直接使用,其他版本不能共同使用
最后提交信息为:
!23287
Update op_plugin commit id
v7.1.0-pytorch2.5.1
5f020c4
2025-07-23 18:19
对比
release v7.1.0-pytorch2.5.1
shaoyf
一.新增说明 新增特性 • Ascend Extension for PyTorch 新增支持aclgraph特性,降低CPU下发耗时 • Ascend Extension for PyTorch 增强Parallel Store,优化TCP Store性能 • Ascend Extension for PyTorch 内存快照新增支持获取aarch64架构的C++调用栈 二.删除说明 无 三. 变更说明 1.接口变更说明 • 环境变量“P2P_HCCL_BUFFSIZE”默认值变更为20,单位MB,该变动可能会导致以下两个问题: - 若升级后出现oom,可在模型脚本中将此变量设置为0 - 若之前未对p2p创建独立通信域,配置该环境变量后,会对p2p创建独立的通信域,若模型侧存在send/recv下发间隔时间长的场景,可能会出现超时,此时需要将HCCL_CONNECT_TIMEOUT的时间配置得更长,推荐配置值为600s,具体需根据模型脚本设置 • 自定义算子torch_npu.npu_grouped_matmul入参要求变更,group_list为Tensor类型时,入参group_type需要显示传入 • 新增torch.npu.NPUGraph等接口支持aclgraph特性 • 新增支持torch.logit原生接口、新增torch_npu.utils.set_thread_affinity等自定义接口 四. 已知问题 无 五. 特殊声明 • 虚拟内存与单进程多卡需要在Ascend HDK 24.1.RC3以上的版本才能直接使用,其他版本不能共同使用
最后提交信息为:
!23288
Update op_plugin commit id
v7.1.0-pytorch2.1.0
b9b202a
2025-07-23 18:16
对比
release v7.1.0-pytorch2.1.0
shaoyf
一.新增说明 新增特性 • Ascend Extension for PyTorch 新增支持aclgraph特性,降低CPU下发耗时 • Ascend Extension for PyTorch 增强Parallel Store,优化TCP Store性能 • Ascend Extension for PyTorch 内存快照新增支持获取aarch64架构的C++调用栈 二.删除说明 无 三. 变更说明 1.接口变更说明 • 环境变量“P2P_HCCL_BUFFSIZE”默认值变更为20,单位MB,该变动可能会导致以下两个问题: - 若升级后出现oom,可在模型脚本中将此变量设置为0 - 若之前未对p2p创建独立通信域,配置该环境变量后,会对p2p创建独立的通信域,若模型侧存在send/recv下发间隔时间长的场景,可能会出现超时,此时需要将HCCL_CONNECT_TIMEOUT的时间配置得更长,推荐配置值为600s,具体需根据模型脚本设置 • 自定义算子torch_npu.npu_grouped_matmul入参要求变更,group_list为Tensor类型时,入参group_type需要显示传入 • 新增torch.npu.NPUGraph等接口支持aclgraph特性 • 新增支持torch.logit原生接口、新增torch_npu.utils.set_thread_affinity等自定义接口 四. 已知问题 无 五. 特殊声明 • 虚拟内存与单进程多卡需要在Ascend HDK 24.1.RC3以上的版本才能直接使用,其他版本不能共同使用
最后提交信息为:
!23286
Update op_plugin commit id
预览版本
v7.1.RC1.alpha002-pytorch2.7.1
d33df55
2025-06-10 17:57
对比
v7.1.RC1.alpha002-pytorch2.7.1
dilililiwhy
• PyTorch 2.7.1适配预览版本(非正式版本),继承2.6.0特性,基于PrivateUse1特性,支持eager模式分布式、混合精度训练等基础能力 • 新增部分API支持及特性支持,暂未支持inductor相关功能,跟随社区切换为支持manylinux_2_28_x86_64 • 配套CANN 8.2.RC1.alpha002:https://www.hiascend.com/developer/download/community/result?module=cann
最后提交信息为:
!21657
Update op_plugin commit id
v6.0.0.1-pytorch2.4.0
38dc4ee
2025-05-06 22:30
对比
release v6.0.0.1-pytorch2.4.0
shaoyf
Bugfix • 本版本修复CVE-2025-32434漏洞 • 修复TASK_QUEUE_ENABLE=2时在部分场景内存被提前释放问题 • 修复_upsample_nearest_exact3d/_upsample_nearest_exac2d/_upsample_nearest_exact1d接口不兼容8.0.RC3 CANN版本的问题
最后提交信息为:
!20642
Add notice about legacy_load
v6.0.0.1-pytorch2.3.1
c77b8ae
2025-05-06 22:29
对比
release v6.0.0.1-pytorch2.3.1
shaoyf
Bugfix • 本版本修复CVE-2025-32434漏洞 • 修复TASK_QUEUE_ENABLE=2时在部分场景内存被提前释放问题 • 修复_upsample_nearest_exact3d/_upsample_nearest_exac2d/_upsample_nearest_exact1d接口不兼容8.0.RC3 CANN版本的问题
最后提交信息为:
!20641
Add notice about legacy_load
v6.0.0.1-pytorch2.1.0
2dd1e50
2025-05-06 22:28
对比
release v6.0.0.1-pytorch2.1.0
shaoyf
Bugfix • 本版本修复CVE-2025-32434漏洞 • 修复TASK_QUEUE_ENABLE=2时在部分场景内存被提前释放问题 • 修复_upsample_nearest_exact3d/_upsample_nearest_exac2d/_upsample_nearest_exact1d接口不兼容8.0.RC3 CANN版本的问题
最后提交信息为:
!20640
Add notice about legacy_load
预览版本
v7.0.RC1.alpha002-pytorch2.6.0
f8b422e
2025-04-28 11:52
对比
v7.0.RC1.alpha002-pytorch2.6.0
dilililiwhy
• PyTorch 2.6.0适配预览版本(非正式版本),继承2.5.1特性,基于PrivateUse1特性,支持eager模式分布式、混合精度训练等基础能力 • 新增部分API支持及特性支持,暂未支持inductor相关功能,跟随社区切换为支持manylinux_2_28_aarch64 • 配套CANN 8.1.RC1.alpha002:https://www.hiascend.com/developer/download/community/result?module=cann
最后提交信息为:
!20712
Add OWNERS
v7.0.0-pytorch2.5.1
9e105ea
2025-04-25 17:28
对比
release v7.0.0-pytorch2.5.1
shaoyf
一.新增说明 1. 新增特性 • Ascend Extension for PyTorch 新增torch_npu_run支持分级tcpstore和建链 • Ascend Extension for PyTorch 新增支持devicemesh,原生allgather和reducescatter接口支持不等长输入输出 • Ascend Extension for PyTorch 新增支持通过pg_options配置hccl通信域参数 • Ascend Extension for PyTorch 支持硬件延时故障感知和恢复 2. 新增二进制包 • Ascend Extension for PyTorch 新增发布abi=1二进制包 二.删除说明 无 三. 变更说明 1.接口变更说明 • 新增npu_cross_entropy_loss、npu_advance_step_flashattn和npu_group_norm_swish等自定义算子API;npu_rotary_mul新增支持rotary_mode入参 四. 已知问题 无 五. Bugfix • 修复AllGather入参为empty超时报错问题 • 修复HCCL_EVENT_TIMEOUT配置为0,op wait无法永不超时问题 • 修复alltoall算子临时tensor未释放内存上涨问题 六. 特殊声明 • 虚拟内存与单进程多卡需要在Ascend HDK 24.1.RC3以上的版本才能直接使用,其他版本不能共同使用 • 本版本修复CVE-2025-32434漏洞
最后提交信息为:
!20667
update torchair commitid 2.5.1
v7.0.0-pytorch2.4.0
6bcd427
2025-04-25 17:18
对比
release v7.0.0-pytorch2.4.0
shaoyf
一.新增说明 1. 新增特性 • Ascend Extension for PyTorch 新增torch_npu_run支持分级tcpstore和建链 • Ascend Extension for PyTorch 新增支持devicemesh,原生allgather和reducescatter接口支持不等长输入输出 • Ascend Extension for PyTorch 新增支持通过pg_options配置hccl通信域参数 • Ascend Extension for PyTorch 支持硬件延时故障感知和恢复 2. 新增二进制包 • Ascend Extension for PyTorch 新增发布abi=1二进制包 二.删除说明 无 三. 变更说明 1.接口变更说明 • 新增npu_cross_entropy_loss、npu_advance_step_flashattn和npu_group_norm_swish等自定义算子API;npu_rotary_mul新增支持rotary_mode入参 四. 已知问题 无 五. Bugfix • 修复AllGather入参为empty超时报错问题 • 修复HCCL_EVENT_TIMEOUT配置为0,op wait无法永不超时问题 • 修复alltoall算子临时tensor未释放内存上涨问题 六. 特殊声明 • 虚拟内存与单进程多卡需要在Ascend HDK 24.1.RC3以上的版本才能直接使用,其他版本不能共同使用 • 本版本修复CVE-2025-32434漏洞
最后提交信息为:
!20669
update torchair commitid 2.4.0
v7.0.0-pytorch2.3.1
eb3b35e
2025-04-25 17:10
对比
release v7.0.0-pytorch2.3.1
shaoyf
一.新增说明 1. 新增特性 • Ascend Extension for PyTorch 新增torch_npu_run支持分级tcpstore和建链 • Ascend Extension for PyTorch 新增支持devicemesh,原生allgather和reducescatter接口支持不等长输入输出 • Ascend Extension for PyTorch 新增支持通过pg_options配置hccl通信域参数 • Ascend Extension for PyTorch 支持硬件延时故障感知和恢复 2. 新增二进制包 • Ascend Extension for PyTorch 新增发布abi=1二进制包 二.删除说明 无 三. 变更说明 1.接口变更说明 • 新增npu_cross_entropy_loss、npu_advance_step_flashattn和npu_group_norm_swish等自定义算子API;npu_rotary_mul新增支持rotary_mode入参 四. 已知问题 无 五. Bugfix • 修复AllGather入参为empty超时报错问题 • 修复HCCL_EVENT_TIMEOUT配置为0,op wait无法永不超时问题 • 修复alltoall算子临时tensor未释放内存上涨问题 六. 特殊声明 • 虚拟内存与单进程多卡需要在Ascend HDK 24.1.RC3以上的版本才能直接使用,其他版本不能共同使用 • 本版本修复CVE-2025-32434漏洞
最后提交信息为:
!20668
update torchair commitid 2.3.1
下载
请输入验证码,防止盗链导致资源被占用
取消
下载
Python
1
https://gitee.com/ascend/pytorch.git
git@gitee.com:ascend/pytorch.git
ascend
pytorch
pytorch
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册