2.4K Star 8.2K Fork 4.4K

GVPMindSpore / mindspore

 / 详情

The result of Pangu3.0 in MindSpore 2.1 B060 forward process with model parallel 8 in one machine is all 0

DONE
Bug-Report 成员
创建于  
2023-07-17 09:32
name about labels
Bug Report Use this template for reporting a bug kind/bug

Describe the current behavior / 问题描述 (Mandatory / 必填)

The result of Pangu3.0 in MindSpore 2.1 B060 forward process with model parallel 8 in one machine is all 0. CANN version is B090. It works fine in 1980A, only happens in 1980B.

Environment / 环境信息 (Mandatory / 必填)

  • Hardware Environment(Ascend/GPU/CPU) / 硬件环境:
    Ascend 1980B

  • Software Environment / 软件环境 (Mandatory / 必填):
    -- MindSpore 2.1 B060
    -- CANN 6.3.RC2.B090

  • Excute Mode / 执行模式 (Mandatory / 必填)(PyNative/Graph):
    /mode graph

Related testcase / 关联用例 (Mandatory / 必填)

Steps to reproduce the issue / 重现步骤 (Mandatory / 必填)

Describe the expected behavior / 预期结果 (Mandatory / 必填)

Related log / screenshot / 日志 / 截图 (Mandatory / 必填)

Special notes for this issue/备注 (Optional / 选填)

评论 (4)

刘崇鸣 创建了Bug-Report

Please assign maintainer to check this issue.
请为此issue分配处理人。
@刘崇鸣

Please add labels (comp or sig), also you can visit https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md to find more.
为了让代码尽快被审核,请您为Pull Request打上 组件(comp)或兴趣组(sig) 标签,打上标签的PR可直接推送给责任人进行审核。
更多的标签可以查看https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md
以组件相关代码提交为例,如果你提交的是data组件代码,你可以这样评论:
//comp/data
当然你也可以邀请data SIG组来审核代码,可以这样写:
//sig/data
另外你还可以给这个PR标记类型,例如是bugfix或者是特性需求:
//kind/bug or //kind/feature
恭喜你,你已经学会了使用命令来打标签,接下来就在下面的评论里打上标签吧!

刘崇鸣 修改了描述
刘崇鸣 负责人设置为liuluobin
刘崇鸣 添加协作者刘崇鸣
刘崇鸣 优先级设置为主要
刘崇鸣 添加了
 
v2.1.0
标签
fangwenyi 里程碑设置为B-SIG-Parallel
fangwenyi 添加了
 
kind/bug
标签
liuluobin 添加协作者liuluobin
liuluobin 负责人liuluobin 修改为刘崇鸣
liuluobin 取消协作者刘崇鸣
wuweikang 里程碑B-SIG-Parallel 修改为B-SIG-MSLite
刘崇鸣 移除了
 
v2.1.0
标签
刘崇鸣 移除了
 
v2.1.0
标签
刘崇鸣 添加了
 
v2.2.0
标签
刘崇鸣 添加了
 
mindspore-cla/yes
标签
刘崇鸣 移除了
 
mindspore-cla/yes
标签
刘崇鸣 移除了
 
mindspore-cla/yes
标签
刘崇鸣 添加协作者刘崇鸣
刘崇鸣 负责人刘崇鸣 修改为liujunzhu
liujunzhu 添加协作者liujunzhu
liujunzhu 负责人liujunzhu 修改为chenkang
chenkang 里程碑B-SIG-MSLite 修改为B-ComponentTest
chenkang 添加了
 
ctl/componenttest
标签
chenkang 添加了
 
rca/algorithm
标签
chenkang 添加了
 
rct/bugfix
标签
chenkang 移除了
 
rct/bugfix
标签
chenkang 移除了
 
rct/bugfix
标签
chenkang 添加了
 
rct/newfeature
标签

1.根因分析
推理场景传给ge parameger个数不对
2.修改方法
只传ge需要的
3.提交PR
https://e.gitee.com/mind_spore/repos/mindspore/mindspore/pulls/57250
https://e.gitee.com/mind_spore/repos/mindspore/mindspore/pulls/57263
4.本地测试结果
PASS

是否需要补充st/ut:否
原因:910B网络调测

chenkang 任务状态TODO 修改为VALIDATION
chenkang 添加协作者chenkang
chenkang 负责人chenkang 修改为刘崇鸣
chenkang 取消协作者刘崇鸣
刘崇鸣 里程碑B-SolutionTest 修改为B-SIG-Parallel

盘古3.0 100B模型导出权重为0问题已解决,问题单关闭。输入图片说明

i-robot 添加了
 
foruda
标签
刘崇鸣 任务状态VALIDATION 修改为DONE

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(5)
8855362 a1051818459 1675908175 6579380 liuchongming74 1593503138
Python
1
https://gitee.com/mindspore/mindspore.git
git@gitee.com:mindspore/mindspore.git
mindspore
mindspore
mindspore

搜索帮助

344bd9b3 5694891 D2dac590 5694891