16 Star 4 Fork 52

src-openEuler/rdma-core

 / 详情

修复触发TDP EXTQ WBUF RAM ras后global复位FPGA挂死问题

已完成
缺陷
创建于  
2022-12-13 09:25

【标题描述】能够简要描述问题:说明什么场景下,做了什么操作,出现什么问题(尽量使用正向表达方式)
在FPGA环境下,触发TDP EXTQ WBUF RAM ras global复位导致环境挂死。
【环境信息】
硬件信息:
1) FPGA
软件信息:
1) Openeuler 22.03
【问题复现步骤】
具体操作步骤
1、ras注错
hiarmtooldfxpro reg -i enp53s0f0 -a 0x11000b08 -v 0x0
hiarmtooldfxpro reg -i enp53s0f0 -a 0x11000b08 -v 0x2
2、roce业务环回
ib_write_bw -d hns_0 -x 2 -n 5000 -q 500 &
ib_write_bw -d hns_0 -x 2 -n 5000 -q 500 192.168.200.100 &
出现概率(是否必现,概率性错误)
必现
【预期结果】
触发 ras 后复位成功,环境无异常
【实际结果】
正常触发 ras 复位后环境挂死
【附件信息】
[图片上传中…(image-f3oJPhY9sAkfNRRanNo5)]

评论 (2)

zhouj 创建了缺陷 2年前
openeuler-ci-bot 添加了
 
sig/sig-high-perform
标签
2年前

原场景验证结果如下:
版本信息
输入图片说明
触发 ras 和 perftest 业务指令
ib_write_bw -d hns_0 -x 2 -n 5000 -q 500 &
ib_write_bw -d hns_0 -x 2 -n 5000 -q 500 192.168.200.100 &
输入图片说明
结果:正常
输入图片说明
输入图片说明

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(2)
5329419 openeuler ci bot 1632792936 zhouj-stinft
1
https://gitee.com/src-openeuler/rdma-core.git
git@gitee.com:src-openeuler/rdma-core.git
src-openeuler
rdma-core
rdma-core

搜索帮助