登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
登录
注册
代码拉取完成,页面将自动刷新
开源项目
>
数据库相关
>
数据库服务
&&
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
443
Star
1.5K
Fork
1.8K
openGauss
/
openGauss-server
代码
Issues
965
Pull Requests
165
Wiki
统计
流水线
服务
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
更新失败,请稍后重试!
移除标识
内容风险标识
本任务被
标识为内容中包含有代码安全 Bug 、隐私泄露等敏感信息,仓库外成员不可访问
【测试类型:存储功能】【测试版本:6.0.0】【可靠性】极致RTO,执行tpcc过程中,备机异常FATAL后stop
已验收
#IACMEO
缺陷
裴琳倩
创建于
2024-07-12 17:19
<!-- #请认真填写以下信息,否则可能由于无法定位,导致issue无法解决而被取消 --> 【标题描述】: 执行tpcc过程中,备机异常panic后stop 【测试类型:SQL功能】【测试版本:6.0.0】 极致RTO,执行tpcc过程中,备机异常panic后stop 【操作系统和硬件信息】(查询命令: cat /etc/system-release, uname -a): Kylin Linux Advanced Server release V10 (Sword) 【测试环境】(单机/1主x备x级联备): 一主两备 【被测功能】: tpcc功能 【测试类型】: 功能测试 【数据库版本】(查询命令: gaussdb -V): gaussdb (openGauss 6.0.0 build 211dba76) compiled at 2024-07-12 11:04:17 commit 0 last mr 【预置条件】: 1. 一主两备功能正常 2. enable_default_ustore_table = on 【操作步骤】(请填写详细的操作步骤): 1. tpcc建仓 2. 极致RTO配置 gs_guc set -N all -I all -c "replication_type=1" && gs_guc set -N all -I all -c "recovery_parse_workers=4" && gs_guc set -N all -I all -c "recovery_redo_workers=4" && gs_guc set -N all -I all -c "hot_standby=off" gs_om -t stop && gs_om -t start 3. tpcc执行 4. 查询主备状态 gs_om -t status --detail 【预期输出】: 1. tpcc建仓,成功 2. 极致RTO配置,成功 3. tpcc执行,成功 4. 查询主备状态,正常 【实际输出】: 1. tpcc建仓,成功 2. 极致RTO配置,成功 3. tpcc执行,成功 4. 查询主备状态,备机异常 【原因分析】: 1. 这个问题的根因 2. 问题推断过程 3. 还有哪些原因可能造成类似现象 4. 该问题是否有临时规避措施 5. 问题解决方案 6. 预计修复问题时间 【日志信息】(请附上日志文件、截图、coredump信息):  **未产生core,直接panic,pg日志如下:** ``` 2024-07-12 15:02:27.490 6690d4ed.6154 [unknown] 281465858011072 dn_6002 0 dn_6001_6002_6003 XX001 0 [BACKEND] FATAL: corrupted item pointer: 1114 2024-07-12 15:02:27.491 6690d4ed.6154 [unknown] 281465858011072 dn_6002 0 dn_6001_6002_6003 XX001 0 [BACKEND] CONTEXT: xlog redo at lsn 1/F3048A0, XLOG_UHEAP_CLEAN: remxid 0. XLZ_CLEAN_CONTAINS_OFFSET. offnum 46, spcreq 4. ndeleted: 0, ndead: 0, nunused: 0, flags: 3. 2024-07-12 15:02:27.491 6690d4ed.6154 [unknown] 281465858011072 dn_6002 0 dn_6001_6002_6003 XX001 0 [BACKEND] BACKTRACELOG: tid[144276]'s backtrace: /data/relia_app/relia0711/cluster/app/bin/gaussdb(+0xd83a18) [0xaaaae3676a18] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z9errfinishiz+0x4a4) [0xaaaae3669a14] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z24UPageRepairFragmentationP12RelationDataitmPbb+0x600) [0xaaaae4100650] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z26UHeapXlogCleanOperatorPageP14RedoBufferInfoPvS1_m+0xf4) [0xaaaae410cc44] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z18UHeapRedoDataBlockP13XLogBlockHeadP18XLogBlockDataParseP14RedoBufferInfo+0x1e4) [0xaaaae410ce84] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z26XLogBlockRedoForExtremeRTOP17XLogRecParseStateP14RedoBufferInfobR12RedoTimeCostS4_+0x28c) [0xaaaae40bef1c] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_ZN11extreme_rto18RedoPageWorkerMainEv+0x4e8) [0xaaaae3f8fe28] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_ZN11extreme_rto12RedoMainLoopEv+0x208) [0xaaaae3f93ae8] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_ZN11extreme_rto22ParallelRedoThreadMainEv+0x26c) [0xaaaae3f93d60] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z17GaussDbThreadMainIL15knl_thread_role22EEiP14knl_thread_arg+0x400) [0xaaaae3ba4990] /data/relia_app/relia0711/cluster/app/bin/gaussdb(+0x1285dc0) [0xaaaae3b78dc0] /usr/lib64/libpthread.so.0(+0x87ac) [0xffffa90027ac] /usr/lib64/libc.so.6(+0xd60fc) [0xffffa8f4a0fc] Use addr2line to get pretty function name and line 2024-07-12 15:02:27.491 6690d4ea.1 [unknown] 281473514876944 [unknown] 0 dn_6001_6002_6003 DB010 0 [REDO] LOG: page worker thread 281465858011072 exit, state 2 2024-07-12 15:02:27.491 [postmaster][reaper][281473514876944] LOG: aborting due to page redo process failure 2024-07-12 15:02:27.492 6690d4ea.1 [unknown] 281473514876944 [unknown] 0 dn_6001_6002_6003 00000 0 [BACKEND] LOG: page redo process (ThreadId 281465858011072) was terminated by signal 1: Hangup 2024-07-12 15:02:27.492 [postmaster][reaper][281473514876944] LOG: terminating any other active server processes 2024-07-12 15:02:27.492 [postmaster][reaper][281473514876944] LOG: page redo process (ThreadId 281465858011072) exited with exit code 0 2024-07-12 15:02:27.492 [postmaster][reaper][281473514876944] LOG: the server process exits ``` 【测试代码】:
<!-- #请认真填写以下信息,否则可能由于无法定位,导致issue无法解决而被取消 --> 【标题描述】: 执行tpcc过程中,备机异常panic后stop 【测试类型:SQL功能】【测试版本:6.0.0】 极致RTO,执行tpcc过程中,备机异常panic后stop 【操作系统和硬件信息】(查询命令: cat /etc/system-release, uname -a): Kylin Linux Advanced Server release V10 (Sword) 【测试环境】(单机/1主x备x级联备): 一主两备 【被测功能】: tpcc功能 【测试类型】: 功能测试 【数据库版本】(查询命令: gaussdb -V): gaussdb (openGauss 6.0.0 build 211dba76) compiled at 2024-07-12 11:04:17 commit 0 last mr 【预置条件】: 1. 一主两备功能正常 2. enable_default_ustore_table = on 【操作步骤】(请填写详细的操作步骤): 1. tpcc建仓 2. 极致RTO配置 gs_guc set -N all -I all -c "replication_type=1" && gs_guc set -N all -I all -c "recovery_parse_workers=4" && gs_guc set -N all -I all -c "recovery_redo_workers=4" && gs_guc set -N all -I all -c "hot_standby=off" gs_om -t stop && gs_om -t start 3. tpcc执行 4. 查询主备状态 gs_om -t status --detail 【预期输出】: 1. tpcc建仓,成功 2. 极致RTO配置,成功 3. tpcc执行,成功 4. 查询主备状态,正常 【实际输出】: 1. tpcc建仓,成功 2. 极致RTO配置,成功 3. tpcc执行,成功 4. 查询主备状态,备机异常 【原因分析】: 1. 这个问题的根因 2. 问题推断过程 3. 还有哪些原因可能造成类似现象 4. 该问题是否有临时规避措施 5. 问题解决方案 6. 预计修复问题时间 【日志信息】(请附上日志文件、截图、coredump信息):  **未产生core,直接panic,pg日志如下:** ``` 2024-07-12 15:02:27.490 6690d4ed.6154 [unknown] 281465858011072 dn_6002 0 dn_6001_6002_6003 XX001 0 [BACKEND] FATAL: corrupted item pointer: 1114 2024-07-12 15:02:27.491 6690d4ed.6154 [unknown] 281465858011072 dn_6002 0 dn_6001_6002_6003 XX001 0 [BACKEND] CONTEXT: xlog redo at lsn 1/F3048A0, XLOG_UHEAP_CLEAN: remxid 0. XLZ_CLEAN_CONTAINS_OFFSET. offnum 46, spcreq 4. ndeleted: 0, ndead: 0, nunused: 0, flags: 3. 2024-07-12 15:02:27.491 6690d4ed.6154 [unknown] 281465858011072 dn_6002 0 dn_6001_6002_6003 XX001 0 [BACKEND] BACKTRACELOG: tid[144276]'s backtrace: /data/relia_app/relia0711/cluster/app/bin/gaussdb(+0xd83a18) [0xaaaae3676a18] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z9errfinishiz+0x4a4) [0xaaaae3669a14] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z24UPageRepairFragmentationP12RelationDataitmPbb+0x600) [0xaaaae4100650] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z26UHeapXlogCleanOperatorPageP14RedoBufferInfoPvS1_m+0xf4) [0xaaaae410cc44] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z18UHeapRedoDataBlockP13XLogBlockHeadP18XLogBlockDataParseP14RedoBufferInfo+0x1e4) [0xaaaae410ce84] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z26XLogBlockRedoForExtremeRTOP17XLogRecParseStateP14RedoBufferInfobR12RedoTimeCostS4_+0x28c) [0xaaaae40bef1c] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_ZN11extreme_rto18RedoPageWorkerMainEv+0x4e8) [0xaaaae3f8fe28] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_ZN11extreme_rto12RedoMainLoopEv+0x208) [0xaaaae3f93ae8] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_ZN11extreme_rto22ParallelRedoThreadMainEv+0x26c) [0xaaaae3f93d60] /data/relia_app/relia0711/cluster/app/bin/gaussdb(_Z17GaussDbThreadMainIL15knl_thread_role22EEiP14knl_thread_arg+0x400) [0xaaaae3ba4990] /data/relia_app/relia0711/cluster/app/bin/gaussdb(+0x1285dc0) [0xaaaae3b78dc0] /usr/lib64/libpthread.so.0(+0x87ac) [0xffffa90027ac] /usr/lib64/libc.so.6(+0xd60fc) [0xffffa8f4a0fc] Use addr2line to get pretty function name and line 2024-07-12 15:02:27.491 6690d4ea.1 [unknown] 281473514876944 [unknown] 0 dn_6001_6002_6003 DB010 0 [REDO] LOG: page worker thread 281465858011072 exit, state 2 2024-07-12 15:02:27.491 [postmaster][reaper][281473514876944] LOG: aborting due to page redo process failure 2024-07-12 15:02:27.492 6690d4ea.1 [unknown] 281473514876944 [unknown] 0 dn_6001_6002_6003 00000 0 [BACKEND] LOG: page redo process (ThreadId 281465858011072) was terminated by signal 1: Hangup 2024-07-12 15:02:27.492 [postmaster][reaper][281473514876944] LOG: terminating any other active server processes 2024-07-12 15:02:27.492 [postmaster][reaper][281473514876944] LOG: page redo process (ThreadId 281465858011072) exited with exit code 0 2024-07-12 15:02:27.492 [postmaster][reaper][281473514876944] LOG: the server process exits ``` 【测试代码】:
评论 (
4
)
登录
后才可以发表评论
状态
已验收
待办的
已确认
已答复
已取消
挂起
修复中
已完成
待回归
测试中
已验收
负责人
未设置
wofanzheng
wofanzheng
负责人
协作者
+负责人
+协作者
yaoxin
wabct
负责人
协作者
+负责人
+协作者
Mijamind
quemingjian
负责人
协作者
+负责人
+协作者
标签
未设置
项目
未立项任务
未立项任务
里程碑
未关联里程碑
未关联里程碑
Pull Requests
未关联
未关联
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
未关联
分支 (20)
标签 (29)
master
7.0.0-RC2
6.0.0
datavec_poc
tp_poc
5.0.0
7.0.0-RC1
master_bak08271930
bugfix_0725
3.0.0
iud_dev
dev_board
5.1.0
kms
2.0.0
3.1.0
2.1.0
1.1.0
1.0.1
1.0.0
v6.0.2
v7.0.0-RC1
v6.0.1
v3.0.6
v6.0.0
v3.0.5B009
v5.0.3
v5.0.2
v6.0.0-RC1
v3.0.5
v5.0.1
v5.1.0
5.1.0
v5.0.0
v3.0.3
v3.1.1
v3.0.2
v3.1.0
v2.0.5
v3.0.1
v2.0.4
v2.0.3
v3.0.0
v2.1.0
v2.0.1
v2.0.0
v1.1.0
v1.0.1
v1.0.0
开始日期   -   截止日期
-
置顶选项
不置顶
置顶等级:高
置顶等级:中
置顶等级:低
优先级
不指定
严重
主要
次要
不重要
预计工期
(小时)
参与者(3)
C++
1
https://gitee.com/opengauss/openGauss-server.git
git@gitee.com:opengauss/openGauss-server.git
opengauss
openGauss-server
openGauss-server
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册