398 Star 1.4K Fork 1.5K

GVPopenGauss / openGauss-server

 / 详情

【资源池化】开启按需回放,触发failover,在cm_ctl query查询到备升主成功后重启集群,一直卡在starting状态

已验收
缺陷
创建于  
2023-06-25 11:13

【标题描述】:开启按需回放,触发failover,在cm_ctl query查询到备升主成功后重启集群,一直卡在starting状态
【测试类型:SQL功能/存储功能/接口功能/工具功能/性能/并发/压力长稳/故障注入/安全/资料/编码规范】【测试版本:2.0.0】 问题描述

【操作系统和硬件信息】(查询命令: cat /etc/system-release, uname -a):
openEuler release 20.03 (LTS)
Linux sharedstore002 4.19.90-2003.4.0.0036.oe1.x86_64 #1 SMP Mon Mar 23 19:10:41 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux

【测试环境】(单机/1主x备x级联备):
一主两备资源池化环境

【被测功能】:
failover按需回放

【测试类型】:
按需回放

【数据库版本】(查询命令: gaussdb -V):
gaussdb (openGauss 5.1.0 build a74b7333) compiled at 2023-06-19 09:40:28 commit 0 last mr

【预置条件】:
replication_type=1
recovery_parse_workers=4
recovery_redo_workers=4
hot_standby=off
ss_enable_ondemand_recovery=true
ss_ondemand_recovery_mem_size=25GB

【操作步骤】(请填写详细的操作步骤):

  1. 主机跑读写业务,备机跑只读业务
  2. 主节点mv gaussdb gaussdb_bak
  3. 主节点kill -9 gaussdb
  4. 等待备机升主,cm_ctl query查询备机状态为normal
  5. 主节点执行mv gaussdb_bak gaussdb
  6. cm_ctl stop && cm_ctl start

【预期输出】:
集群启动成功

【实际输出】:
集群状态一直为starting状态

【原因分析】:
备机任处于按需回放状态,这个时候拉起原主会出现如下状况:
1、原主等备机恢复
2、备机等原主拉起才恢复
这样就进入了死循环

【日志信息】(请附上日志文件、截图、coredump信息):
原主日志:
输入图片说明

【测试代码】:

评论 (3)

zhaobingyu 创建了缺陷

Hey @zhaobingyu, Welcome to openGauss Community.
All of the projects in openGauss Community are maintained by @opengauss_bot.
That means the developers can comment below every pull request or issue to trigger Bot Commands.
Please follow instructions at Here to find the details.

Hi @zhaobingyu, please use the command /sig xxx to add a SIG label to this issue.
For example: /sig sqlengine or /sig storageengine or /sig om or /sig ai and so on.
You can find more SIG labels from Here.
If you have no idea about that, please contact with @xiangxinyong , @zhangxubo .

zhaobingyu 负责人设置为陈栋
zhaobingyu 优先级设置为次要
zhaobingyu 修改了标题
zhaobingyu 修改了描述
陈栋 任务状态待办的 修改为修复中
陈栋 通过opengauss/openGauss-server Pull Request !3684任务状态修复中 修改为已完成

验证版本:
gaussdb (openGauss 5.1.0 build eb703b1a) compiled at 2023-08-18 11:01:50 commit 0 last mr
备机在redo阶段,启动集群,验证结果:
输入图片说明
原主没有被拉起,备机全部启动成功,符合预期

zhaobingyu 任务状态已完成 修改为待回归
zhaobingyu 任务状态待回归 修改为测试中
zhaobingyu 任务状态测试中 修改为已验收

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(2)
13084139 opengauss bot 1686829535
C++
1
https://gitee.com/opengauss/openGauss-server.git
git@gitee.com:opengauss/openGauss-server.git
opengauss
openGauss-server
openGauss-server

搜索帮助