登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
AI 队友
登录
注册
轻量养虾,开箱即用!低 Token + 稳定算力,Gitee & 模力方舟联合出品的 PocketClaw 正式开售!点击了解详情
代码拉取完成,页面将自动刷新
仓库状态说明
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
15
Star
11
Fork
109
src-openEuler
/
systemd
关闭
代码
Issues
9
Pull Requests
2
Wiki
统计
流水线
服务
JavaDoc
PHPDoc
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
开发画像分析
我知道了,不再自动展开
更新失败,请稍后重试!
移除标识
内容风险标识
本任务被
标识为内容中包含有代码安全 Bug 、隐私泄露等敏感信息,仓库外成员不可访问
同时创建140+systemd的服务的时候systemd卡主,多个服务启动失败
已完成
#IAFI5I
缺陷
sweetbreeze
创建于
2024-07-25 14:32
**【标题描述】能够简要描述问题:说明什么场景下,做了什么操作,出现什么问题(尽量使用正向表达方式)** **一、缺陷信息** **内核信息:5.10.0-136.69.0.149.oe2203sp1.x86_64 **缺陷归属组件:systemd **缺陷归属的版本:systemd 249 (v249-64.oe2203sp1) **缺陷简述:systemctl 并行 start 142个service服务时卡住; - 如果有特殊组网,请提供网络拓扑信息 systemd服务: [Unit] Description=XXX daemon osd.%i After=network-online.target local-fs.target time-sync.target ceph-mon.target hik_fw.service Wants=network-online.target local-fs.target time-sync.target PartOf=ceph-osd.target [Service] LimitNOFILE=1048576 LimitNPROC=1048576 ExecStart=/usr/bin/daemon -f --cluster ${CLUSTER} --id %i --setuser ceph --setgroup ceph ExecStartPre=/usr/lib/ceph/test-prestart.sh --cluster ${CLUSTER} --id %i ExecStartPost=/usr/lib/ceph/test_coredump.sh -set %i ExecReload=/bin/kill -HUP $MAINPID ProtectHome=read-only ProtectSystem=full PrivateTmp=true #TasksMax=infinity Restart=always StartLimitInterval=20min StartLimitBurst=3 RestartSec=30s Nice=-20 [Install] WantedBy=ceph-osd.target 【问题复现步骤】: 1、CEPH在创建OSD的时候,脚本中会先执行systemctl reset-failed,然后并发创建140个OSD,每创建一个OSD新建一个进程,每个进程执行如下3条命令,并发开启进程创建OSD,每个并发进程超时时间是12分钟 a、systemctl reset-failed ceph-osd@.service ; b、systemctl disable ceph-osd@.service; c、systemctl start ceph-osd@.service 现像:问题必现 3次必现 (1)/usr/bin/systemd-tty-ask-password-agent --watch卡住 报错Failed to allocate directory watch: Too many open files (2)ExecStartPre=/usr/lib/ceph/ceph-osd-prestart.sh --cluster ${CLUSTER} --id %i 已执行完毕,但是systemd报start-pre timeout,但是实际进程中的pre的脚本已经执行完毕 (3)systemd同时并发142个服务是top查看 cpu 占用率100% (4)NetworkManager rsyslog polkit等dbus或notify类型服务有重启或变成inacivte 2、基于上面的1 ,继续修改,同样报错 将 systemctl start ceph-osd@.service 修改为 systemctl --no-ask-password start ceph-osd@.service (1)报错Failed to allocate directory watch: Too many open files消失 (2)同样ExecStartPre=/usr/lib/ceph/ceph-osd-prestart.sh --cluster ${CLUSTER} --id %i 已执行完毕,但是systemd报start-pre timeout (3)systemd同时并发142个服务是top查看 cpu 占用率100% (4)NetworkManager rsyslog polkit等dbus或notify类型服务有重启或变成inacivte仍然存在 3、基于上面的2 在创建OSD的脚本中,将全局systemctl reset-failed 去掉,原来每创建一个OSD需要执行 a、systemctl reset-failed ceph-osd@.service; b、systemctl disable ceph-osd@.service; c、systemctl start ceph-osd@.service 在这个实验中,去掉b systemctl disable ceph-osd@.service; 现象: 仍有失败 报错信息: 同样发现同样ExecStartPre=/usr/lib/ceph/ceph-osd-prestart.sh --cluster ${CLUSTER} --id %i 已执行完毕,但是systemd报 timeout Jul 25 14:24:31 node1 systemd[1]: [73517.567195] Failed to start Ceph object storage daemon osd.100. Jul 25 14:24:31 node1 systemd[1]: [73517.570330] ceph-osd@101.service: Failed with result 'timeout'. Jul 25 14:24:31 node1 systemd[1]: [73517.572295] Failed to start Ceph object storage daemon osd.101. Jul 25 14:24:31 node1 systemd[1]: [73517.574146] ceph-osd@103.service: Failed with result 'timeout'. Jul 25 14:24:31 node1 systemd[1]: [73517.584671] Failed to start Ceph object storage daemon osd.103. Jul 25 14:24:31 node1 systemd[1]: [73517.586701] ceph-osd@102.service: start-pre operation timed out. Terminating. Jul 25 14:24:31 node1 systemd[1]: [73517.588865] ceph-osd@104.service: Failed with result 'timeout'. Jul 25 14:24:31 node1 systemd[1]: [73517.597246] Failed to start Ceph object storage daemon osd.104. Jul 25 14:24:31 node1 systemd[1]: [73517.598634] ceph-osd@105.service: start-pre operation timed out. Terminating. Jul 25 14:24:31 node1 systemd[1]: [73517.599141] ceph-osd@106.service: start-pre operation timed out. Terminating. (3)systemd同时并发142个服务是top查看 cpu 占用率100%
**【标题描述】能够简要描述问题:说明什么场景下,做了什么操作,出现什么问题(尽量使用正向表达方式)** **一、缺陷信息** **内核信息:5.10.0-136.69.0.149.oe2203sp1.x86_64 **缺陷归属组件:systemd **缺陷归属的版本:systemd 249 (v249-64.oe2203sp1) **缺陷简述:systemctl 并行 start 142个service服务时卡住; - 如果有特殊组网,请提供网络拓扑信息 systemd服务: [Unit] Description=XXX daemon osd.%i After=network-online.target local-fs.target time-sync.target ceph-mon.target hik_fw.service Wants=network-online.target local-fs.target time-sync.target PartOf=ceph-osd.target [Service] LimitNOFILE=1048576 LimitNPROC=1048576 ExecStart=/usr/bin/daemon -f --cluster ${CLUSTER} --id %i --setuser ceph --setgroup ceph ExecStartPre=/usr/lib/ceph/test-prestart.sh --cluster ${CLUSTER} --id %i ExecStartPost=/usr/lib/ceph/test_coredump.sh -set %i ExecReload=/bin/kill -HUP $MAINPID ProtectHome=read-only ProtectSystem=full PrivateTmp=true #TasksMax=infinity Restart=always StartLimitInterval=20min StartLimitBurst=3 RestartSec=30s Nice=-20 [Install] WantedBy=ceph-osd.target 【问题复现步骤】: 1、CEPH在创建OSD的时候,脚本中会先执行systemctl reset-failed,然后并发创建140个OSD,每创建一个OSD新建一个进程,每个进程执行如下3条命令,并发开启进程创建OSD,每个并发进程超时时间是12分钟 a、systemctl reset-failed ceph-osd@.service ; b、systemctl disable ceph-osd@.service; c、systemctl start ceph-osd@.service 现像:问题必现 3次必现 (1)/usr/bin/systemd-tty-ask-password-agent --watch卡住 报错Failed to allocate directory watch: Too many open files (2)ExecStartPre=/usr/lib/ceph/ceph-osd-prestart.sh --cluster ${CLUSTER} --id %i 已执行完毕,但是systemd报start-pre timeout,但是实际进程中的pre的脚本已经执行完毕 (3)systemd同时并发142个服务是top查看 cpu 占用率100% (4)NetworkManager rsyslog polkit等dbus或notify类型服务有重启或变成inacivte 2、基于上面的1 ,继续修改,同样报错 将 systemctl start ceph-osd@.service 修改为 systemctl --no-ask-password start ceph-osd@.service (1)报错Failed to allocate directory watch: Too many open files消失 (2)同样ExecStartPre=/usr/lib/ceph/ceph-osd-prestart.sh --cluster ${CLUSTER} --id %i 已执行完毕,但是systemd报start-pre timeout (3)systemd同时并发142个服务是top查看 cpu 占用率100% (4)NetworkManager rsyslog polkit等dbus或notify类型服务有重启或变成inacivte仍然存在 3、基于上面的2 在创建OSD的脚本中,将全局systemctl reset-failed 去掉,原来每创建一个OSD需要执行 a、systemctl reset-failed ceph-osd@.service; b、systemctl disable ceph-osd@.service; c、systemctl start ceph-osd@.service 在这个实验中,去掉b systemctl disable ceph-osd@.service; 现象: 仍有失败 报错信息: 同样发现同样ExecStartPre=/usr/lib/ceph/ceph-osd-prestart.sh --cluster ${CLUSTER} --id %i 已执行完毕,但是systemd报 timeout Jul 25 14:24:31 node1 systemd[1]: [73517.567195] Failed to start Ceph object storage daemon osd.100. Jul 25 14:24:31 node1 systemd[1]: [73517.570330] ceph-osd@101.service: Failed with result 'timeout'. Jul 25 14:24:31 node1 systemd[1]: [73517.572295] Failed to start Ceph object storage daemon osd.101. Jul 25 14:24:31 node1 systemd[1]: [73517.574146] ceph-osd@103.service: Failed with result 'timeout'. Jul 25 14:24:31 node1 systemd[1]: [73517.584671] Failed to start Ceph object storage daemon osd.103. Jul 25 14:24:31 node1 systemd[1]: [73517.586701] ceph-osd@102.service: start-pre operation timed out. Terminating. Jul 25 14:24:31 node1 systemd[1]: [73517.588865] ceph-osd@104.service: Failed with result 'timeout'. Jul 25 14:24:31 node1 systemd[1]: [73517.597246] Failed to start Ceph object storage daemon osd.104. Jul 25 14:24:31 node1 systemd[1]: [73517.598634] ceph-osd@105.service: start-pre operation timed out. Terminating. Jul 25 14:24:31 node1 systemd[1]: [73517.599141] ceph-osd@106.service: start-pre operation timed out. Terminating. (3)systemd同时并发142个服务是top查看 cpu 占用率100%
评论 (
2
)
登录
后才可以发表评论
状态
已完成
待办的
已挂起
修复中
已确认
已完成
已验收
已取消
负责人
未设置
胡宇彪
huyubiao
负责人
协作者
+负责人
+协作者
标签
sig/Base-service
未设置
项目
未立项任务
未立项任务
里程碑
未关联里程碑
未关联里程碑
Pull Requests
未关联
未关联
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
未关联
分支 (
-
)
标签 (
-
)
开始日期   -   截止日期
-
置顶选项
不置顶
置顶等级:高
置顶等级:中
置顶等级:低
优先级
不指定
严重
主要
次要
不重要
预计工期
(小时)
参与者(3)
1
https://gitee.com/src-openeuler/systemd.git
git@gitee.com:src-openeuler/systemd.git
src-openeuler
systemd
systemd
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册