1 Star 1 Fork 2

chpiter / ceph_study

forked from 王鹏飞 / ceph_study 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
mon监控埋点指标.md 6.27 KB
一键复制 编辑 原始数据 按行查看 历史
Lucien 提交于 2018-09-13 19:13 . Update mon监控埋点指标.md

1. perf dump

1.1 cluster

监控类型 监控项 说明 级别
perf dump cluster ceph.cluster.num_mon mon数量
* ceph.cluster.num_mon_quorum 法定mon数量
* ceph.cluster.num_osd 集群osd节点数量
* ceph.cluster.num_osd_up up状态的osd节点数量
* ceph.cluster.num_osd_in in状态的osd节点数量
* osd_epoch osd的epoch号
* ceph.cluster_total_objects 集群objects总数
* ceph.cluster.num_pg 集群pg总数
* ceph.cluster.num_pg_peering 长时间存在peering的pg
* ceph.cluster.num_pool 集群pool数量
* ceph.cluster_total_objects 集群objects数量
* ceph.cluster.num_mon 集群mon节点数
* ceph.cluster.num_mds_up up状态mds数量
* ceph.cluster.num_mds_in in状态mds数量
* ceph.cluster.num_mds_failed failed状态mds数量
* ceph.cluster.osd_bytes osd总共大小
* ceph.cluster.osd_bytes_used 用户占用大小
* ceph.cluster.osd_bytes_avail osd可用的大小

1.2 leveldb

监控类型 监控项 说明 级别
perf dump leveldb ceph.leveldb.leveldb_get 获取的数量
* ceph.leveldb.leveldb_transaction 处理的数量
* ceph.leveldb.leveldb_get_latency.avgcount 获取延迟队列里面的平均数量
* ceph.leveldb.leveldb_get_latency.sum 获取延迟队列里面的总数
* ceph.leveldb.leveldb_submit_latency.avgcount 提交延迟队列里面的平均数量
* ceph.leveldb.leveldb_submit_latency.sum 提交延迟队列里面的总数
* ceph.leveldb.leveldb_submit_latency.avgcount 提交延迟队列里面的平均数量
* ceph.leveldb.leveldb_submit_latency.sum 提交延迟队列里面的总数
* ceph.leveldb.leveldb_submit_sync_latency.avgcount 提交同步延迟队列里面的平均数量
* ceph.leveldb.leveldb_submit_sync_latency.sum 提交同步延迟队列里面的总数
* ceph.leveldb.leveldb_compact 压缩
* ceph.leveldb.leveldb_compact_range 压缩范围
* ceph.leveldb.leveldb_compact_queue_merge 压缩合并队列
* ceph.leveldb.leveldb_compact_queue_len 压缩队列长度

1.3 mon

监控类型 监控项 说明 级别
perf dump mon ceph.mon.num_sessions 当前打开的监视器会话数
* ceph.mon.sessions_add 创建监视器会话数
* ceph.mon.sessions_rm 监视器中删除会话调用的次数
* ceph.mon.sessions_trim 调整监视器会话数
* ceph.mon.num_elections 选举监察员数量
* ceph.mon.election_cal 由监视器启动的选举数
* ceph.mon.election_win 选举赢得选举数
* ceph.mon.election_lose 选举流失的选举数

1.4 paxos

监控类型 监控项 说明 级别
perf dump paxos ceph.paxos.start_leader 启动leader角色
* ceph.paxos.start_peon 启动peon角色
* ceph.paxos.restart 重启数
* ceph.paxos.refresh 刷新
* ceph.paxos.refresh 刷新
* ceph.paxos.refresh_latency.avgcount 延迟刷新平均数
* ceph.paxos.refresh_latency.sum 延迟刷新总数
* ceph.paxos.begin 开始处理
* ceph.paxos.begin_keys.avgcount 开始处理keys的平均数量
* ceph.paxos.begin_keys.sum 开始处理keys的总数
* ceph.paxos.begin_bytes.avgcount 开始处理bytes的平均数量
* ceph.paxos.begin_bytes.sum 开始处理bytes的总数
* ceph.paxos.begin_latency.avgcount 开始处理延迟的平均数量
* ceph.paxos.begin_latency.sum 开始处理延迟的总数
* ceph.paxos.commit 提交数
* ceph.paxos.commit_keys.avgcount 提交keys的平均数量
* ceph.paxos.commit_keys.sum 提交keys的总数
* ceph.paxos.commit_latency.avgcount 提交延迟的平均数量
* ceph.paxos.commit_latency.sum 提交延迟的总数
* ceph.paxos.collect 收集
* ceph.paxos.collect_keys.avgcount 收集的keys的平均数量
* ceph.paxos.collect_keys.sum 收集的keys的总数
* ceph.paxos.collect_bytes.avgcount 收集的bytes数的平均数量
* ceph.paxos.collect_bytes.sum 收集的bytes数的总数
* ceph.paxos.collect_latency.avgcount 收集延迟平均数量
* ceph.paxos.collect_latency.sum 收集延迟总数
* ceph.paxos.collect_uncommitted
* ceph.paxos.collect_timeout 收集超时时间
* ceph.paxos.accept_timeout 接受超时时间
* ceph.paxos.lease_ack_timeout 租约确认超时时间
* ceph.paxos.lease_timeout 租约超时时间
* ceph.paxos.store_state 存储的状态
* ceph.paxos.store_state_keys.avgcount 存储状态中的事务密钥平均数
* ceph.paxos.store_state_keys.sum 存储状态中的事务密钥总数
* ceph.paxos.store_state_bytes.avgcount 存储状态中事务中的数据的平均数
* ceph.paxos.store_state_bytes.sum 存储状态中事务中的数据的总数
* ceph.paxos.store_state_latency.avgcount 存储状态延迟平均数
* ceph.paxos.store_state_latency.sum 存储状态延迟总数
* ceph.paxos.share_state 共享状态
* ceph.paxos.share_state_keys.avgcount 共享状态的keys的平均数
* ceph.paxos.share_state_keys.sum 共享状态的keys的总数
* ceph.paxos.share_state_bytes.avgcount 共享状态数据平均数
* ceph.paxos.share_state_bytes.sum 共享状态数据总数
* ceph.paxos.new_pn 新建提议号询问
* ceph.paxos.new_pn_latency.avgcount 新建提议号询问等待时间的平均数量
* ceph.paxos.new_pn_latency.sum 新建提议号询问等待时间的总数

1.5 throttle

监控类型 监控项 说明 级别
perf dump throttle-* val 当前可用的值
* max 最大限制数
* get 获取到的值
* get_sum 获取到的总数
* get_or_fail_fail 获取或者错误值
* get_or_fail_success 获取或者错误成功值
* take 接受值
* take_sum 接受总数
* put 推送值
* put_sum 推送总数
* wait.avgcount 等待平均数量
* wait.sum 等待总数
1
https://gitee.com/chpiter/ceph_study.git
git@gitee.com:chpiter/ceph_study.git
chpiter
ceph_study
ceph_study
master

搜索帮助

53164aa7 5694891 3bd8fe86 5694891