# aps-view **Repository Path**: yuanshengjun/aps-view ## Basic Information - **Project Name**: aps-view - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-10-31 - **Last Updated**: 2024-10-31 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 基础视图 ![](img/application-basic/1.png) ### 运行时间 (Running Time) - **数值**: 1.1周 - **说明**: 系统已经连续运行了大约1.1周。 ### 启动时间 (Startup Time) - **日期和时间**: 2024年10月23日 18:45:40 - **说明**: 系统在上述日期和时间启动。 ### 最大堆内存使用率 (Maximum Usage Rate of Heap) - **百分比**: 48.2% - **说明**: 在系统运行期间,最大堆内存使用率达到过48.2%。 ### 当前堆内存使用率 (Latest Usage Rate of Heap) - **百分比**: 19.7% - **说明**: 当前堆内存的使用率为19.7%。 ### 非堆内存使用率 (Usage Rate of Non-Heap) - **百分比**: 20.4% - **说明**: 当前非堆内存的使用率为20.4%。 ### 运行状态 (Running Time Status) - **图表类型**: 柱状图 - **X轴**: 时间(从10:00到次日08:00) - **Y轴**: 状态(On/Off) - **说明**: 图表显示了系统在过去一天中的运行状态。绿色表示系统处于“开启”状态,没有出现“关闭”状态。 ### 系统平均负载 (System Average Load) - **图表类型**: 折线图 - **X轴**: 时间(从12:00到次日08:00) - **Y轴**: 负载值 - **数据**: - **最小值 (min)**: 0 - **最大值 (max)**: 1.12 - **平均值 (avg)**: 0.128 - **当前值 (current)**: 0.130 - **CPU核心数**: - **最小值 (min)**: 8 - **最大值 (max)**: 8 - **平均值 (avg)**: 8 - **当前值 (current)**: 8 - **说明**: 图表显示了系统过去一段时间内的平均负载情况。负载值较低,表明系统运行较为平稳,没有出现高负载的情况。 总结: - 系统已稳定运行超过一周,启动时间为2024年10月23日18:45:40。 - 堆内存的最大使用率为48.2%,当前为19.7%;非堆内存的使用率为20.4%。 - 系统在过去一天内一直处于开启状态,未出现关闭情况。 - 系统的平均负载较低,最高达到1.12,当前为0.130,表明系统运行较为平稳。 ![](img/application-basic/2.png) ### Usage Rate of CPU(CPU使用率) - **Y轴**:表示CPU使用率百分比。 - **X轴**:表示时间,从12:00到次日8:00。 指标说明: - **绿色线**:代表系统级别的CPU使用率(System CPU Usage)。 - **黄色线**:代表特定进程的CPU使用率(Process CPU Usage)。 ### Number of Open Files Being Processed(正在处理的打开文件数量) - **Y轴**:表示正在处理的打开文件的数量。 - **X轴**:表示时间,从12:00到次日8:00。 指标说明: - **绿色线**:代表当前正在处理的打开文件数量(Open Files)。 - **橙色线**:代表最大允许的打开文件数量(Max Files),在这个例子中是100,000个文件。 ![](img/application-basic/3.png) ### G1 Eden Space (heap) - **Y轴**: 内存大小,单位为MiB。 - **X轴**: 时间,从12:00到次日8:00。 指标说明: 1. **绿色线**: 用于空间的实际使用量(Used)。 2. **黄色线**: 承诺的空间大小(Committed)。 ### G1 Old Gen (heap) - **Y轴**: 内存大小,单位为MiB。 - **X轴**: 时间,从12:00到次日8:00。 指标说明: - **绿色线**: 用于空间的实际使用量(Used)。 - **黄色线**: 承诺的空间大小(Committed)。 ### G1 Survivor Space (heap) - **Y轴**: 内存大小,单位为MiB。 - **X轴**: 时间,从12:00到次日8:00。 指标说明: - **绿色线**: 用于空间的实际使用量(Used)。 - **黄色线**: 承诺的空间大小(Committed)。 ### CodeHeap 'non-nmethods' (non-heap) - **Y轴**: 内存大小,单位为MiB。 - **X轴**: 时间,从16:00到次日8:00。 指标说明: - **绿色线**: 实际使用的非堆内存(Used)。 - **黄色线**: 承诺的非堆内存(Committed)。 ### CodeHeap 'non-profiled nmethods' (non-heap) - **Y轴**: 内存大小,单位为MiB。 - **X轴**: 时间,从16:00到次日8:00。 指标说明: - **绿色线**: 实际使用的非堆内存(Used)。 - **黄色线**: 承诺的非堆内存(Committed)。 ### CodeHeap 'profiled nmethods' (non-heap) - **Y轴**: 内存大小,单位为MiB。 - **X轴**: 时间,从16:00到次日8:00。 指标说明: - **绿色线**: 实际使用的非堆内存(Used)。 - **黄色线**: 承诺的非堆内存(Committed)。 ### Compressed Class Space (non-heap) - **Y轴**: 内存大小,单位为MiB。 - **X轴**: 时间,从16:00到次日8:00。 指标说明: - **绿色线**: 实际使用的压缩类空间(Used)。 - **黄色线**: 承诺的压缩类空间(Committed)。 ![](img/application-basic/4.png) ### Metaspace (non-heap) - **Y轴**: 表示元空间的内存使用量,单位为MiB。 - **X轴**: 表示时间,从16:00到次日8:00。 指标说明: - **绿色线**: 实际使用的元空间内存(Used)。 - **黄色线**: 元空间承诺的内存容量(Commited)。 ### JVM Buffer Pool Memory Usage in Bytes (Mapped) - **Y轴**: 表示映射缓冲池的内存使用量。 - **X轴**: 表示时间,从12:00到次日8:00。 指标说明: - **绿色线**: 使用的字节数(Used Bytes)。 - **黄色线**: 容量字节数(Capacity Bytes)。 ### JVM Buffer Pool Memory Usage in Bytes (Direct) - **Y轴**: 表示直接缓冲池的内存使用量,单位为千字节 (Mil)。 - **X轴**: 表示时间,从12:00到次日8:00。 指标说明: - **绿色线**: 使用的字节数(Used Bytes)。 - **黄色线**: 容量字节数(Capacity Bytes)。 ### Total Number of Unloaded Classes in JVM - **Y轴**: 表示已卸载的类总数,单位未知。 - **X轴**: 表示时间,从12:00到次日8:00。 指标说明: - **绿色线**: 卸载的类总数(Classes Unloaded)。 ![](img/application-basic/5.png) ### Total Number of Loaded Classes in JVM - **Y轴**:已加载类的总数。 - **X轴**:时间,从12:00到次日8:00。 指标说明: - 绿色线:表示已加载类的总数。 ### Current Number of Threads in JVM - **Y轴**:当前线程数。 - **X轴**:时间,从12:00到次日8:00。 指标说明: - 黄色线:表示守护线程数(Daemon Threads)。 - 蓝色线:表示活动线程数(Active Threads)。 ### Memory Space Allocated During GC - **Y轴**:垃圾回收期间分配的内存空间,单位为MiB。 - **X轴**:时间,从12:00到次日8:00。 指标说明: - 绿色线:表示年轻代生成的内存空间(Young Generation)。 - 黄色线:表示老年代生成的内存空间(Old Generation)。 ### Status of JVM Thread - **Y轴**:线程状态的数量。 - **X轴**:时间,从12:00到次日8:00。 指标说明: - 红色线:表示阻塞的线程数(Blocked)。 - 黄色线:表示新创建的线程数(New)。 ![](img/application-basic/6.png) ### Peak Thread Size in Druid - 线程的最大数量。 ### Number of Waiting Threads in Druid - 等待中的线程数量。 ### Number of Current Sessions in Tomcat - **Y轴**: 当前会话的数量。 - **X轴**: 时间,从10:00到次日8:00。 指标说明: - **绿色线**: 表示活跃会话的数量。在这段时间内,活跃会话的数量一直为0。 ### Number of Connections in Druid Thread Pool - **Y轴**: 连接的数量。 - **X轴**: 时间,从10:00到次日8:00。 指标说明: - **绿色线**: 表示连接的数量(connections)。在这段时间内,连接的数量一直为0。 ![](img/application-basic/7.png) ### Number of Transactions Initiated by Druid - **Y轴**: 事务数量。 - **X轴**: 时间,从12:00到次日8:00。 指标说明: - **绿色线**: Druid发起的事务数量。 ### Number of Commits in Druid - **Y轴**: 提交次数。 - **X轴**: 时间,从12:00到次日8:00。 指标说明: - **绿色线**: Druid中的提交次数。 ### Number of Rollbacks in Druid - **Y轴**: 回滚次数。 - **X轴**: 时间,从12:00到次日8:00。 指标说明: - **绿色线**: Druid中的回滚次数。 ![](img/application-basic/8.png) ### Maximum Number of Active Sessions in Tomcat - 表示活动会话的最大数量。 ### Total Number of Rejected Sessions in Tomcat - **Y轴**: 表示被拒绝的会话总数。 - **X轴**: 表示时间,从10:00到次日8:00。 指标说明: - **绿色线**: 表示被拒绝的会话数量(rejected)。 ![](img/application-basic/9.png) ### 当前线程数(Current Number of Threads) - **X轴**:时间,从12:00到次日8:00。 - **Y轴**:当前线程数。 这个图表显示了两个线程池在指定时间段内的当前线程数变化情况。apm-event-executor 的线程数保持稳定,而aps-boot-executor 的线程数为零。 ### 当前线程数(Current Number of Threads) - **X轴**:时间,从12:00到次日8:00。 - **Y轴**:当前线程数。 这个图表显示了一个线程池在指定时间段内的当前线程数变化情况。 ### 当前线程活动数(Current Active Number of Threads) - **X轴**:时间,从16:00到次日8:00。 - **Y轴**:当前线程活动数。 这个图表显示了apm-event-executor线程池在指定时间段内的当前线程活动数变化情况。 ### 当前队列中的任务数(Number of Tasks in the Current Queue) - **X轴**:时间,从16:00到次日8:00。 - **Y轴**:当前队列中的任务数。 这个图表显示了apm-event-executor 线程池在指定时间段内当前队列中的任务数变化情况。 ### 线程计数的增长率(Growth Rate of Thread Count) - **X轴**:时间,从16:00到次日8:00。 - **Y轴**:线程计数的增长率。 这个图表显示了一个线程池在指定时间段内线程计数的增长率变化情况。 ### 线程池的最大线程数(Thread Pool's Maximum Thread Count) - **X轴**:时间,从16:00到次日8:00。 - **Y轴**:线程池的最大线程数。 这个图表显示了一个线程池在指定时间段内最大线程数的变化情况。 ## 主机视图 ![](img/host/1.png) 1. **Hostname**: 主机名。 2. **IP**: 主机的IP地址和端口号。 3. **Uptime**: 系统运行时间(以周或年为单位)。 4. **Health**: 健康状态百分比,表示系统整体健康状况。 5. **Memory**: 内存使用量(GiB),即千兆字节。 6. **Cores**: CPU核心数。 7. **5m Load**: 5分钟内的平均负载。 8. **CPU Usage**: CPU使用率百分比。 9. **I/O Usage**: 输入/输出使用率百分比。 10. **Partition Usage**: 分区使用率百分比。 11. **Disk Read**: 每秒读取磁盘的数据量(KiB/s 或 MiB/s)。 12. **Disk Write**: 每秒写入磁盘的数据量(KiB/s 或 MiB/s)。 13. **TCP Estab**: TCP连接数量。 这些指标可以帮助管理员监控系统的各项性能,并及时发现潜在的问题。例如: - 如果某个主机的**Health**值较低,可能需要进一步检查其硬件或软件问题。 - 如果**CPU Usage**或**I/O Usage**过高,可能表明该主机正在处理大量任务,可能导致性能瓶颈。 - 如果**Disk Read**或**Disk Write**数据量过大,可能表明磁盘IO成为瓶颈。 ![](img/host/2.png) ### Overall total 5m load & average CPU used% - **X轴**: 时间。 - **Y轴**: - 左侧:总体平均使用率(Overall average used%) - 右侧:CPU内核数(CPU Cores) 这个图表显示了过去5分钟内的平均CPU使用率和总的CPU内核数的变化趋势。 ### Overall total memory & average memory used% - **X轴**: 时间。 - **Y轴**: - 左侧:内存总量(Total) - 右侧:总体平均使用率(Overall Average Used%) 这个图表显示了总内存容量及其平均使用率随时间变化的情况。 ### Overall total disk & average disk used% - **X轴**: 时间。 - **Y轴**: - 左侧:磁盘总量(Total) - 右侧:总体平均使用率(Overall Average Used%) 这个图表显示了总磁盘空间及其平均使用率随时间变化的情况。 ### CPU Busy - 显示了CPU繁忙程度,当前为0.7%。 ### Used RAM Memory - 显示了已使用的RAM内存比例,当前为24.3%。 ### Used Max Mount (/data) - 显示了/data分区的最大挂载点使用情况,当前为14.4%。 ### Used SWAP - 显示了交换空间的使用情况,当前为0.1%。 ### Disk Space Used Basic(EXT.* / XFS/NFS) - 列表形式展示各设备、文件系统类型、挂载位置、可用空间、已用空间等信息。 ### Open File Descriptor(left)/Context switches(right) - **X轴**: 时间戳,从左到右表示时间的推移。 - **Y轴**: - 左侧:打开的文件描述符总数(Total open fd) - 右侧:上下文切换次数(switches) 这个图表显示了打开的文件描述符总数和上下文切换次数随时间变化的情况。 ### 其他信息 - **Uptime**: 系统运行时长,当前为42.1周。 - **CPU Cores**: CPU内核数,当前为8个。 - **Total RAM**: 总RAM大小,当前为31 GiB。 - **CPU iowait**: CPU等待I/O操作的时间占比,当前为0.01%。 - **Total filefd**: 文件描述符总数,当前为1024000。 - **Total open fd**: 打开的文件描述符总数,当前为102400。 ![](img/host/3.png) ### CPU 使用率 - **Y轴**:CPU 使用率(%) - **X轴**:时间(小时) - **指标**: - **System**:系统进程占用的 CPU 百分比。 - **User**:用户进程占用的 CPU 百分比。 - **IOwait**:由于 I/O 请求而处于等待状态的 CPU 百分比。 ### 内存使用情况 - **Y轴**:内存使用率(%) - **X轴**:时间(小时) - **指标**: - **Total**:总内存使用量(GiB)。 - **Used**:已使用的内存(GiB)。 - **Available**:可用内存(GiB)。 ### 网络带宽上传或下载速率 - **Y轴**:速率(kb/s) - **X轴**:时间(小时) - **指标**: - **ens192_in Download**:接口 ens192 的下载速率(kb/s)。 - **ens192_out Upload**:接口 ens192 的上传速率(kb/s)。 ![](img/host/4.png) ### System Load - **X轴**: 表示时间,范围是从08:40到08:45。 - **Y轴**: 表示系统负载,单位是load units。 - **指标**: - **Min**: 最小值 - **Max**: 最大值 - **Mean**: 平均值 - **Last**: 最近一次测量值 ### Process Stats - **X轴**: 表示时间,范围是从08:40到08:45。 - **Y轴**: 表示进程统计,单位是进程数。 - **指标**: - **Max**: 最大值 - **Mean**: 平均值 - **Last**: 最近一次测量值 - **数据**: - 运行态进程数 (Processes in runnable state): Max=10, Mean=7.36, Last=10 - 阻塞等待I/O完成的进程数 (Processes blocked waiting for I/O to complete): Max=0, Mean=0, Last=0 ### Disk Space Used% - **X轴**: 表示时间,范围是从08:40到08:45。 - **Y轴**: 表示磁盘空间使用率,单位是百分比 (%)。 - **指标**: - **Max**: 最大值 - **Mean**: 平均值 - **Last**: 最近一次测量值 - **数据**: - 根目录 (/): Max=19.7%, Mean=19.7%, Last=19.7% - 数据目录 (/data): Max=14.4%, Mean=14.4%, Last=14.4% - 引导目录 (/boot): Max=21.4%, Mean=21.4%, Last=21.4% ![](img/host/5.png) ### Disk R/W Data 读取和写入的字节数。 - Y轴: 字节数 (kB/s) - X轴: 时间 (每5分钟更新一次) ### Disk IOs Completed (IOPS) 每秒完成的读取和写入操作数。 - Y轴: 操作数 (io/s) - X轴: 时间 (每5分钟更新一次) ### Time Spent Doing I/Os 完成读取和写入操作所花费的时间。 - Y轴: 时间 (ms) - X轴: 时间 (每5分钟更新一次) ![](img/host/6.png) ### Network Sockstatat - X轴: 表示时间,范围是从08:40到08:45。 - Y轴: 表示套接字统计数据的不同指标。 - 指标 - **CurrEstab**: 当前建立的连接数 - **TCP_tw**: TCP等待重传队列中的连接数 - **Sockets_used**: 使用的套接字数 - **UDP_inuse**: UDP协议栈中正在使用的套接字数 - **TCP_inuse**: TCP协议栈中正在使用的套接字数 - **TCP_alloc**: TCP协议栈中已经分配但未使用的套接字数 - **Tcp_InSegs**: 接收到的TCP段数 - **Tcp_OutSegs**: 发送出去的TCP段数 - **Tcp_RetransSegs**: 重传的TCP段数 ### Internet traffic traffic per hour ens192 - X轴: 表示时间,范围是从08:40到08:45。 - Y轴: 表示互联网流量,单位是KiB。 - 指标 - **Transmit**: 发送的流量 - **Receive**: 接收的流量 ## 数据库视图 ![](img/database/1.png) ### 上方的信息框 1. **Version**:显示了数据库的版本号。 2. **Start Time**:显示了服务启动的时间。 3. **Current fetch data**:当前正在读取的数据量。 4. **Current insert data**:当前正在写入的数据量。 5. **Current update data**:当前正在进行更新的数据量。 6. **Max Connections**:允许的最大连接数。 ### CPU Usage% 这个图表展示了CPU的使用情况: - **X轴**:时间,从左至右表示过去一段时间内的不同时间节点。 - **Y轴**:CPU使用率,单位为百分比。 - **绿色线**:代表总的CPU使用率。 - **橙色线**:用户态CPU使用率。 - **黄色线**:内核态CPU使用率。 - **蓝色线**:等待I/O的CPU使用率。 ### Overall total memory & average memory used% 这个图表展示了总体内存使用情况: - **X轴**:时间,从左至右表示过去一段时间内的不同时间节点。 - **Y轴**:内存使用量,单位为GiB。 - **红色线**:表示总的可用内存。 - **蓝色线**:表示已使用的内存总量。 - **绿色区域**:表示空闲内存。 ### Open File Descriptors 这个图表展示了打开的文件描述符的数量: - **X轴**:时间,从左至右表示过去一段时间内的不同时间节点。 - **Y轴**:打开的文件描述符数量。 - **绿色线**:表示当前打开的文件描述符总数。 - **灰色背景**:表示文件描述符的最小、最大、平均和当前数值范围。 ![](img/database/2.png) 这张图表展示了数据库系统中的几个关键配置参数及其当前值。以下是每个指标的详细解释: 1. **Shared Buffers (共享缓冲区)**: - 值:128 MiB - 含义:这是分配给所有数据库连接用于缓存数据页的内存大小。共享缓冲区可以提高查询性能,因为经常访问的数据会被缓存在这里。 2. **Effective Cache (有效缓存)**: - 值:4 GiB - 含义:这表示操作系统能够为数据库提供的最大缓存空间。有效的缓存越大,数据库的读取速度越快。 3. **Maintenance Work Memory (维护工作内存)**: - 值:64 MiB - 含义:这是在执行维护操作(如VACUUM)时使用的内存大小。较大的维护工作内存可以加快这些操作的速度。 4. **Work Mem (工作内存)**: - 值:4 MiB - 含义:这是每个并发查询所分配的最大内存大小。工作内存在处理排序、哈希表等操作时使用。 5. **Max WAL Size (最大WAL文件大小)**: - 值:1.0 GiB - 含义:这是写入日志(Write-Ahead Log, WAL)文件的最大大小。当达到这个限制时,旧的日志文件将被删除以腾出空间。 6. **Random Page Cost (随机页面成本)**: - 值:4 - 含义:这是一个权重因子,用于计算从磁盘上随机读取一个数据页的成本。较高的值意味着系统认为随机I/O比顺序I/O更昂贵。 7. **Seq Page Cost (顺序页面成本)**: - 值:1 - 含义:这是一个权重因子,用于计算从磁盘上连续读取多个数据页的成本。较低的值表明系统认为顺序I/O相对便宜。 8. **Max Workers (最大工作者进程数)**: - 值:8 - 含义:这是允许同时运行的最大后台工作者进程数量。这些进程可以并行执行一些任务,从而提高系统的整体效率。 9. **Max Parallel Workers Per Gather (每聚集节点的最大并行工作者数)**: - 值:8 - 含义:这是在一个GATHER节点下可以并行运行的最大工作者进程数量。这对于并行查询特别有用。 这些参数对于优化数据库性能至关重要,可以根据具体的硬件资源和应用需求进行调整。 ![](img/database/3.png) 这张图表展示了数据库系统在一段时间内的各种活动和性能指标。以下是各个部分的详细解释: ### Active sessions(活跃会话) - **Y轴**:表示活跃会话的数量。 - **X轴**:时间线,从04:00到08:00。 这个图表显示了在这段时间内活跃会话的变化情况。绿色圆点代表每个时间点的活跃会话数量。 ### Transactions(事务) - **Y轴**:表示每秒提交的事务数。 - **X轴**:时间线,从04:00到08:00。 这个图表显示了不同类型的事务在这段时间内的平均、当前和总提交次数。例如: - `template1 commits`:平均为0次/秒,当前为0次/秒,总共0次。 - `nacos_223 commits`:平均为0.899次/秒,当前为0.667次/秒,总共325次。 ### Update data(更新数据) - **Y轴**:表示每秒更新的数据量(KB)。 - **X轴**:时间线,从04:00到08:00。 这个图表显示了不同表在这段时间内的平均、当前和总更新数据量。例如: - `core`:平均为878 KiB/s,当前为1.03 MiB/s,总共155 MiB。 - `mone`:平均为123 KiB/s,当前为147 KiB/s,总共21.7 MiB。 ### Fetch data (SELECT)(获取数据) - **Y轴**:表示每秒查询的数据量(MiB)。 - **X轴**:时间线,从04:00到08:00。 这个图表显示了不同表在这段时间内的平均、当前和总查询数据量。例如: - `core`:平均为65.9 MiB/s,当前为78.6 MiB/s,总共11.7 GiB。 - `payment_cnaps`:平均为20.7 MiB/s,当前为23.1 MiB/s,总共3.66 GiB。 ### Insert data(插入数据) - **Y轴**:表示每秒插入的数据量(KiB)。 - **X轴**:时间线,从04:00到08:00。 这个图表显示了不同表在这段时间内的平均、当前和总插入数据量。例如: - `core`:平均为946 KiB/s,当前为1018 KiB/s,总共167 MiB。 - `cl_icms`:平均为28.4 KiB/s,当前为33.9 KiB/s,总共5.02 MiB。 ### Lock tables(锁定表) - **Y轴**:表示每秒锁定的表的数量。 - **X轴**:时间线,从04:00到08:00。 这个图表显示了不同类型的锁在这段时间内的平均、当前和总锁定次数。例如: - `pp,accessssharelock`:平均为63次/秒,当前为63次/秒,总共11 K次。 - `cl_ismt,accessssharelock`:平均为4次/秒,当前为4次/秒,总共4次。 这些图表提供了关于数据库系统的全面视图,包括会话活动、事务处理、数据更新、查询操作、数据插入以及表锁定等关键性能指标。通过分析这些数据,可以了解系统的负载情况,并进行相应的优化调整。 ![](img/database/4.png) 这张图表展示了数据库性能监控的各项指标。以下是每个部分的详细解释: ### Return data(返回数据) - **avg**:平均值 - **current**:当前值 - **total**:总值 这个部分显示了不同数据库表或模块在一段时间内返回的数据量。 示例: - usp: 平均730 MiB, 当前874 MiB, 总计129 GiB - teller: 平均465 MiB, 当前473 MiB, 总计82.2 GiB - core: 平均245 MiB, 当前288 MiB, 总计43.4 GiB - treasury: 平均118 MiB, 当前140 MiB, 总计20.9 GiB - crs: 平均85.2 MiB, 当前94.9 MiB, 总计15.1 GiB - suncrs: 平均77.4 MiB, 当前84.0 MiB, 总计13.7 GiB - mone: 平均70.9 MiB, 当前74.1 MiB, 总计12.5 GiB ### Idle sessions(空闲会话) - **max**:最大值 - **current**:当前值 这个部分显示了不同类型空闲会话的数量。 示例: - backupdb, s: idle: 最大0, 当前0 - backupdb, s: idle in transaction: 最大0, 当前0 - bdip, s: idle in transaction: 最大0, 当前0 - bl_bl, s: idle: 最大0, 当前0 - bl_bl, s: idle in transaction: 最大0, 当前0 - bl_ismt, s: idle: 最大0, 当前0 - bl_ismt, s: idle in transaction: 最大0, 当前0 ### Delete data(删除数据) - **avg**:平均值 - **current**:当前值 - **total**:总值 这个部分显示了不同数据库表或模块在一段时间内删除的数据量。 示例: - cl_icms: 平均23.6 KiB, 当前28.2 KiB, 总计4.17 MiB - cl_ismt: 平均4.04 KiB, 当前4.82 KiB, 总计730 KiB - core: 平均1.19 KiB, 当前1.42 KiB, 总计215 KiB - pp: 平均1.10 KiB, 当前1.10 KiB, 总计199 KiB - payment_cnaps: 平均844 B, 当前942 B, 总计149 KiB - teller: 平均394 B, 当前394 B, 总计69.6 KiB - mone: 平均112 B, 当前112 B, 总计19.8 KiB ### Cache Hit Rate(缓存命中率) - **avg**:平均值 - **current**:当前值 这个部分显示了不同数据库表或模块的缓存命中率。 示例: - template1: 平均96.93%, 当前97.83% - sgrdc_sit1_mone_uamp: 平均77.58%, 当前83.59% - sgrdc_sit1_mone_pinpoint: 平均96.20%, 当前96.38% - nacos_223: 平均98.43%, 当前98.91% - loader: 平均97.28%, 当前98.15% ### Buffers (bgwriter)(缓冲区(后台写入器)) 这个部分没有数据显示。 ### Conflicts/Deadlocks(冲突/死锁) - **avg**:平均值 - **current**:当前值 - **total**:总值 这个部分显示了不同数据库表或模块发生的冲突和死锁次数。 示例: - template1 conflicts: 平均0, 当前0, 总计0 - sgrdc_sit1_mone_uamp conflicts: 平均0, 当前0, 总计0 - sgrdc_sit1_mone_pinpoint conflicts: 平均0, 当前0, 总计0 - template0 conflicts: 平均0, 当前0, 总计0 - nacos_223 conflicts: 平均0, 当前0, 总计0 - loader conflicts: 平均0, 当前0, 总计0 - gw conflicts: 平均0, 当前0, 总计0 这些指标有助于监控数据库的性能、资源使用情况以及潜在的问题点。通过分析这些数据,可以优化数据库配置,提高系统效率。 ![](img/database/5.png) 这张图表展示了三个不同的监控指标:临时文件(Bytes)、检查点统计信息和当前连接数。每个部分都有详细的说明。 ### Temp File (Bytes) - 临时文件(字节) - **Y轴**:表示临时文件的大小,单位是字节。 - **X轴**:时间范围,从04:00到08:00。 在这个时间段内,所有列出的数据列的平均值、当前值和总值均为0 B,表明在这段时间内没有使用任何临时文件。 ### Checkpoint Stats - 检查点统计信息 - **Y轴**:表示毫秒(ms)的时间间隔。 - **X轴**:时间范围,从03:00到08:00。 - **数据列**:无数据显示,图表上没有任何数据点或趋势线。 这表明在指定的时间范围内,没有进行任何检查点操作。 ### Current connect - 当前连接数 - **Y轴**:表示当前连接的数量。 - **X轴**:时间范围,从03:00到08:00。 这些数据显示了不同服务或组件在指定时间范围内的连接情况,包括平均连接数、当前连接数以及总的连接数量。 ## 中间件视图 ### Redis ![](img/middleware/redis/1.png) 这张图显示了一个Redis实例的状态信息。以下是各个指标的详细解释: 1. **UpTime**: - 显示了Redis实例已经运行的时间,这里是26.1周。 2. **Role**: - 显示了Redis实例的角色,这里都是master角色。 3. **Ops/sec[3m]**: - 每秒操作数(过去3分钟),这里是50.2k次/秒。 4. **connected clients**: - 连接客户端的数量,这里有5个连接。 5. **Number of keys**: - 当前存储的键的数量,这里有9,950个键。 6. **Network**: - 网络输入输出情况: - Input: 7.05 MiB/s (每秒输入数据量) - Output: 51.0 MiB/s (每秒输出数据量) 7. **Memory**: - 内存使用情况: - Used Memory: 956 KiB (已使用的内存大小) - Used Memory Peak: 1.46 MiB (峰值内存使用量) - Used Memory Lua: 33 KiB (Lua脚本使用的内存) - Used Memory Dataset: 84.5 KiB (数据集使用的内存) - Used Memory Overhead: 872 KiB (额外开销占用的内存) - Used Memory Rss: 8.47 MiB (实际使用的物理内存大小) 8. **Keys**: - 键的情况: - Hits: 81.8k (命中次数) - Misses: 81.4k (未命中次数) 9. **Redis Version**: - Redis版本号,这里是6.2.6。 10. **State**: - 实例状态,这里是Running。 11. **Maxmemory Policy**: - 最大内存策略,这里是noeviction(不驱逐)。 这些指标帮助监控Redis实例的性能、资源使用情况以及网络活动等重要信息。通过这些数据,可以及时发现并解决潜在的问题,确保Redis服务的稳定性和高效性。 ![](img/middleware/redis/2.png) 这张图表展示了多个系统性能指标随时间变化的情况。以下是每个指标的详细解释: 1. **CPU Utilization(CPU利用率)** - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示CPU利用率百分比。 - **绿色线**:代表系统的CPU利用率。 - **黄色线**:代表用户的CPU利用率。 2. **IOPS(每秒输入输出操作数)** - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示每秒的I/O操作次数。 - 图表中有多种颜色的线条,分别代表不同的命令类型: - 绿色:brpop - 黄色:client - 蓝色:config - 橙色:del - 红色:expire - 青色:get - 紫色:info - 棕色:latency - 灰色:multi - 深蓝色:publish - 浅蓝色:set - 深红色:slowlog 3. **Network Throughput(网络吞吐量)** - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示网络吞吐量,单位为MB/s。 - **绿色线**:代表入站流量。 - **橙色线**:代表出站流量。 4. **Conns/sec(每秒连接数)** - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示每秒的连接数。 5. **Keys / DB(数据库中的键数)** - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示数据库中的键数。 - 图表中有多种颜色的柱状图,分别代表不同的数据库: 6. **Average TTL(平均生存时间)** - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示平均生存时间,单位为毫秒。 7. **Expired / Evicted keys(过期/驱逐的键数)** - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示过期或被驱逐的键数。 - **绿色线**:代表过期的键数。 - **橙色线**:代表被驱逐的键数。 8. **Hit Rate(命中率)** - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示命中率百分比。 这些指标可以帮助监控和分析系统的性能,确保其在高负载下仍能稳定运行。 ![](img/middleware/redis/3.png) 这张图表展示了四个不同的性能指标,每个指标都有一个对应的图形。以下是这些指标及其含义的详细解释: 1. **Connections usage(连接使用情况)** - **X轴**:时间,从13:16到13:24。 - **Y轴**: - 绿色线表示当前客户端数量(Clients)。 - 橙色线表示最大客户端数量(Max Clients)。 这个图表显示了在指定时间段内系统中的客户端连接数以及系统的最大允许连接数。绿色线代表实际的客户端连接数,橙色线代表系统配置的最大连接数。 2. **Blocked and Rejected clients(被阻止和拒绝的客户端)** - **X轴**:时间,从13:16到13:24。 - **Y轴**: - 绿色线表示被阻止的客户端数量(Blocked)。 - 黄色线表示被拒绝的客户端数量(Rejected)。 这个图表显示了在指定时间段内系统中被阻止或拒绝的客户端的数量。绿色线代表被阻止的客户端数量,黄色线代表被拒绝的客户端数量。 3. **Response time(响应时间)** - **X轴**:时间,从13:16到13:24。 - **Y轴**:响应时间,单位为微秒(μs)。 这个图表显示了在指定时间段内系统的平均响应时间。绿色线代表系统的响应时间,数值越小表示响应速度越快。 4. **Slowlog increment(慢日志增量)** - **X轴**:时间,从13:16到13:24。 - **Y轴**:慢日志增量,单位为毫秒(ms)。 这个图表显示了在指定时间段内系统记录的慢查询的日志增量。绿色线代表慢日志的增量值,数值越大表示有更多缓慢的操作被记录下来。 通过这四个图表,可以全面了解系统在特定时间段内的连接使用情况、被阻止和拒绝的客户端数量、响应时间和慢日志增量等关键性能指标。 ### Mongodb ![](img/middleware/mongodb/1.png) 这张图表展示了数据库服务器(IP地址为10.22.0.48:9216)在一段时间内的查询和文档操作的性能指标。以下是各个部分的详细解释: #### Query Operations (查询操作) - **X轴**: 时间,显示了从13:16到13:24的时间段。 - **Y轴**: 操作每秒的数量(ops/s),范围从0到10 ops/s。 **图例说明**: - 绿色线表示命令(command)操作。 - 黄色线表示删除(delete)操作。 - 蓝色线表示获取更多数据(getmore)的操作。 - 橙色线表示插入(insert)操作。 - 红色线表示查询(query)操作。 - 青绿色线表示更新(update)操作。 从图中可以看出,在这段时间内,主要以命令操作为主,其他操作相对较少。 #### Document Operations (文档操作) - **X轴**: 时间,显示了从13:16到13:24的时间段。 - **Y轴**: 操作数量,范围从-1到1。 **图例说明**: - 绿色线表示已删除的文档数(deleted)。 - 黄色线表示已插入的文档数(inserted)。 - 蓝色线表示返回的文档数(returned)。 - 橙色线表示已更新的文档数(updated)。 从图中可以看出,在这段时间内,没有明显的文档操作发生。 #### Document Query Executor (文档查询执行器) - **X轴**: 时间,显示了从13:16到13:24的时间段。 - **Y轴**: 扫描的文档数,范围从-1到1。 **图例说明**: - 绿色线表示扫描的文档数(scanned)。 - 黄色线表示扫描的对象数(scanned_objects)。 #### Member Health (成员健康状态) - **X轴**: 时间,显示了从13:16到13:24的时间段。 - **Y轴**: 健康状态值,范围从0到1。 #### Member State (成员状态) - **X轴**: 时间,显示了从13:16到13:24的时间段。 - **Y轴**: 状态值,范围从-1到1。 #### Replica Query Operations (副本集查询操作) - **X轴**: 时间,显示了从13:16到13:24的时间段。 - **Y轴**: 查询操作每秒的数量(ops/s),范围从-1 ops/s到1 ops/s。 ![](img/middleware/mongodb/2.png) 这张图显示了一个服务器或服务的健康指标(Health metrics)和资源指标(Resource Metrics)。以下是各个部分的详细解释: #### 健康指标 (Health metrics) 1. **Uptime**: - **值**: 9.30 week - **含义**: 表示该服务器或服务已经连续运行了9周零3天。这是一个重要的稳定性指标,表明系统长时间没有中断。 2. **Available Connections**: - **值**: 838847 - **含义**: 表示当前可用的连接数为838,847个。这通常是指可以同时处理的最大并发连接数。 3. **Open Connections**: - **值**: 13 - **含义**: 表示当前打开的连接数为13个。这是指正在使用中的实际连接数量。 #### Oplog Size - **图表描述**: 没有数据。 - **含义**: 这是一个用于记录操作日志的空间大小。 #### Memory - **Y轴**: 内存使用量,单位从MB到GB不等。 - **X轴**: 时间,从13:16到13:24。 - **绿色线**: 实际内存使用量,当前值约为103 MB。 - **橙色线**: 虚拟内存使用量,当前值约为1.60 GB。 - **含义**: 显示了在指定时间范围内,服务器的实际内存和虚拟内存使用情况。可以看出,实际内存使用相对较低,而虚拟内存使用较高。 #### Network I/O - **图表描述**: 没有数据。 - **含义**: 这是网络输入/输出的数据流量。 ![](img/middleware/mongodb/3.png) 这张图表展示了四个不同的性能监控指标。以下是每个指标的详细解释: #### Oplog Lag - **描述**:Oplog Lag 是指操作日志(oplog)中的延迟时间。 - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示延迟的时间,单位为秒或毫秒。 在这个图表中,显示的是“无数据”,意味着没有可用的数据来展示Oplog Lag的情况。 #### Disk IO Utilization - **描述**:Disk IO Utilization 表示磁盘输入输出利用率。 - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示利用率百分比,范围从0%到100%。 这个图表显示了磁盘IO利用率在一段时间内的变化情况。可以看到,在这段时间内,磁盘IO利用率保持在较低水平,接近于0%。 #### Disk Reads Completed - **描述**:Disk Reads Completed 表示完成的磁盘读取次数。 - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示完成的读取次数。 这个图表显示了在一段时间内完成的磁盘读取次数的变化情况。可以看到,随着时间的推移,完成的读取次数逐渐增加,并且在某些时间段内有明显的增长趋势。 #### Disk Writes Completed - **描述**:Disk Writes Completed 表示完成的磁盘写入次数。 - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示完成的写入次数。 这个图表显示了在一段时间内完成的磁盘写入次数的变化情况。可以看到,随着时间的推移,完成的写入次数相对稳定,但也有一定的波动。 总结: 这些图表提供了关于系统性能的关键信息,包括操作日志延迟、磁盘I/O利用率以及磁盘读取和写入的完成情况。通过分析这些指标,可以了解系统的运行状态并及时发现潜在的问题。 ### RocketMQ ![](img/middleware/rocketmq/1.png) #### 集群信息 这张图片显示了一个集群的信息表,具体包含以下内容: - **Broker 名称** - **IP 地址** - **集群名称** 这张表格用于展示集群中的各个 Broker 节点及其对应的 IP 地址,并指出了它们所属的集群名称。通过这种方式,可以方便地管理和监控集群中的各个节点。 ![](img/middleware/rocketmq/2.png) #### 磁盘空间使用百分比 - 显示系统磁盘空间的使用情况,当前使用率为66%。 #### 集群每分钟写入消息不同耗时区间趋势 - **X轴**:时间,以分钟为单位,从13:16到13:24。 - **Y轴**:未明确标注,但根据上下文推测可能是消息处理量或频率。 - **颜色编码**:不同颜色代表不同耗时区间的消息处理情况。 #### 可能限流的broker(写入耗时超过200ms的消息数大于0) - **X轴**:时间,以分钟为单位,从13:16到13:24。 - **Y轴**:消息处理量或频率。 ![](img/middleware/rocketmq/3.png) 这张图片展示了两个图表,分别表示不同的系统性能指标。以下是对每个图表的详细解释: #### 请求等待处理耗时 - **Y轴**: 耗时(单位为毫秒,ms) - **X轴**: 时间 - **数据说明**: - 绿色线代表“发送请求”的耗时情况。 - 橙色线代表“拉取请求”的耗时情况。 - 蓝色线代表“查询请求”的耗时情况。 #### 已提交commit log等待构建消费队列的消息大小 - **Y轴**: 消息大小(单位为字节,B) - **X轴**: 时间 - **数据说明**: - 绿色线代表“已提交commit log等待构建消费队列的消息大小”。 ![](img/middleware/rocketmq/4.png) #### 消息消费的滞后时间 表示从消息发送到broker后,经过多长时间仍未被消费者处理。 - Y轴:滞后的天数。 - X轴:时间戳,显示了具体的日期和时间。 #### 消息状态 - **Broker IP**:172.29.110.29:32103 - **昨天生产消息数**:0 - **今天生产消息数**:2880 - **昨天消费消息数**:0 - **今天消费消息数**:1604 表格显示了特定broker实例的消息生产和消费情况。昨天没有生产或消费任何消息,而今天已经产生了2880条新消息,并且成功消费了其中的1604条。 ![](img/middleware/rocketmq/5.png) #### broker发送tps - **Y轴**:表示每秒传输的数据量(transactions per second, tps)。 - **X轴**:表示时间,从13:16到13:24。 这个图形显示了broker在不同时间段内发送数据的速度。在这个例子中,可以看到发送速度在整个时间段内保持稳定,接近于0。 #### broker消费tps - **Y轴**:同样表示每秒传输的数据量(tps)。 - **X轴**:表示时间,从13:16到13:25。 这个图形显示了broker在不同时间段内接收并处理数据的速度。可以看到,在大约13:21时,消费速度有一个明显的下降,然后在13:23左右恢复到之前的水平。 #### 客户端发送tps - **Y轴**:表示客户端每秒发送的数据量(tps)。 - **X轴**:表示时间,从13:16到13:24。 这个图形显示了客户端在不同时间段内发送数据的速度。与第一个图形类似,发送速度在整个时间段内也保持稳定,接近于0。 #### 客户端发送total tps - **Y轴**:表示客户端总的数据传输速率(tps)。 - **X轴**:表示时间,从13:16到13:24。 这个图形显示了客户端在不同时间段内的总数据传输速率。与前两个图形一样,总传输速率在整个时间段内保持稳定,接近于0。 ![](img/middleware/rocketmq/7.png) 这张图表展示了两个客户端消费TPS(Transactions Per Second)相关的指标。以下是详细的解释: #### 客户端消费tps 这个指标表示的是每秒钟客户端处理的交易数量。 - **X轴**:表示时间,从13:16到13:24。 - **Y轴**:表示每秒钟的交易数,范围是从0到1。 - **曲线**:曲线显示了在指定时间段内每秒钟的交易数保持为0。 #### 客户端消费total tps 这个指标表示的是总每秒钟客户端处理的交易数量。 - **X轴**:同样表示时间,从13:16到13:24。 - **Y轴**:表示总的每秒钟交易数,范围也是从0到1。 - **曲线**:曲线同样显示了在指定时间段内总的每秒钟交易数保持为0。 ![](img/middleware/rocketmq/8.png) 这张图表展示了四个不同的流量大小指标。每个图表都有一个标题、X轴和Y轴。 #### broker每秒发送消息流量大小 表示该图表显示的是“broker”(代理服务器)每秒钟发送的消息流量大小。 - **X轴**:时间轴,从13:16到13:25,以分钟为单位。 - **Y轴**:流量大小,范围从-1 B到1 B。 #### broker每秒消费消息流量大小 表示该图表显示的是“broker”(代理服务器)每秒钟消费的消息流量大小。 - **X轴**:时间轴,从13:16到13:25,以分钟为单位。 - **Y轴**:流量大小,范围从-1 B到1 B。 #### Topic每秒发送消息大小 表示该图表显示的是“Topic”(主题)每秒钟发送的消息大小。 - **X轴**:时间轴,从13:16到13:24,以分钟为单位。 - **Y轴**:流量大小,范围从-1 B到1 B。 #### 消费组每秒消费消息大小 表示该图表显示的是“消费组”每秒钟消费的消息大小。 - **X轴**:时间轴,从13:16到13:24,以分钟为单位。 - **Y轴**:流量大小,范围从-1 B到1 B。 ![](img/middleware/rocketmq/9.png) #### 消息积压(积压量: [0, 10W]) 表示该图表显示的是在指定时间范围内,消息积压数量介于0到10万之间的数据。 - **X轴**: 表示时间,从13:16到13:24。 - **Y轴**: 表示消息积压的数量,范围是0到1.25。 - **两条线**: - 紫色线条代表`JobZoneA_xp-unit-demo_other_n2_b02_dev3@2001_xp-unit-demo_b02_dev3_n2`的消息积压情况。 - 粉红色线条代表`JobZoneA_xp-unit-demo_other_n1_b01_dev3@2001_xp-unit-demo_b01_dev3_n1`的消息积压情况。 从图表可以看出,在这段时间内,这两条线路的消息积压数量都保持在一个稳定的水平,大约为1。 #### 异常积压(积压量<0) 异常积压(积压量<0)表示该图表显示的是在指定时间范围内,消息积压数量小于0的数据。 - **X轴**: 表示时间。 - **Y轴**: 表示消息积压的数量。 #### 大量积压(积压量>10W) 表示该图表显示的是在指定时间范围内,消息积压数量大于10万的数据。 - **X轴**: 表示时间。 - **Y轴**: 表示消息积压的数量。 总结: - 上方图表显示了正常范围内的消息积压情况,两条线路的消息积压数量稳定在1左右。 - 左下角和右下角的两个图表分别显示了异常积压和大量积压的情况,但在这段时间内都没有相关数据。 ![](img/middleware/rocketmq/10.png) #### 重试队列积压 表示系统中的重试任务在队列中的累积数量。 - X轴: 表示时间,从13:16到13:24,以分钟为单位。 - Y轴: 表示重试队列的积压数量,范围从-1到1。 - 指标含义: - **重试队列积压**:当某个任务因为某种原因未能成功执行时,它会被放入重试队列等待再次尝试。这个指标显示了这些未完成的任务在队列中的累积数量。 - **当前值(current)**:右侧的颜色条形图显示了当前时刻各服务的重试队列积压情况。所有服务的当前积压量均为0。 ![](img/middleware/rocketmq/11.png) #### commit log最小位点 图表显示了各个分区(partition)的commit log的最小位点。每个条形代表一个分区,绿色表示该分区的最小位点。 - x轴:表示不同的分区编号。 - y轴:表示commit log的位点值。 #### 消息量 显示了当前的消息总量。 #### commit log最大位点 图表显示了各个分区的commit log的最大位点。每个条形代表一个分区,红色表示该分区的最大位点。 - x轴:表示不同的分区编号。 - y轴:表示commit log的位点值。 #### Topic生产位点 列表展示了不同Topic的生产位点信息。 - Topic:表示不同的主题名称。 - 生产位点:表示该Topic下已生产的最新消息的位点。 #### 重试队列位点 列表展示了不同重试队列的生产位点信息。 - Topic:表示不同的重试队列名称。 - 生产位点:表示该重试队列下已生产的最新消息的位点。 #### 死信队列位点 表示当前死信队列。 ![](img/middleware/rocketmq/12.png) #### 消费位点 - **Broker**:表示消息队列的代理服务器名称。 - 在这个例子中,所有的行都显示为“broker-a”,表明这些数据都是从同一个代理服务器获取的。 - **消费组**:表示消费者所属的消费组。 - 消费者是订阅特定主题并处理其中消息的应用程序或服务。 - 例如,“1001_aps_scheduler_job_dispatcher_dev3”是一个消费组的名称。 - **Topic**:表示消息的主题。 - 主题是消息分类的一种方式,每个消息都会被发送到一个特定的主题下。 - 例如,“JobZoneA_aps_scheduler_job_dispatcher_copy_dev3”是一个主题的名称。 - **消费位点**:表示当前消费者的消费位置。 - 这个值通常是指消费者已经读取的消息的数量。 - 较大的数值意味着消费者已经处理了更多的消息。 - 例如,对于主题“JobZoneA_aps_scheduler_job_handler_copy_dev3”,消费位点为66,427,说明该消费者已经处理了66,427条消息。 总结: - 这张图表展示了不同消费组在各个主题上的消费进度。 - Broker列显示所有数据来自同一台代理服务器。 - 消费组列显示了不同的消费者分组。 - Topic列显示了消费者所订阅的不同主题。 - 消费位点列显示了每个消费者在其对应主题上已处理的消息数量。 ### Nacos ![](img/middleware/nacos/1.png) 这张图是一个监控界面,显示了Nacos服务的状态和性能指标。以下是各个指标的详细解释: - **UP**:表示当前有多少个Nacos实例是可用的(up状态)。这里显示为1。 - **service count**:表示注册到Nacos的服务数量。这里显示为151。 - **ip count**:表示注册到Nacos的服务实例的数量。这里显示为315。 - **config count**:表示配置项的数量。这里显示为562。 - **long polling**:表示长轮询请求的数量。这里显示为3。 - **config push total**:表示配置推送的总次数。这里显示为37,223次。 接下来是一些图表形式的指标: - **cpu**:CPU使用率。这里的值为7.15%,表示当前CPU的利用率。 - **memory**:内存使用率。这里的值为22.9%,表示当前内存的利用率。 - **threads**:线程数。这里的值为230,表示当前运行中的线程总数。 - **notify rt**:通知响应时间。这里的值为0.250秒,表示从发送通知到收到确认的时间间隔。 - **load**:系统负载。这里的值为1.07,表示系统的平均负载情况。 - **qps**:每秒查询数。这里的值为45.7,表示每秒钟处理的请求数量。 - **rt**:响应时间。这里的值为2.27秒,表示处理一个请求所需的时间。 - **avgPushCost**:平均推送成本。这里的值为-1,可能表示该数据暂时不可用或未计算出来。 这些指标可以帮助管理员了解Nacos服务器的健康状况、资源使用情况以及性能表现。通过监控这些指标,可以及时发现并解决潜在的问题,确保系统的稳定性和高效性。 ![](img/middleware/nacos/2.png) 这张图表展示了Nacos服务的一些关键性能指标。以下是每个指标的详细解释: - **rt (响应时间)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 响应时间(单位:秒) - **描述**: 显示了DELETE方法在特定URL上的平均响应时间。 - **long polling (长轮询)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 长轮询次数 - **描述**: 显示了长轮询操作的数量。 - **load 1m (1分钟负载)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 负载值 - **描述**: 显示了系统在过去一分钟内的平均负载情况。 - **qps (每秒查询数)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 查询数量 - **描述**: 显示了DELETE方法在特定URL上的每秒查询数。 - **leaderStatus (领导者状态)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 状态值 - **描述**: 显示了领导者的状态变化。 - **avgPushCost (平均推送成本)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 成本值 - **描述**: 显示了平均推送成本的变化。 - **maxPushCost (最大推送成本)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 成本值 - **描述**: 显示了最大推送成本的变化。 - **config statistics (配置统计)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 统计值 - **描述**: 显示了发布配置和获取配置的操作统计。 - **health check (健康检查)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 检查结果 - **描述**: 显示了HTTP健康检查和MySQL健康检查的结果。 这些指标帮助监控Nacos服务的性能、负载和健康状况,确保系统的稳定运行。 ![](img/middleware/nacos/3.png) 这张图表展示了Nacos系统的多个监控指标。以下是每个指标的详细解释: - **CPU Alert (CPU警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: CPU使用率百分比 - **描述**: 显示了系统CPU使用率随时间的变化情况。红色线表示警戒阈值。 - **Load Alert (负载警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 系统负载平均值(每分钟) - **描述**: 显示了系统负载随时间的变化情况。 - **Memory Alert (内存警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 内存使用百分比 - **描述**: 显示了JVM堆内存使用率随时间的变化情况。 - **Threads Alert (线程警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 守护线程数量 - **描述**: 显示了守护线程数量随时间的变化情况。 - **GC Alert (垃圾回收警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 垃圾回收暂停秒数 - **描述**: 显示了每次重大垃圾回收操作后的暂停时间变化情况。 - **Notify Task Alert (通知任务警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 通知任务数量 - **描述**: 显示了通知任务的数量随时间的变化情况。 - **RT Alert (响应时间警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 平均响应时间(毫秒) - **描述**: 显示了HTTP请求的平均响应时间随时间的变化情况。 - **Long Polling Alert (长轮询警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 长轮询次数 - **描述**: 显示了长轮询操作的次数随时间的变化情况。 - **Config Unhealth Exception Alert (配置不健康异常警告)** - **X轴**: 时间(从13:16到13:24) - **Y轴**: 异常计数 - **描述**: 显示了配置不健康的异常计数随时间的变化情况。当前没有数据。 这些指标帮助监控Nacos系统的运行状态,确保其稳定性和性能。 ![](img/middleware/nacos/4.png) 这张图表展示了多个异常警报的数据。每个小图表代表一种特定类型的异常警报,并显示了在一段时间内的数据变化情况。 - **db exception alert**: - **X轴**: 时间轴,从13:16到13:24。 - **Y轴**: 异常数量(0到1)。 - **描述**: 显示数据库异常的数量。在这个时间段内没有数据记录。 - **failed push alert**: - **X轴**: 时间轴,从13:16到13:24。 - **Y轴**: 失败推送的数量(-1到1.5)。 - **描述**: 显示失败推送的数量。可以看到在13:18左右有一个明显的峰值。 - **illegalArgument exception alert**: - **X轴**: 时间轴,从13:16到13:24。 - **Y轴**: 非法参数异常的数量(-1到1)。 - **描述**: 显示非法参数异常的数量。在这个时间段内没有数据记录。 - **naming disk exception alert**: - **X轴**: 时间轴,从13:16到13:24。 - **Y轴**: 命名磁盘异常的数量(-1到1)。 - **描述**: 显示命名磁盘异常的数量。在这个时间段内没有数据记录。 - **config notify exception alert**: - **X轴**: 时间轴,从13:16到13:24。 - **Y轴**: 配置通知异常的数量(-1到1)。 - **描述**: 显示配置通知异常的数量。在这个时间段内没有数据记录。 - **naming leader send beat failed exception alert**: - **X轴**: 时间轴,从13:16到13:24。 - **Y轴**: 命名领导者发送心跳失败异常的数量(-1到1)。 - **描述**: 显示命名领导者发送心跳失败异常的数量。在这个时间段内没有数据记录。 - **nacos exception alert**: - **X轴**: 时间轴,从13:16到13:24。 - **Y轴**: Nacos异常的数量(-1到1)。 - **描述**: 显示Nacos异常的数量。在这个时间段内没有数据记录。