在电信运营商一体化监控项目中,为进行系统规格设计,如何进行定量需求分析?

参与5

1同行回答

匿名用户匿名用户
一体化监控平台建设的需求分析主要针对监控资源类别对各自指标进行汇总统计。一、IaaS层资源指标*硬件监控:实现硬件设备资产信息的集中化管理,提供有效、准确、实时的IT资产信息,如硬件配置、IP地址、主机名、连接用户;硬件设备的内存使用率、CPU使用率、CPU平均负载、磁盘I...显示全部

一体化监控平台建设的需求分析主要针对监控资源类别对各自指标进行汇总统计。
一、IaaS层资源指标
*硬件监控:实现硬件设备资产信息的集中化管理,提供有效、准确、实时的IT资产信息,如硬件配置、IP地址、主机名、连接用户;硬件设备的内存使用率、CPU使用率、CPU平均负载、磁盘IO、磁盘空间使用率等关键指标的监控、预警。
*网络监控:实现对系统的核心网络及主要链路的连通性监控,包括上下行流量、丢包率、时延、最大连接数等,7x24主动监测线上业务的链路质量、访问速度,秒级发现故障定位问题。
*主机可信任列表:对主机,网络设备,数据库提供可配置的IP可信用列表白名单,当白名单以外的IP连接到设备时,进行告警显示。
 
二、PaaS层软件监控指标要求:
*数据库监控:实现对数据库重要配置参数(包括但不限于连接数、会话数、死锁、IO、表空间使用率、节点状态、监听进程、物理读写速率、库缓存命中率等)的监控、预警。
*中间件监控:CPU 和堆内存使用情况、中间件线程信息、Web请求队列、Web请求会话、Web 请求响应时间分布图、应用TPS、Socket连接、文件句柄、数据库连接池监控、Java JVM堆内存、JVM GC等监控、JVM类加载监控。
*开源软件监控:开源软件种类繁多,根据不同的开源软件需要有不同的监控指标,以Redis为例:服务器版本、服务器运行模式(集群/单例)、服务进程ID、服务端口、内存使用情况、服务运行时长、集群槽位(Slot)分配、每秒指令数、每秒命令数、客户端连接数、命中率、阻塞客户端数等均是关键监控指标。以Nginx为例:服务器版本、启动时间、进程数量、空闲worker数目、繁忙worker数目、每秒请求数、每秒字节数、CPU使用率、内存使用情况、服务器状态等均是关键监控指标。
 
三、SaaS层系统指标
*应用监控指标:应用请求堆栈、应用异常、资源未关闭、TPS(每秒处理的请求数)、RPS(每秒接收的请求数)、活动用户数、会话数、请求响应超时、基于HTTP响应码的汇总请求数。
 
四、监控告警指标
*业务系统指标:系统CPU使用率、系统内存使用率、进程CPU使用率、进程内存使用率、堆内存使用率、Full GC、活动请求上线、活动数据库连接上线、JDBC资源未关闭、文件句柄未关闭、Socket未关闭等。

收起
银行 · 2019-08-19
浏览1411

相关问题

相关文章

问题状态

  • 发布时间:2019-08-16
  • 关注会员:2 人
  • 问题浏览:1870
  • 最近回答:2019-08-19
  • X社区推广