常见的数据库(oracle、mysql、sqlserver等)和服务器(linux、AIX、windows等)应该监测什么?阈值应该如何设置?
OS层面:
基本资源(CPU、内存、IO等等)
目录及文件系统使用状况
报警日志
RAC层面:
实例状态、服务状态、监听状态、目录使用状况、警告日志等等
数据库层面:
表空间、数据文件、SQL状况、SESSIOn状况、LOCK、表等等数据库对象
ASM:
磁盘组使用状况、ASM服务状态、重要文件状态及使用状况等
业务层面:
数据库中数据能反应出来的业务指标,比如说交易数目、交易平均时间、交易状态等等。
收起针对OS,监控项的设置从以下几方面:
1,基本监控项
* CPU相关: CPU使用率,CPU空闲率,系统负载(1分钟,5分钟,10分钟)
* 内存相关:总内存,已经使用内存项,剩余内存,文件系统buffe/cache占用空间,真正使用空间
* 磁盘:磁盘容量监控,磁盘IO利用率监控,wait时延监控等等
* 网络:主机ping监控,网卡流量监控,网卡丢包率监控
2,和系统相关的一些监控
* 进程相关:进程总数,僵尸进程,等待进程等
* swap相关:swap使用率,是否开启
* 日志监控:内核日志错误监控等
* 安全监控:安全登录日志监控,passwd文件监控等
数据库相关的监控,这个就更多了
* 空间使用率监控
* 数据库进程系统资源使用监控
* 请求数监控,并发连接监控
* 慢请求监控
* 数据库错误日志监控
* 死锁监控
等等等
收起