高可用性测试比较简单,模拟单点故障或者网络故障来确认集群是否能够正常选举出新的主节点,并自动将应用切换到该节点上。压力测试的话可以使用压测工具,比如YCSB,或者使用基于cloud的测试方法。上线后运维阶段的数据库,性能诊断一般从 OS层 --> 数据库 --> 应用这样...
1、报表优化,复杂计算放入后台计算2、数据库优化3、增加内存和CPU4、增加机器
这个问题有点泛泛了,个人觉得有几个点需要考虑吧:1、业务系统的特点,通过分析至少要知道那种资源对该业务来说是关键资源2、部署应用时要把相关的内核参数做最优化调整,举例:Oracle安装时都要求调整Linux的参数。3、运行时需要监控,对实际资源使用率和日志输出进行监控和分析4...
楼上说的对,现在有很多开源的工具可以实现这种监控。最简单的,编写一个远程执行(SSH等)的脚本也可以把目标服务器的CPU使用率信息给采集过来。
一、首先要搞清楚IO争用是因为应用等层面的IO量过大导致,还是系统层面不能承载这些IO量。如果应用层面有过多不必要的读写,首先解决应用问题。举例1:数据库里面用于sort的buffer过小,当做sort的时候,有大量的内存与磁盘之间的数据交换,那么这类IO可以通过扩大sort buffer的内...
首先我们来说 越来越多的自动化都有什么 有sta addm amm等等太多了 我们这里只说内存相关的AMM:automatic memory management(11.1才有的特性) 即让数据库完全管理SGA、PGA的大小,而对于管理员只需要设置一个总的大小(memory_target),数据库会动态的调整SGA、PGA的 ...
htop,nmon,fuser,fio,strace