我们p6 p7等主机已经进入部件损坏高发期,怎么样才能减少宕机带来的业务损失呢?有什么好办法(别说买了全部换,这个到哪儿都不可能)
1,首先,最好有第三方或原厂维保做支撑,一方面增强技术后备,另外一方面能很快得到备品备件。
2,其次,了解整体系统架构,查看有无单点故障,可尝试做双机集群环境。
3,上一些成熟的灾备方案,确保无论什么极端环境,做到不丢或少丢数据。
4,形成长效的巡检巡查机制,有条件的话最好让维保商提供驻场服务,早发现问题,早处理,省得被动。
还是有钱的企业多啊,power6和power7 都退役了,我们power5还用的刚刚的,这个东西不能一概而论,MA还是要的,其他的只是软件方面的问题了,硬件问题根据设备年限和生产批次不同或者缺陷,有各种各样的问题。
高可用,一倍多,分布式,选择适合的就好。
收起正常用即可,自然趋势,无法阻挡。
但是我们可以从业务或优先级方面做一些梳理和分析,在此基础上做调整。比如
1. 业务重要,优先级高的。架构方面尽量避免单点故障,有条件就多调整点,比如,aix的hacmp,oracle的dg stream等。条件不具备把硬件本身的做好,重要部件冗余,双电源 双电源线路 ups 、多风扇等。如570,cec的vrm配满三个等等
2.日常健康监控备份等运维工作做好
3. 购买维保服务,根据业务优先级 买对应服务级别的维保。比如级别高的7*24*2 现场备件库或备机都可以做到
总之,是由业务本身的sla决定的,现有环境不能大调只能在运维、服务以及架构上多下点功夫 去补齐短板了
收起