减少单点故障的通用方法?
收起实际就是提升高可用,以下几个方面考虑:
1.冗余,冗余,冗余
冗余以消除单点故障
2.早期检测
停机时间越短越好
减少错误判断的风险和不必要的故障切换
3.保护数据一致性–在系统宕机后可以将数据和文件系统恢复到既定的时间点
数据库日志
文件系统日志
复制 (Mirroring)
定期的数据库备份
4.自动监测和故障切换(failover) – 让系统自动采取动作从而减少停机窗口
多路径 (Multipath)
虚拟IP (VIPA –Virtual IP Addresses)
监控和心跳 (Monitoringand heart-beating)
集群中间件 (Clusteredmiddleware)
集群操作系统 (Clusteredoperating systems)