2015年12月20日11时40分,广东深圳市光明新区凤凰社区恒泰裕工业园发生山体滑坡。此次山体滑坡非自然灾害造成,人为的不可预测的灾难。事发属于工业区,里面预计有不少服务器在运行,一般服务器系统在规划设计时候,都会考虑各种自然灾害或者人为灾害,但是这次是史无前例的灾难,并且基本都被埋了,硬件再找出来已不可能了,在系统硬件架构规划设计中,是否要考虑到此类事件的发生,特别是数据。工业区应该大部分是中小企业,或许需要更大的云存储设备为中小企业提供重要数据的备份,各位有没有建议
这种灾难事件,数据中心至少要做成同城容灾才能在较短时间内恢复业务。这个容灾的设计,最终还是和预算有关。
目前采用较多的是基于存储的块级复制和基于应用的复制(如oracle stream),可根据自身要求去选择。
如果基于存储的,需要解决了异构存储的复制接口问题,最好先做整合。
收起这是数据容灾的层面,考虑两个方面,一个是数据能够恢复,第二是多少时间恢复,通常说就是RTO和RPO。
对中小企业来说,由于预算有限,一般RTO和RPO要求都不是很高,因此可以选用一些相对廉价的做法。最基本的是把数据做离线备份,可以一天或者一周一次。然后数据存放到安全区域,一般原理生产区域。
而是采用一些基本的在线复制方案,此时需要两套以上的存储设备,实施简单的异步复制,目前这种方案成本较低,需要的存储设备仅需要中低端的,有些甚至自身就可以通过IP网络复制,例如V5000。因此成本几乎就是一个额外的数据存储。
当然也可以通过数据库的复制,例如HADR等,方式种类比较多。
而当RTO和RPO的要求变高时,实现方式就变得更为复杂,需要分析的点也就比较多了。
收起