大量的医院IT业务系统整合会带来风险的大集中,服务器整合架构设计方要考虑稳定性、安全性和可靠性等关键要素。如何制定技术策略才能使服务器资源整合之后保障医院业务系统7*24小时无故障运行,架构如何设计才能保证医疗IT业务系统的连续性?
我理解您提到的整合之后风险集中,应该是物理规模将变的更小,但不代表风险更大,医院需要权衡使用哪种技术实现风险规避,越来越分散的话,其复杂度上升后,风险不受控制,甚至到最后运维人员都会觉得不知所措。如果业务系统足够多,物理设备大规模并过于分散,在硬件,软件,应用,场地,运维等各个方面都会带来复杂度,集中后,通过统一的视图进行管理,通过不断演练,能够实现最大程度的风险控制,而不是分散部署的风险失控。
对于可用性而言,要保证7*24小时的业务连续性,需要确保包括硬件,软件在内的各个层面的可靠性。IBM LinuxONE定位于整合大规模低使用率的负载以外,其同时也定位于支撑核心关键业务领域,硬件设计都是n+1保证高可用,无故障设计都是大于30年,在软件协同等方案提供成熟可靠的方案,运维上提供简便性。LinuxONE硬件设计来源于大型级,其稳定可靠性已经得到了几十年的市场验证,目前支撑着诸如银行,保险,零售,交通等行业的核心业务系统。
策略而言, 需要采取多层可用技术,比如硬件选择高可用架构,包括存储和网络等硬件设备,对于高可用而言,最简单的办法就是冗余。另外保证软件层的高可用,比如数据库,中间件,都有高可用方案,结合硬件技术制定互为补充的方案,包括运维人员的水平,需要提供充分的培训和多种场景的熟练演练以保证各个方面的成熟度。
要确保实现业务连续性,需要在进行基础架构规划设计时考虑两个方面因素:
第一:物理灾难
物理灾难包括单台设备(路由器、交换机、服务器、存储等)故障、机房故障(停电、自然灾害等)。解决单台设备故障的问题,
其实就是解决各个层面的单点问题。对于服务器层面,可通过虚拟化技术将服务器整合成为资源池,借助虚拟化技术的高可用保障机制(比如vmware的HA、FT等)提高服务器层面的高可用性。存储层面,可采用存储虚拟化技术(比如EMC的vplex,IBM的SVC设备)将存储端的诸多设备整合成为存储资源池,解决存储端的单点故障风险。或者采用目前正在逐步兴起的分布式存储技术,利用诸如vmware的vSAN、华为的Fusionstorage等产品将X86服务器上的大量硬盘整合成为分布式存储,在提高存储端性能和高可用性的同时,降低成本。
应对数据中心整个机房出现瘫痪的情况,解决之道无非就是同城/异地容灾或者双活数据中心。容灾解决方案目前包括vmware的SRM、飞康的CDP、EMC的recoverpoint等。
第二:逻辑灾难
逻辑灾难指由来自网络层面的恶意攻击以及人为误操作引发的数据丢失、配置错误,从而引起业务的中断。所以,在进行基础架构规划设计时除了了需要妥善考虑网络安全层面的防护措施(防火墙、IPS/IDS,防病毒软件)之外,还需要充分考虑系统和数据备份策略,确保拥有一套完善的备份机制。此外,针对系统运维过程中的人工操作,如条件允许最好能建立诸如ITIL体系的运维机制。
收起