造成IT架构不可用的原因分析

本资料无预览

如感兴趣请购买后下载

立即下载

资料简介:
造成IT架构不可用的原因有很多,主要包括非计划性宕机和计划性宕机两大类,其中,非计划性宕机主要是由计算机故障或数据故障引起的;计划性宕机主要是由于生产系统的数据改变或系统改变引起的。

非计划性宕机

非计划性宕机主要包括主机宕机、数据故障宕机、存储故障、人为错误、数据损坏、站点故障等。

主机故障宕机

当主机系统或数据库服务器出现意外故障并导致服务中断时,主机系统就会发生故障。

据故障宕机

数据故障是指丢失、损坏或破坏关键企业数据。数据故障的原因比计算机故障更加错综复杂,可能由于存储硬件、人为错误、损坏或站点故障引起。

存储故障

单一存储配置,目前都是采用磁盘RAID技术加热备磁盘来解决,因此存储系统的故障主要是由机房电力故障或人为因素导致存储设备的电源发生故障。

人为错误

人为错误包括:误删除重要数据或升级语句中不正确的“WHERE”子句更新了比预定更多的行。

数据损坏

数据损坏通常由 I/O 堆栈中的故障组件导致,例如,数据库将 I/O 作为更新交易的结果,该数据库 I/O 将在各个组件中进行传输,包括:操作系统的 I/O 代码、文件系统、卷管理器、设备驱动程序、主机总线适配器、存储控制器和磁盘驱动器,直至最后被写入。I/O 堆栈中任何组件发生错误或硬件故障,都可能“变换”数据中的一些位,进而导致损坏的数据被写入数据库中,这一损坏可能是数据库控制信息或用户数据,它们对于数据库的正常工作至关重要;同样,磁盘故障也可能损坏数据。

站点故障

数据保护特性提供了预防灾难性事件的能力,这些事件可能在某一段时间内严重减缓站点的处理能力,这些事件包括文件损坏、自然灾害、电力或通信中断,甚至恐怖活动。

计划性宕机

计划性宕机是IT系统在运行阶段所不可避免的,但IT系统停机运维会影响到数据库停止对外提供服务,会对业务运营造成一定影响,特别是对7×24×365的业务系统、计费系统、在线交易系统等。

计划内停机包括例行操作、定期维护和部署新设备等:例行操作指频繁进行的维护任务,包括备份、性能管理、用户管理和批处理;定期维护,如安装补丁和重新配置系统,只是偶尔进行,以更新数据库、应用程序、操作系统、中间件或网络;部署新设备包括硬件、操作系统、据库、应用程序、中间件或网络的重大升级。

申请计划停机时不仅要考虑计划的停机时间,同时还要考虑因停机造成的对整个业务系统的影响。

数据更改导致的停机

对于数据的更改例如增加数据空间、改变数据库的对象,添加及删除数据库对象,对数据库的参数进行调整等操作,都有可能导致计划性停机。

系统更改而导致的停机

由于系统更改导致的停机主要表现在两方面:一是主机系统的更改,例如更新设备、添加硬件、调整参数造成主机系统重启;二是数据库系统的更改,例如数据库补丁升级,调整一些重要参数需要重新启动数据库的运维操作。
2010-10-18
浏览3976
下载0

已下载用户的评价

您还未下载该资料,不能发表评价;
查看我的 待评价资源
本资料还没有评价。

贡献者

yinxin系统管理员,银信长远
X社区推广