雪山飞狐ZZB
作者雪山飞狐ZZB2018-05-14 14:45
技术总监, 某IT企业

政府行业信息化存储服务器数据备份项目需求分析

字数 6394阅读 5971评论 0赞 4

一. 项目的背景原因

随着信息产业行业的迅速发展,各重要行政单位局域网和互联网络的深入应用,系统内的服务器担负着企业的关键应用,存储着重要的信息和数据,为领导及决策部门提供综合信息查询的服务,为网络环境下的大量客户机提供快速高效的信息查询、数据处理和INTERNET等的各项服务。各政府职能部门均提出了数字化工程,如数字城管、数字国土、应急指挥、数字公安、数字环保、数字工商、出租屋与流动人口管理等。这些都是数字城市建设的重要应用系统,随着这些工程的推进,预计未来对空间基础数据需求的数量、质量、信息类别将会有大幅度的增加。

在上述情况下,为了有效利用空间信息资源,给各类用户提供空间基础数据服务,考虑到数据的保密性和安全性,迫切需要建立一个信息安全平台来统一信息源及建立共享、数据备份机制以支持各项工程的顺利开展。

二. 项目范围

项目环境属于重要的行政单位,IT架构也是按照传统架构设计。随着IT业务发展和运行, 已经不能单单仅限于企业的内部局域网数据上的规划和操作,项目的范围体系包括项目实际生产数据的核心范围,包括在小型机设备,x86服务器设备,存储设备和客户要求的所有备份环境。

三.项目的优势和必要性

3.1 数据备份的意义

目前,从国际上来看,以美国为首的发达国家都非常重视数据存储备份技术,而且将其充分利用,服务器与磁带机的连接已经达到60%以上。而在国内,据专业调查机构调查显示,只有不到15%的服务器连有备份设备,这就意味着85%以上的服务器中的数据面临着随时有可能遭到全部破坏的危险。而且这 15%中绝大部分是属于金融、电信、证券等大型企业领域或事业单位。由此可见,国内用户对备份的认识与国外相比存在着相当大的差距。

因为中小企业占比较多数,信息化程度比较低,因此对网络的依赖程度也就小许多。另一方面,很多企业大多数是属于刚起步的中小型企业,它们还没有像一些著名企业那样丰富的经历,更少有国外公司那样因数据丢失或毁坏而遭受重大损失的亲身体验。所以很多都放松了对这一块数据备份的建设,只是一味追求生产数据,在现在的社会网络大环境中,即使是小型企业也可能有许多的工作通过网络来完成,也必将有许多企业信息以数据的形式而保存在服务器或计算机上。它们对计算机和网络的依赖程度必将一天天加重。由此可见,无论是国内的大型企业,还是占有绝大多数的中小型企业,都必须从现在起重视数据备份这一项我们以前总认为“无用”的工作。一旦等到重大损失出现,再来补救就为时已晚。

3.2 数据破坏的主要原因

我们再来看看关于数据破坏的种种原因。虽然我们不可能全面避免这些不利因素的发生,但至少我们可以做到有针对性的预防。而且有些主观上的因素还是可以尽量减少的。

目前造成网络数据破坏的原因主要有以下几个方面:
(1)自然灾害,如水灾、火灾、雷击、地震等造成计算机系统的破坏,导致存储数据被破坏或丢失,这属于客观因素我们无能为力。
(2)计算机设备故障,其中包括存储介质的老化、失效,这也属于客观原因,但可以提前预防,只需经常做到维护,就可以及时发现问题,避免灾难的发生。
(3)系统管理员及维护人员的误操作,这属于主观因素,虽然不可能完全避免,但至少可以尽量减少。
(4)病毒感染造成的数据破坏和网络上的“黑客”攻击,这虽然也可归属于客观因素,但其实我们还是可以做好预防的,而且还有可能完全避免这类灾难的发生。

3.3 数据备份的几个错误认识

在一般人脑海里,往往把备份和拷贝等同起来,把备份单纯看做是更换磁带、为磁带编号等一个完全程式化的、单调的操作过程。其实不然,因为除了拷贝外,还包括更重要的内容,如备份管理和数据恢复。备份管理包括备份计划的制订,自动备份活动程序的编写、备份日志记录的管理等。事实上,备份管理是一个全面的概念,它不仅包含制度的制定和磁带的管理,而且还能决定引进备份技术,如备份技术的选择、备份设备的选择、介质的选择乃至软件技术的挑选等。

也有不少人往往也把双机热备份、磁盘阵列备份以及磁盘镜像备份等硬件备份的内容和数据存储备份相提并论。事实上,所有的硬件备份都不能代替数据存储备份,硬件备份只是拿一个系统、一个设备等作牺牲来换取另一台系统或设备在短暂时间内的安全。若发生人为的错误、自然灾害、电源故障、病毒侵袭等,引起的后果就不堪设想,如造成所有系统瘫痪,所有设备无法运行,由此引起的数据丢失也就无法恢复了。事实证明,只有数据存储备份才能为人们提供万无一失的数据安全保护。

还有一种就是把数据备份与服务器的容错技术混淆起来,这也是错误的。数据备份指的是指数据从在线状态,分离存储在离线的存储媒体的过程,这与服务器高可用集群等容错技术有着本质区别。虽然从目的上讲,这些技术都是为了消除或减弱意外事件给系统带来的影响,但是,由于其侧重的方向不同,实现的手段和产生的效果也不尽相同。容错的目的,是为了保证系统的高可用性。也就是说,当意外发生时,系统所提供的服务和功能不会因此而中断。对数据而言,容错技术是保护服务器系统的在线状态,不会因单点故障而引起停机,保证数据可以随时被访问。

备份的目的是将整个系统的数据或状态保存下来,这种方式不仅可以挽回硬件设备损坏带来的损失,也可以挽回系统错误和人为恶意破坏的损失。然而,一般来说,数据备份技术并不保证系统的实时可用性。也就是说,一旦意外发生,备份技术只保证数据可以恢复,但是恢复过程需要一定的时间,在此期间,系统是不可用的。而且系统恢复的程度也不能保证是系统破坏前的即时状态,通常会有一定数据丢失的损坏,除非是进行了不间断的在线备份。通常在具有一定规模的系统中,备份技术、服务器容错技术互相不可替代,但又都是不可缺少的,共同保证着系统的正常运转和数据的完整。

虽然现在很多的网络操作系统中都集成了数据备份功能,而且功能还比较强大,完全可以满足中小型企业需求,但是对于在数据备份和容灾方面需求较高的企业用户来说,Windows网络操作系统的“备份”工具是远不能满足企业需求的,至少它不能进行网络备份,也不支持像磁盘塔、光盘共塔等大型数据备份系统,也不提供远程镜像、快速复制、在线备份等功能。所以这些企业用户至需求选择一些专门的第三方数据备份和容灾系统。当然这个选择也是要有依据的,并不是所有第三方备份系统都适合自己用户的需求。选择的考虑方面主要是价格、功能模块和售后服务等几个方面。

四.风险管理

4.1 面临的数据风险

现在很多事业单位和企业都面临很多一些数据风险,数据风险有两个关键领域,而这些都关系到如何将数据提交给客户。第一个风险涉及数据可被非授权的系统进行访问。第二个风险是非授权的人员访问数据。特别是对数据的综合安全保护这一块,往往是最容易忽视的环节之一。很多时候一家企业的生存或消亡往往在于企业数据是否得到相应的备份和管理,特别是现在大数据时代,如何对数据进行统一,高效,安全的管理应用,这是一个值得面临的深刻问题。

  1. 重视力度不够:导致数据丢失的其中一个很重要的原因是没数据保护意识或存在侥幸心理,造成数据丢失无法恢复等灾难性事件的大部分因素是由于企业对数据安全缺乏必要的重视力度及相应的防护措施不够而引起的。
  2. 财政预算所限:企业的财政力度对数据安全的支持不足,很大部分的中小型企业由于受到企业经济能力的客观因素制约,虽然他们意识到数据安全的重要性与面临问题的严重性,但昂贵的专业存储备份设备对他们而言似乎遥不可及。动辄数万或数十万的中高端存储备份设备不是他们可以涉猎的范畴,而诸如网络硬盘、Ghost、移动硬盘等一些低端的存储备份设备又不能使他们宝贵的数据得到有效的保障。这就造就所谓中小型高不成低不就的尴尬。
  3. 缺少相关的专业人员或资讯:企业如果存在着严重的侥幸心理,可能根本不会购买备份设备,所有数据都只是存放于日常工作的PC上,但操作系统对于数据来说是不安全的,因为在这些通用平台中,用户或应用程序可以很容易地对数据和文件进行任何操作,包括添加、删除、修改等。人为的有意或无意误操作、病毒的破坏、应用软件的Bug、程序运行冲突等,均可能导致在线数据丢失。

4.2 数据风险定级

数据安全等级保护的前提是需要对系统的数据安全风险进行定级、系统定级主要是根据信息的机密性、完整性、可用性来确定的,数据安全等级保护的思想和风险评估对于信息资产有着非常重要的效果,数据安全等级保护工程是非常重要的,是保护企业数据的前提,也是定级的核心所在,在分类的时候主要按照以下的原则来划分。

第一:按照企业固定资产的涉密程度来进行分类,价钱、重要性都是区分资产等级的关键因素,并且还会拿出资产的清单。
第二:我们可以根据资产的性质、业务范围、密集、接触的范围、重要性、失密所造成的损失的因素来进行划分,更好的确定保密的等级和相关等级的保护措施。
第三:数据安全等级可以根据资产保护的责任人,并且在最短的时间内进行审核,确保资产的价值。
第四:数据安全等级可以根据涉密的人团、场合、信息资料、信息系统、涉密的文件来进行划分。
第五:数据安全等级可以按照保密的对象进行划分,人员也是可以进行划分的,这样才能对我们的信息进行区分。

4.3 应对风险

首先,有人认为复制就是备份,其实单纯复制数据无法使数据留下历史记录,也无法留下系统的目录索引或者注册表内容等信息。有可能会造成数据无法正常使用的情况。

完整的备份包括自动化的数据管理与系统的全面恢复,因此,从这个意义上说,备份=拷贝+管理;其次,以硬件备份代替备份。虽然很多服务器都采取了容错设计,即硬盘备份(双机热备份、磁盘阵列与磁盘镜像等),但这些都不是理想的备份方案。比如双机热备份中,如果两台服务器同时出现故障,那么整个系统便陷入瘫痪状态,因此存在的风险还是相当大的;此外,只把数据文件作为备份的目标。有人认为备份只是对数据文件的备份,系统文件与应用程序无需进行备份,因为它们可以通过安装盘重新进行安装。事实上,考虑到安装和调试整个系统的时间可能要持续好几天,其中花费的投入是十分不必要的, 因此,最有效的备份方式是对整个系统架构进行备份。很多时候,企业几个GB的工程数据价值远远超过几千万人民币,而同样容量商业数据有可能以亿元来衡量,就不用谈及整个系统的价值了。这还不完全是要据进行备份的全部原因,

五.需求规定

5.1先进的数据恢复技术,缩短备份和恢复时间

存储管理软件能够为用户提供专业的数据备份功能,能够提供多种级别的数据备份,如文件系统备份,应用系统备份,数据库备份,邮件系统备份,操作系统备份等不同的备份类别。TSM能够支持绝大多数主流操作系统平台,主流的应用,根据用户需求为不同的用户定制合适的备份解决方案。

5.2流程化的灾难恢复管理

存储管理软件提供专业的文件系统数据归档功能。TSM提供独立的归档策略,能够为不同的数据对象指定不同的归档保存时间,并能够在归档时提供文件本地保留或从本地删除不同的选择。

5.3专业的数据归档管理功能

存储管理软件提供专业的文件系统数据归档功能。TSM提供独立的归档策略,能够为不同的数据对象指定不同的归档保存时间,并能够在归档时提供文件本地保留或从本地删除不同的选择。

5.4利用分层存储提高效率

存储管理软件能够提供专业的文件系统分级存储功能,能够将磁带等存储设备作为文件系统的二级存储,定制策略将访问较少的文件从服务器的文件系统迁移到TSM所管理的磁带库中,并在本地保留一个存根文件,整个过程可以自动完成,也可以手动迁移。当应用系统或者管理员访问该文件时,可以在后台自动将文件迁移回本地。

六.技术运行环境

6.1 设计原则

  1. 先进性原则:选择的产品既要考虑设备标准的先进性,同时也要兼顾技术的成熟性。
  2. 可用性:技术方案要求提供不间断的服务应用,提供方便、友好的图形化管理界面。
  3. 开放性:提供的产品要求支持公开的国际、国内标准,可以利于各种系统平台之间集成和兼容使用。
  4. 可扩展性:选用的硬件设备、软件必须为今后的扩充、扩展留有足够余地。

设计目标:

  1. 可靠性:采用多路径和备份的方式,确保业务的高连续、稳定和可恢复。
  2. 稳定性:使用高性能、稳定性高的小型机,确保业务稳定运行。
  3. 一体化整合价值:高达1024线程的并行处理能力,实现一体化整合价值,从处理器到服务器,从操作系统、虚拟化 到中间软件。
  4. 无间断的业务弹性:POWER7实现持续的可用性,是高可用和高可扩展的系统。

6.2 运行环境和拓扑结构

微信图片_20180514143436.png

微信图片_20180514143436.png

6.3 设备选型

微信截图_20180514144051.png

微信截图_20180514144051.png

6.4 技术标准

6.4.1 功能标准

备份对象
运行平台
备份模式
存储介质
系统管理功能
增强功能

6.4.2 性能标准

备份速度
恢复速度
占用资源
最大驱动器数
最大磁带槽位
最大磁带数

6.4.3 安全标准

安全审计
用户数据保护
标识和鉴别
功能保护

七.方案概述

7.1小型机部署

采用IBM POWER 740小型机部署关键业务,确保稳定性和性能,小型机rootvg 系统盘做镜像,保证其中任何一块盘做出现物理故障时都能使系统能正常运行,并且提供HACMP 双机,使其任何一台主机当机时,实现资源接管。

7.2 hp 服务器部署

四台PC服务器其中两台dl580g9磁盘总空间为600GB12=7200GB(每一台6个硬盘),采用Raid5模式,提高数据的可靠性,另外两台dl388g7磁盘总空间为300GB6=1800GB 采用Raid5模式,安装Windows server 2012(64位) 操作系统,另外两台dl580g9服务器分别挂载总容量为5TB的存储盘提供给数据库用。

7.3 Cisco md9214光纤交换机:

采用2台光纤交换机作为SAN核心交换机; 服务器采用单/多模光纤与两台SAN交换机进行冗余连接。

7.4 EMC VNXe5200存储

采用EMC VNXe5200企业级存储系统构建集中的存储设施,用于存放本区内所有应用服务器的重要数据;

7.5 昆腾I500磁带库:

带库部署在SAN网络中,能够使得备份在存储和带库光纤网络间直接进行,加快了备份速度,同时减轻了服务器和网络的负担,也可通过LAN-free方式构建集中备份系统,避免网络堵塞。

7.6 Netbackup 7.1

对用户关键数据的提供数据备份与恢复,NetBackup提供了高性能数据保护,它可以扩展以保护最庞大的 UNIX、Window、Linux 和 NetWare 环境。NetBackup 可以为远程办公室到数据中心乃至存储库提供全面防护,它提供单个控制台来完成所有备份和恢复操作。

八.测试计划

8.1 测试目标

通过确认测试后,该系统将在用户现场投入试运行。并能保证系统在出现故障的情况下能重新启动运行,或者花费较少的时间与人力等代价进行修复与维护来保证系统正常运行

8.2 测试范围

本次测试采用系统测试,按所要集成的子系统或完整的业务功能进行系统描述。首先定义测试的内容概述,然后各个子系统进行测试需求的详细说明

8.3测试风险分析

测试人员对系统熟悉程度的风险:
参与本项目的测试人员都是第一次接触该类型系统,在经过短期的系统培训后,仍然有可能没有完全掌握系统的业务细节,这将在后面的测试设计和测试执行工作造成一些测试逃逸现象(即一些要测试的方面没有测到)。

系统资料方面的风险:
被测试的系统没有完备的开发文档,测试人员做测试设计时能够参考的只是使用手册和训练手册,以及通过培训和初步使用后对系统的了解,可能导致测试人员在初期无法全面地对系统进行深入的测试。

时间方面的风险:
本次项目时间只有一个月,却要完成测试规范的制定、整套测试用例的设计和执行一轮完整的测试,时间进度非常紧张,可能导致测试设计工作不够完善。

8.4 测试过程

微信截图_20180514144459.png

微信截图_20180514144459.png

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

4

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

最佳实践
不同的领域,都有先行者,实践者,用他们的最佳实践来加速更多企业的建设项目落地。

作者其他文章

相关文章

相关问题

相关资料

X社区推广