zp_ccc
作者zp_ccc·2021-06-07 15:57
高级技术主管·国内某金融科技公司

云计算环境下的企业灾备规划及建设痛点在线技术交流总结

字数 6431阅读 3859评论 0赞 1

云计算环境下的企业灾备规划及建设痛点在线技术交流总结

随着中共中央政治局常委会提出加快包括数据中心在内的“新基建”进度,各地政府陆续出台或制定相应政策,加大建设投资力度,强化要素保障与安全保障体系。数据中心作为数字时代各项服务的基础设施,将得到更大力度的发展支持。需求端对专有云市场的快速带动主要得益于:

a)政企机构上云对业务稳定、数据安全和灵活性的双重关注;

b)物联网的快速普及带动边缘端的快速兴起,企业需构建云、边、端的专有管理平台;

c)数据的重要性不断彰显,跨平台打通管理云端与本地数据更易于部署及管理;

d)企业内部IT流程与云端无缝衔接,数据双向迁移,可帮助企业产生新的业务价值。

公有云不需要客户建设基础设施,也无需考虑运维问题,但其安全性始终是中大型企业的核心顾虑。与此同时,私有云建设成本和运维成本高昂,定制化程度较高,在管理复杂度、可靠性、资源利用率等方面会遇到较大瓶颈,无法做到像公有云那样弹性平滑的服务体验。

企业上云主要源于两个刚需:

1)对现有计算资源的完全管理,方便虚拟化及池化,同时还要有较好的弹性拓展能力;

2)对企业自身的数据管理的安全性需求。

这些需求让介于公有云和私有云之间的专有云得到了青睐。专有云既拥有公有云迁移的便利性和弹性伸缩能力,方便企业上云;又能通过平台化和自动化的安全配置管理,有效降低企业在安全治理方面的门槛及成本投入,有效保护客户的数据不被泄露损坏丢失,不被挪用盗用。专有云为企业提供更稳定的业务发布,交付可承诺的SLA、更快的访问速度、更灵活的业务架构,加速企业转型。

不管是公有云,私有云还是专有云,未来企业上云的需求已经成为潮流趋势,云计算作为信息系统的基座,已经可以各行业领域提供资源服务,随着企业云上应用的日益增多,上云的企业越来越多,企业业务连续性方面提出了更高的要求,很多行业都发布了相应的规范,例如:

国家标准31168-2014 信息安全技术云计算服务安全能力要求 中有 对应急和灾备有明确要求

国家标准34080.2-2017 基于云计算的电子政务公共平台安全规范 中有对数据存储,备份,恢复,应急响应,演练有明确要求

2018年8月15日,人民银行发布并实施 云计算技术金融应用规范 其中规定了金融领域云计算平台的容灾要求,包括云计算平台容灾能力分级、灾难恢复预案与演练、组织管理、监控管理、监督管理等内容。等等……

本次 研讨的就是云计算环境下,各行业的灾备需求,灾备痛点,以及如何建设一整套合规且可实施的解决灾备解决方案 , 本次的线上交流总结如下 :

1.谈谈云环境下的灾备如何进行设计?

云已经作为IT基础设施一部分了,传统IT设备的需求逐渐会转变为对云资源的需求,并且云原生应用的普及,未来云上的应用会越来越丰富,本次讨论的初衷是想越来越多的关键业务在云环境上的应用,一定会需要灾备,一定会考虑业务连续性,那么在当前云环境下如何做灾备规划,传统灾备技术和云环境下灾备技术的异同……希望朋友们多多讨论。

回复一:

cpc1989 存储工程师 , 某保险公司

灾备规划还是先要确定灾备建设需求,哪些系统需要做灾备、灾备系统的服务能力,RTO,RPO等,传统灾备和云灾备并没有本质区别; 然后是灾备方案选择,传统灾备技术主要从网络、数据存储、计算资源冗余、应用集群这样几个层次去选择方案以满足灾备需求;而云环境下,不同于传统架构的分层,而是直接封装成平台,用于组合与管理各种IT资源,现在的规划难点还是在平台层的灾备方案,通常可以再搭建一套独立的灾备平台,但是数据复制和同步方案更多依赖于应用层,当然,随着灾备需求与云技术的发展,这一点也并会是一成不变的。

2.在专用云领域租户私有空间,软件层面有什么样的安全解决方案?**

数据安全一直是金融行业上云的一个关键问题,目前在专用云领域租户私有空间,软件层面有什么样的安全解决方案?是否能达到监管要求的标准?

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

因为这个讨论主要以灾备为主,所以谈到安全,主要考虑得数据安全。灾备就是数据安全的一个主要领域,主要保证数据的完整性和有效性,主要实现业务的连续性。云环境下的灾备更多的采用PaaS层或者IaaS+层以上的技术手段来实现数据灾备,例如数据库的灾备技术。数据安全同时还需要考虑保密性。保密有数据防篡改,数据防泄漏,未经授权不能访问,数据隔离防护,传输安全,存储安全等等技术领域。

3.保险行业混合云架构如何建设灾备环境?

保险行业因核心数据涉及客户敏感信息,在强监管的情况下,采用混合云架构的较多,构建应用上金融云、数据上私有云的基础环境;基于该种技术框架,如何建设合适的灾备环境?

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

基于云架构的应用可以考虑公有云或者行业云与私有云做互相灾备,但是还是要考虑数据的安全等级,数据的敏感性。 非云架构的应用,除非有上云改造的需求,否则还是按非云架构设计,没必要混。

回复二:

沈天真 售前支持 , 浪潮商用机器企业云创新中心

各做各的,理想的都做成两地三中心或者跨多云;

4.混合云灾备时怎样平衡网络的成本与质量?

做混合云实现灾备时,往往网络成为私有云与公有云之间的重要链路。要保障公有云与私有云之间的数据同步。就要有高质量的网络专线做保障,成本自然也会增高。有那些技术可以既保证公有云与私有云之间的网络质量。又降低成本呢

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

sdwan可以试试

回复二:

沈天真 售前支持 , 浪潮商用机器企业云创新中心

减少网络带宽占用,数据传输前最好都压缩,有些实时压缩的技术可以试试。

5.互联网企业云存储使用哪种解决方案,还使用集中式存储么?

如题,互联网企业云存储使用哪种解决方案,还使用集中式存储么?

回复一:

沈天真 售前支持 , 浪潮商用机器企业云创新中心

互联网企业还是互联网业务,要分清楚;互联网企业也有自用的需求的;任何时候都是两个字:场景;

回复二:

wangchen666 保密 , 保密

核心关键应用关注高可靠性,稳定高性能低时延,推荐集中式存储。 非核心应用主要关注价格成本、海量扩展能力,推荐分布式存储

回复三:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

现在云平台中多数采用分布式存储,某些特殊应用采用集中式存储,例如NAS,如果我来分类,NAS应该算集中式存储。

6.灾备云和云灾备有什么区别,目前哪种方式业内实现的方式比较多?

如题,灾备云和云灾备有什么区别,目前哪种方式业内实现的方式比较多?

回复一:

JanXC 系统架构师 , nec

灾备云?好像第一次听说呢。难道是将灾备所需要的存储、网络、灾备软件等建成统一的平台,对于灾备的对象提供自助式选择服务?同时配套这块提供相应的服务及恢复?

回复二:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

有这种概念的划分吗? 灾备云,是专门做灾备服务的云吗? 云灾备,是云上资源或者云间资源的灾备吗?

回复三:

赵海 技术经理 , 大连

我理解这两个不是一个东西。

灾备云,指的应该是做灾备的云计算架构载体。 云灾备,指的是云计算架构下的灾备解决方案。

7.灾备环境放在公有云上,相比放在本地灾备有什么最佳实践吗?

出于成本考虑,计划将部分业务的灾备放到阿里云,相比本地灾备,有什么额外值得注意的地方吗,谢谢

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

放在本地不好吗?除了有异地介质保存的需求。

回复二:

JanXC 系统架构师 , nec

1,网络的设计,包括云下云上的网络互通、带宽流量等 2,灾备切换的设计及演练,既然放到阿里云,出了问题怎么进行切换和恢复等 3,成本的计算,每年的投入相对比较固定 最好,还是要立足于企业自身的实际业务系统

8.在灾备云环境下如何使用SDWan优化现有网络?

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

SDWAN,主要作为现有网络的补充,主要应用于线路的备份或者不具备专线连接的地区,因为通过互联网线路+SDWAN,可以实现灵活的网络管理和低廉的带宽成本。

9.云计算环境下的故障隔离和容灾管理的难点?

由于云平台的多租户、虚拟化、资源池化等特性,系统间并不是完全隔离,故障影响存在着很大的不确定性,给灾难恢复的风险分析、影响评估及应急预案带来了新的挑战,应该如何做好云计算环境下的容灾管理工作?

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

这个问题很好,云平台的确存在内部的脆弱性和外部的风险。在考虑某个业务的连续性时,确实要考虑云平台这个基座,而且不能孤立的考量,需要结合起来。隔离域的界定确实时需要考虑的。

10.云灾备与本地私有云灾备的成本对比?

对于企业,最关心的莫过于成本了。目前多数云计算厂商都在大力宣传云计算的便捷,却少有对共有云与本地数据中心灾备的成本对比, 随着企业规模的扩大。公有云上的成本也普遍开始变得越来越高。而且每一项安全服务。业务增长都会像计程车计价器一样增长, 对于企业,是够有成两者的成本对比来说服企业开始接受。

回复一:

JanXC 系统架构师 , nec

好问题,完善我自己的一篇灾备方案文章时,要增加时成本对比。 云灾备的成本有:主机、网络、存储以及少部分的安全,其中存储比较便宜,网络相对贵一点,但是不同的云厂商有针对灾备专业的产品,价格上其实是大大降低的,但是怎么去建立灾备,这需要从系统和数据库的角度去进行部署实施。 本地私有云灾备也是需要主机、网络、存储、备份软件等,一次性投入成本较高,但是不需要跟云灾备一样每年否付同样的钱,另外网络费用相对降低,不过本地灾备达不到云灾备这种异地的效果。 最后,云其实没那么省钱,只能说是快。

11.云灾备的资源鉴权如何设计?

因为云计算的资源归属主,设计云灾备时候,通常会采用哪种设计来变更两朵云之间计算资源的属主?

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

不同的云厂商,提供的资源授权机制是不同的,不通用。

12.云灾备的RPO范围通常是多少?

云灾备通常会采取哪种数据同步方式?RPO的范围通常是多少?谢谢

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

RPO,RTO是在企业做BIA时确定的,关注的时系统的影响情况。

13.跨云灾备有没有成熟方案?

跨云厂商的方案,有没有成熟的系统平台。

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

备份的解决方案有很多了,多云环境下的备份,国内,国外都有很多产品。 谈到灾备,就要考虑灾难恢复,这种情况下复杂的多,因为业务的恢复,不仅仅是数据恢复,还要有承载业务运行的计算,存储,网络等环境。不同的云提供的服务是有差异的,如何做到平滑的业务切换是有难度的,比如,拿网络来说,需要业务重续运行,域名的发布就是需要考虑的问题。

回复二:

wanggy 系统工程师 , 戴尔科技金融行业解决方案中心

跨云的解决方案,通常都是通过第三方的解决方案完成应用、数据级别的灾备。 对于数据级别的跨云灾备,可以考虑通过数据备份、去重传输的方法,完成备份数据在各个云之间的去重加密传输,实现数据级容灾。

14.云灾备方案中,应该如何考虑数据灾备,保障数据一致性?

回复一:

wanggy 系统工程师 , 戴尔科技金融行业解决方案中心

云灾备方案,也是分为应用级和数据级。 应用级别的灾备,需要考虑业务层面、网络层面、数据层面的各种因素,实现RPO/RTO为分钟、小时级别的灾备。也需要考虑计算资源、存储资源、网络资源的运营成本。 数据级别的灾备,一般要考虑数据的安全、存储空间成本、网络带宽成本。一般通过备份系统实现数据备份到云,采用去重压缩加密技术将数据写入云中。

15.在已有的灾备环境下,成本最小前提下实施云灾备的解决方案?

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

备份到云是一种思路,主要看云资源是否成本低廉。 如果做到灾难恢复,需要考虑的因素就很多,涉及现有的业务如何上云的问题。那么触发企业做这件事的动机是什么呢?

回复二:

wanggy 系统工程师 , 戴尔科技金融行业解决方案中心

对于已有的灾备环境,应用级别的灾备需要考虑很复杂的适配性,才可以将业务运行在云端。目前,以主机托管方式比较多! 但是对于“数据级”的灾备建设,一般通过备份的手段先备份到本地,然后通过压缩消重加密复制到云端,实现数据级别的灾备。

16.金融行业会考虑在公有云的灾备吗?

我理解金融行业目前是不会考虑在公有云的灾备的,私有云的灾备方案建设比较成熟的!

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

保险应该有用的,银行目前还是比较谨慎。

回复二:

匿名用户

不会,因为不符合监管要求

回复三:

myangel 存储工程师 , hj

基于安全考虑,金融行业是不会#考虑在公有云的灾备,会搭建私有云

17.灾备环境PAAS云平台如何与生产环境PAAS平台数据同步和应用同步?**

灾备环境PAAS云平台如何与生产环境PAAS平台数据同步和应用同步

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

通过PaaS层的应用实现数据同步,例如数据库复制技术,当然有一些会把数据库归为IaaS+层,这里只提供一个思路,和传统方式有区别,不会通过底层技术来实现,例如IaaS层,主要是技术瓶颈以及不够灵活。

18.相比于传统灾备架构,云环境的灾备架构规划会有哪些异同点?**

传统灾备方案主要是从网络、服务器、存储、数据库等IT基础架构层开始规划设计两地三中心架构,那么相比于传统灾备架构,云环境的灾备架构规划又该如何展开?会有哪些异同点?

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

基于业务入手,关联IT系统,做BIA分析,得出灾难恢复目标,然后根据不同的技术特点选择不同的灾备技术,我觉得流程和思路和传统没太多区别。 区别在于业务连续性规划中要把平台的风险,应急预案中要考虑平台的因素,同时灾备解决方案中技术选择上面和传统架构有比较大的区别。

19.我们是要建立一个云灾备还是基于云下云上的多活中心?**

对于云灾备的建设,我们要明确一点,我们是单纯建立一个静默的灾备中心用于接管故障时的主数据中心,还是建立一个与主数据中心互备的多活中心共同提供服务?对于云上、云下互备的多活中心,方案有哪些?

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

某个企业自建云数据中心,仅仅作为灾备中心使用,除非这个企业未来想作为灾备服务的提供商,提供灾备云服务,为更多的企业提供灾备服务,我觉得才值得。 通常云计算中心还是以提供云服务为主,灾备服务只是云服务的一个很小部分。

20.云环境下的灾备切换?**

目前企业云环境中主要跑非关键业务的系统,数据库也未直接上云,云环境上的灾备切换是如何实现,与传统的架构容灾有哪些区别。

回复一:

张鹏 高级技术主管 , 中国金融电子化公司-中小金融机构灾备服务中心

前面提到了一些观点,简单总结一下 还是建议传统架构的灾备保留传统灾备方案,云原生应用,基于云原生的技术实现业务连续性,有上云需求的应用,要考虑是否适合云环境,适合云环境的可以基于云计算技术实现灾备,例如PaaS层的一些灾备解决方案,不具备上云的还是采用传统方式。 切换主要是设计好应急恢复预案,各业务,各环境协同工作,云上应用结合传统架构,当前也有一些DR应急切换的工具可以统一管理。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广