lzg21st
作者lzg21st·2022-02-28 14:12
存储工程师·brcb

如何实现城商行重要系统NAS双活切换交流探讨总结

字数 11411阅读 1942评论 0赞 2

当前,银行业务对计算机系统的依赖性已超乎想象,而地震、台风、火灾、疫情、电力故障和通讯故障等灾害事件时有发生,因此,提升灾难事件发生时的信息系统的可用性成为金融行业信息系统研究和建设的重要课题。为提升单数据中心故障场景下,信息系统的服务能力,信息系统同城双活运行越来越成为一种主流配置,降低同城切换RTO的同时,还能提高同城资源使用率,提升投资回报率。

银行业传统的信息系统通常为有状态的,需要保存和传递过程数据,信息系统的双活改造过程中需要实现该过程数据的共享读写,NAS存储很好的满足了该需求,在信息系统双活中心得到了广泛的应用,逐渐与数据库一样成为传统信息系统双活的标配。因此,NAS存储承载了几乎全量的传统信息系统,其重要性不言而喻,一旦故障,将会导致大量的信息系统不可使用,后果很难想象,若能够实现NAS存储双活,将进一步降低此类运行风险问题。

本次活动交流的主题将围绕着NAS能否实现双活,双活实现的难点有哪些。twt社区特别邀请来自金融行业的专家和华为的专家一同参与线上的交流探讨,本期的交流探讨主要围绕:1、NAS双活应用场景及案例;2、NAS双活数据一致性及切换难点;3、NAS如何实现双活及技术架构。这三方面进行详细交流和分享,希望本场的交流分享能给大家带来参考和帮助。

一、NAS双活应用场景及案例选型

1、NAS双活的成功案例有哪些?

NAS存储在非结构化数据存储中应用广泛,经济实用,操作简单,安全性高,随着对业务连续性管理要求的不断提高,NAS双活的需求越来急迫,但近年来未看见成功案例。所以也想借此机会和专家请教下。现在NAS双活的应用案例情况。

嘉宾:lzg21st 存储工程师 , brcb
nas双活,目前来看,大多以ha方式部署,也就是说对于同一个文件系统是在一个站点提供io服务。区别于同步复制,nas双活架构在rpo为0的情况下,可以提供更低、分钟级的rto指标。从业务系统视角来看,对于有些无法或没有入库的文件,有些联机类的业务文件是有高可用的需求的,所以这时候nas跨中心的双活架构便应运而生了。当然,对于nas承载前端IAAS虚拟化的场景,如果有双中心的高可用需求,那么在存储层也有nas双活的用武之地。总之,要从实际的业务场景需求出发,来确定是否要做nas双活架构。同业来看,也有不少的nas双活落地案例了。

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
之前在中国建设银行,北京农商银行,平顶山银行,厦门国际银行等采用了类似方案落地。
NAS双活为客户提供以下跨站点的高可用持续保护;避免数据丢失的风险,减少系统宕机时间以及快速的灾难恢复等收益;如果是AA双活,还可以提供性能提升与并能简化管理。

2、NAS双活适用于哪些场景?

嘉宾:lzg21stlzg21st 存储工程师 , brcb
主要还是看业务需求,有些重要的业务系统的文件有灾备建设需求,同时希望在站点级故障时可以获得更好的rto指标的时候,可以考虑部署nas双活架构。

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
这个主要还是需要从业务的价值和需求角度出发来进行衡量。
如果有业务连续性和容灾方面诉求的,都可以考虑使用双活的方案。通过双活可达到RPO=0,RTO≈0的效果。

3、NAS双活适合部署哪些业务系统?

哪些业务适合部署在NAS环境?如何进行数据迁移?

嘉宾:lzg21st 存储工程师 , brcb
nas的应用场景还是较为广泛的,对于文件共享场景或者不同业务系统间做文件交互都可以使用nas存储。数据迁移可直接采用文件拷贝的方式,如果是存储的老旧替换,尤其是同品牌,也可以采用存储侧的复制技术。

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
NAS的应用场景很广泛,非结构化的数据大都可以部署在NAS环境,典型的应用场景比如电子影像业务,数据交换平台相关业务等。对于这些应用,如果业务的连续性与可靠性要求的,可以基于实际情况考虑双活方式部署。
数据迁移有两种方式:
第一种是在主机侧,利用主机侧软件的功能进行数据迁移;
另一种是直接通过使用存储提供的能力进行迁移,比如利用复制,迁移等能力进行数据迁移。

4、现在nas存储能够实现真正双活的有哪些厂商,哪些产品?

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
目前在NAS双活细分领域主要有华为和NetApp两家。
NetApp AFF/FAS提供了MetriCluster功能,但是采用免网关的Active-Passive架构。
另外一个存储厂商EMC的Unity存储提供了syncMetro功能,目前只能实现网关的Active-Passive双活。
目前华为OceanStor Dorado全闪存与OceanStor混合闪存都支持HyperMetro功能呢,可以实现免网关的Active-Active架构双活。

5、国内厂商NAS架构的有些?

基于等保等政策的理解,我选择国内厂商存储,目前国内那些厂商具有NAS架构的?

嘉宾:lzg21st 存储工程师 , brcb
传统集中式nas存储这块,国产的华为,宏杉,浪潮等都有支持的产品。在做产品选型时,建议以实际业务需求为出发点,综合考量产品的技术成熟度、市场占有率情况、同业案例等等。

6、NAS双活各主流厂家解决方案的对比,各自优劣势如何?

面对各种各样的NAS双活解决方案,企业将如何面临选择?比如从架构、稳定性、价格、服务多方面进行分析。

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
目前来看,比较有代表性的主要有三个厂商。
EMC Unity提供了syncMetro功能,实现了基于网关的Active-Passive双活。
NetApp AFF/FAS的MetriCluster可以实现阵列双活,但是采用Actie-Passive架构。
华为HyperMetro采用阵列Active-Active的免网关双活架构。
从架构上讲,基于阵列的双活相较于网关可以简化组网配置,减低管理难度。
同时华为当前采用的Active-Active双活架构能够实现两个站点间负载均衡,在性能上更优秀;在故障时,倒换时间更短;站点恢复也业务自动回切,降低管理复。

嘉宾:lzg21st 存储工程师 , brcb
嗯,确实是这样,要综合衡量一个产品,这也就是综合评标法。
但最根本的出发点还得是和用户需求的匹配度,偏离度。
如果拿存储设备来说,安全稳定和技术成熟是最重要的。

二、NAS双活数据一致性及切换难点

1、银行是否有做NAS存储双活案例?如何保证双中心数据一致性?

NAS存储需不需要做双活部署,如果需要,怎样保证双中心的数据一致性。同行有类似案例是否可以参考?

嘉宾:sunaosunao 工程师 , 华为数据存储解决方案中心
关键的NAS业务建议使用双活进行部署。NAS双活为客户提供以下的收益:跨站点的高可用持续保护;避免数据丢失的风险,减少系统宕机时间以及快速的灾难恢复;如果是AA双活,还可以提供性能提升与并能简化管理。
之前在中国建设银行,北京农商银行,平顶山银行,厦门国际银行等采用了类似方案。
双中心数据一致性涉及到应用层面和存储一致性两个概念。存储的一致性通过实时镜像的方式来实现,保证位于两个站点的vStore之间数据的时刻一致,主机写操作通过实时镜像技术同时写入两个数据中心的双活成员文件系统。
应用层面可以结合备份等软件来完成。

2、华为NAS双活技术是否在存储级切换时,可以使客户端更快的恢复业务?

NAS存储绝大部分都是通过NFS协议进行访问的,在存储发生整机故障时会出现挂载点无法访问,影响业务的情况。华为的NAS双活技术是否对客户端有优化,在进行存储级切换时可以使客户端更快的恢复业务。

嘉宾:lzg21st 存储工程师 , brcb
这块其实取决于nfs协议本身,所以更多的需要在挂载参数选项上进行客户化,比如采用hard方式挂载,这样在存储切换后,给前端主机充分恢复连接的时间。

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
目前还没有对客户端进行优化
NFS 协议对故障切换有定义,我们实现了协议定义的功能,可以让 NFS 客户端在故障下无感知的进行业务切换。

3、如果作为服务器虚拟化存储,NAS双活及故障切换如何影响虚拟化的可用性?

将NAS作为虚拟化的后端存储,NAS双活及故障切换如何影响虚拟化的可用性?

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
双活本身故障在双活侧会进行自行切换,上层理论可以做到几乎无感知。
如果从解决的方案层面端到端考虑虚拟化场景的可用性,就需要结合存储,网络,主机,以及应用拉通进行拉通分析。
由于增加了虚拟化层,在主机侧增加了虚拟化的兼容性。这个又有两方面,需要关注将NAS资源挂载给虚拟化平台还是虚拟机本身。
如果是虚拟化平台,涉及到与虚拟化平台容灾组件之间的适配和兼容关系。

4、NAS如何保障数据存储的一致性和完整性?

嘉宾:lzg21st 存储工程师 , brcb
nas存储自身的数据完整性保护不用多说,对于传统集中式nas存储,底层磁盘是同样的raid保护。在双活nas架构中,将单存储的数据保护级别近一步得以提升。
此外,nas存储侧提供文件系统的定时快照功能,可以实现某种程度上粗粒度的逻辑错误规避,实现历史版本的回溯。
如果从nfs这种典型的nas存储协议使用上来看,一般客户端都有缓存一致性保障机制。可以参考nfs manual中的cache coherence章节,有这部分的介绍。

**sunao 工程师 , 华为数据存储解决方案中心
**首先在存储系统层面,RAID,存储内部可靠性软件,双活等方式都可以保证数据的完整性;
再这个基础上,存储或者主机侧应用也提供快照,备份等增值功能,如果应用或者其它原因出现逻辑错误,可以通过这些方法进行校验或者恢复,来保障数据的一致性。

5、部分城商行核心与外围应用系统状态与日志交互,对NAS的性能与双活保护的要求都有哪些?

当前金融行业核心系统NAS承担着与外围系统状态与日志交互的重要关键作用,一方面要求NAS满足落盘的速度,另一方面对子目录的访问控制权限的有所要求,例如:核心系统与各外围系统采用的交互日志,存放在接口目录下的多个二级目录中,每个二级目录有对应的的外围系统。NAS挂载时,要求二级目录挂载给核心和对应外围系统共享文件时,除了需要并针对二级目录做访问权限控制,还需要确保外围系统间的NAS安全访问,防止错位挂载二级目录带来安全隐患。
另外当前的NAS未采用双活架构,基本上是同步复制模式,切换和恢复操作较复杂,那么如果考虑切换和过渡成双活保护的NAS,增加了仲裁服务器之后,如何保证梳理好现有NAS服务配置工作,防止遗漏和错配,或者可以自动化工具去学习现有配置并完成双活NAS配置工作,避免重复性的收集核对配置工作,还能保证迁移的连续性和准确性?
第三、如果经过充分的测试后,在迁移双活NAS的过程中如何保证迁移过程的数据安全性和必要的快速回退保障?

嘉宾:lzg21st 存储工程师 , brcb
确实nas这块除了单业务系统服务器集群共享文件外,也可用于不同业务系统之间文件交互用。在多业务系统交互场景,要做好不同业务子目录的设置。每个业务系统建立自己的子目录,原则上,某个业务系统只有对自己的子目录有读写权限。对于存储侧的配置,可以按业务场景设置不同的租户进行安全隔离。此外,在满足业务系统权限需求时,要遵循最小授权的原则。除了上述安全性考量,nas存储侧一方面通过构建双活架构来提升数据中心级别的容灾能力,另一方面通过对文件系统设置快照策略,可以对文件历史版本或者误删除的文件实现快速回溯,这也是一层安全性保障。当然对于重要的文件,也可以通过ndmp协议离线备份到磁带库里。

对于nas双活改造后,原文件系统的迁移,对于文件量不大的业务系统,可以直接采用从操作系统层文件拷贝的方式做数据迁移。由于迁移过程中和迁移后,原文件系统只是更换了挂载点,所以数据安全还是有保障的。对于文件量比较大的文件系统,可以采用打包以及按文件的时间业务特性分批次做文件迁移。比如先迁移在线活跃的文件,这部分一般量不大。而对于历史文件,比如1年前的再分批迁移。也有的客户在存储前端设计开发了类似文件路由功能(可以了解下),这样在做文件迁移时对业务可以说就是透明的了。

嘉宾:freddie 存储工程师 , 某股份制银行
性能上需要区分联机类和非联机类,依据描述应该单纯指联机类数据,保障这类数据最好使用高可靠,高性能的全闪存储承载。建议关键路径的数据增加双活保护。

6、NAS双中心切换,主机层面如快速切换NAS挂载卷?

在双中心3DC架构下,实现A->B->C的NAS存储容灾架构,A->B的切换,应用主机节点可以几乎无感的快速切换,但是B->C的切换就需要进行umount和mount操作,请问各位专家,有没有好的解决办法,实现大量的应用节点无感的快速切换?

嘉宾:lzg21st 存储工程师 , brcb
我理解由于nfs的机制,以及结合实际测试结果,只要更换了nas服务端ip,那客户端需要以新的服务端ip重新挂载,重新和nas存储建立连接。至于快速挂载可以借助自动化运维工具平台设计自动化挂载流程。

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
用租户级复制, B->C也可以做到不需umount和mount
因为租户级复制会将所有的配置信息从主端复制到从端,再保证从端的IP地址激活的时候跟B一样的IP,就不需要umount
对于普通复制,用户如果可以手动保证 共享名 IP地址 权限 这些完全一致,也不用umount。

Purpose回复洪月
感谢回答问题,满足B到C的IP一样,这个条件的前提是大二层打通的方式。如果B到C仅为三层通,基于IP的数据复制方式,有没有好的解决方案?

洪月回复 purpose
B-C的IP必须一样,不然就需要remount了。三层网络,B端主机的IP地址需要能访问C端的存储的三层网络,这样可以配置虚IP,来使得B和C的IP地址相同,再配置VIP对应的B和C的BGP LIF,还有交换机的BGP网络peer,这涉及到网络配置的一定改变,会比较复杂。如果网络不好更改,最好的办法是做一个automount的脚本,当存储切换到C的时候,触发主机automount C的IP地址

三、NAS如何实现双活及技术架构。

1、同城NAS双活需要怎样的数据中心网络架构?

为了实现同城NAS双活的服务能力,需要两个数据中心件间的网络怎样构建?不同的网络结构(大二层、三层)最终对NAS切换有何影响?主流的NAS双活产品能够兼容怎样的网络条件?是否需要DNS支持?

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
NAS 双活对二层网络和三层网络都支持。
双活网络支持 FC 、 IP 、 RoCE 组网。当两端存储系统间距离在 100km 以内,且对性能要求较高时,可以选用 RoCE 复制链路。链路带宽应为业务峰值带宽的 2 倍,最大 RTT ( round-trip time )< 10ms ,网络误码率: ≤10-12 。
同城数据中心之间必须通过交换机 + 裸光纤互联。
对于 FC 或 RoCE 网络:距离 ≤25km 时可使用交换机 + 裸光纤直连,距离 ≥25km 必须使用波分设备构建数据中心间互联的网络。对于 IP 网络:距离 ≤80km 可使用交换机 + 裸光纤直连;距离 ≥80km ,必须使用波分设备构建数据中心间互联网络。

嘉宾:lzg21st 存储工程师 , brcb
nas双活架构中有几张网络,分别是:管理网,仲裁网,复制网还有业务网。对于双中心大二层是否打通,这里我们说的更多的指的是业务网络。在nas双活架构中,如果是大二层打通的业务网络,那可以获得更好的rto指标,因为两中心是一套ip地址,所以前端主机在nas发生站点切换时可以做到无感知。而对于没有大二层打通的架构,在nas发生站点切换时,是需要干预的,要以另一个站点的ip重新挂载文件系统。

2、AS存储双活是否有必要以应用系统为颗粒度做双活?

嘉宾:lzg21st 存储工程师 , brcb
这块还是看业务系统需求以及业务应用场景。有的nas存储在构建双活架构时,可以实现以业务系统作为独立租户的双活pair,这个无论是灵活性还是安全性都是有优势的。比如说,我们在做计划性切换演练时,可以有针对性地只切换双活系统中的某一个租户pair(对应某个业务系统)。

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
一般是以租户粒度做双活:租户内可以有多个相关的文件系统;租户内的本端文件系统与远端文件系统建立一个双活 Pair ,成为实现双活的最小单元。

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
以何种力度来做双活取决于业务层面的考虑。
如果我们需要保障的完整业务的可靠性,那么就需要从业务的全局出发来考虑双活的颗粒度。

3、传统三中心架构下NAS双活实施路径?

中小机构两地三中心架构下,实现NAS双活如何逐步进行?

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
首先需要对业务场景进行评估,确定可行的实现方案。
之后主要是进行实施前的评估,确定是否能够满足双活的要求,主要关注组网、存储层、主机以及业务相关的限制;
在满足的情况下就行进行详细的项目实施;

嘉宾:lzg21st 存储工程师 , brcb
看业务需求,如果有业务系统涉及的文件需要做同城灾备,需要在存储级或数据中心级发生故障时获得更好的rpo和rto指标,那就构建nas双活架构。至于异地灾备,也是看异地灾备的定位和业务需求,来决策是否再部署异地复制。

4、Nas网络技术支持?

不同的网络结构(大二层、三层)最终对NAS切换有何影响?主流的NAS双活产品能够兼容怎样的网络条件?是否需要DNS支持?为了实现同城NAS双活的服务能力,需要两个数据中心件间的网络怎样构建?不同的网络结构(大二层、三层)最终对NAS切换有何影响?主流的NAS双活产品能够兼容怎样的网络条件?是否需要DNS支持?为了实现同城NAS双活的服务能力,需要两个数据中心件间的网络怎样构建?不同的网络结构二层、三层)最终对NAS切换有何影响?主流的NAS双活产品能够兼容怎样的网络条件?是否需要DNS支持?

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
NAS 双活对二层网络和三层网络都支持。两种网络的业务切换速度差不多:首先 NAS 存储切换通常只需要 3-5 秒,二层的原理是通过 ARP 广播交换机刷新 MAC 地址和 IP 对应信息,然后通知客户端恢复业务。三层的原理是通过 BGP 协议通知网络中的三层交换机刷新路由,依赖网络条件,一般比二层慢 1-3 秒,然后客户端就可以恢复业务。
另外三层网络切换,需要双活站点的主机能打通网络访问对端的存储,如果访问不了存储,或者相关的 NFS/CIFS 的端口被禁止了,业务会断;而二层基本上不存在被网络限制的情况。
双活网络支持 FC 、 IP 、 RoCE 组网。链路带宽应为业务峰值带宽的 2 倍,最大 RTT < 10ms ,网络误码率: ≤10-12 。同城数据中心之间必须通过交换机 + 裸光纤互联。

嘉宾:lzg21st 存储工程师 , brcb
nas双活还是比较灵活的,对于不同的网络架构都可以实施。只是说如果双中心业务网打通了大二层,那么在存储发生站点切换时可以获得更好的全局rto指标,前端应用可以很容易的恢复nas连接。而对于大二层未打通的网络架构,由于双中心采用不同的ip地址,在发生存储站点切换后,前端应用需要重新以另一个站点的ip进行挂载。

5、NAS同城双活能否实现?

NAS同城双活怎么实现,如果一个中心出现问题,NAS切换过程中是否影响业务?怎么避免影响业务。

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
NAS双活分为两种部署模式:本地双活和同城双活。
如果一端站点由于掉电等原因导致故障,由另一端的正常站点自动接管业务,从上层业务的角度,切换中的业务归零时间约为 10-20 秒,主要是由于网络通信及协议本身等带来的开销
同城双活的实现组网参见下图:

嘉宾:lzg21st 存储工程师 , brcb
目前大多数的nas双活主要以ha即主备方式部署。当站点发生切换时,会有分钟级的rto。一般用nas存储这种非数据库交易场景,业务系统的延迟敏感性还是相对低的。

对于nas双活系统来讲,首先架构上要做到健壮性,业务网,数据复制网两张主要的网络做到高冗余。另外,文件系统nfs挂载上选用hard模式可以一定程度上提升nfs快速恢复,从而提高可用性指标。

6、NAS同城双活建设DNS是否必须?

在进行NAS同城双活的过程中DNS解析是否必须?如果不使用DNS怎么进行切换。

嘉宾:lzg21st 存储工程师 , brcb
dns不是必须的,dns的使用主要是简化主机挂载nas存储。尤其是在业务网大二层未打通的情况下,主机通过域名挂载,不用在fstab中使用两条不同中心业务ip地址的记录。

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
DNS不是必须的。DNS可以对访问的存储进行业务均衡和故障倒换。
典型的一体化双活故障处理流程:单点故障不影响业务,大部分双点故障场景下也不影响业务连续性。
1、如果仲裁服务器无故障,无论是链路故障,还是优先站点、非优先站点故障,都可以仲裁到存活站点提供服务,不影响业务连续性。
2、在仲裁服务器故障情况下,自动进入静态优先模式,无任何业务影响,此时如果非优先站点继续故障或站点间链路故障,优先站点继续对外提供服务,业务不中断。

7、NAS双活解决方案的最为核心的技术是哪一块?

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
从存储产品的角度,双活涉及到的关键技术例如:如何实现站点间数据的同步写并保证一致性;如何保证性能并实现多种故障场景下的可靠性策略等等。
从方案部署的角度,最核心的应该是网络的规划和部署。

嘉宾:lzg21st 存储工程师 , brcb
如果从使用者的角度看,个人觉得一个是组网,也就是不同功能的网络分离,如管理网,仲裁网,业务网和复制网。再一个是细粒度基于租户的双活配置,即可以实现单租户单业务系统的独立灾备切换。

如果从产品设计的角度看,在以上的基础上,可以发现有些nas双活时可以做到一定程度上的AA模式,即可以实现文件系统的近端访问。

8、NAS双活的效率及容错机制?

NAS双活是采用同步写还是准同步写实现?相比NAS单写,双活架构下会有多少性能效率的损失?
同时,如果出现某个节点或者同步链路故障,自动诊断及恢复时长会是什么水平?是否可以做到故障切换对上层应用透明?

嘉宾:lzg21st 存储工程师 , brcb
是同步写的,保证主从数据严格一致的。主端存储写入缓存后,然后会复制到从端存储的缓存,做一个链路往返后,一个io完成,所以性能损耗主要发生在中间链路上,一般是5个ms以下。
在双活nas架构中,一般分故障场景,对于不同的故障场景会有不同的rto指标。对于发生站点切换这种最长的rto场景,一般也是在2分钟内完成切换。在双中心大二层打通的情况下,对于nfs应用来讲,可以做到中断后自动恢复服务端连接,从而做到前端应用的连续性。

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
NAS 双活采用的是同步写。
性能影响与读写模式、双活距离、网络条件等强相关,:Active-Active 模式的双活下性能提升 30% , Active-Passive 模式下性能影响一般在 10% 左右。
在节点故障或者链路故障时,上层应用会有归零,一般在 10-20 秒。

9、nas双活的网络技术支持?

nas双活对于网络技术支持是否一定需要大二层?有没有大二层以为的更好网络解决方案支持跨数据中心NAS存储双活。

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
NAS 双活对二层和三层网络都支持。
两种网络的业务切换速度:首先 NAS 存储切换通常只需要 3-5 秒,二层的原理是通过 ARP 广播交换机刷新 MAC 地址和 IP 对应信息,然后通知客户端恢复业务。三层的原理是通过 BGP 协议通知网络中的三层交换机刷新路由,依赖网络条件,一般比二层慢 1-3 秒。
另外三层网络切换,需要双活站点的主机能打通网络访问对端的存储,如果访问不了存储,或者相关的 NFS/CIFS 的端口被禁止了,业务会断;而二层基本上不存在被网络限制的情况。
双活网络支持 FC 、 IP 、 RoCE 组网。链路带宽应为业务峰值带宽的 2 倍,最大 RTT < 10ms ,网络误码率: ≤10-12 。同城数据中心之间必须通过交换机 + 裸光纤互联。

嘉宾:sunao 工程师 , 华为数据存储解决方案中心
业务网络平面既可以支持大二层打通的网络架构,也支持不打通大二层,使用各中心独立IP地址的方案。
两种网络架构在存储端的RTO指标是一致的,而最主要的区别主要在于大二层打通的架构可以获得更好的主机端全局的RTO指标。
在大二层打通的情况下,当发生站点切换时,主机侧可以无感知的恢复NAS连接。而对于独立IP的方案,需要主机侧重新执行NAS存储的挂载。
如果没有打通大二层 ,如果想提升该方案中主机侧的RTO指标,可以利用自动化灾备切换系统编排进行NAS站点切换流程,比如定制切换脚本等。

嘉宾:lzg21st 存储工程师 , brcb
大二层不是必须的,但大二层可以得到更好的全局rto指标。在存储发生切换后,前端主机采用同样的ip挂载nas存储,所以无需重新mount文件系统可以自动恢复nfs挂载(cifs需要重新连接下)。

另外,先前有听厂商谈到BGP协议,但这块还要看数据中心自身的网络架构,这块可以多了解下。

10、应用层进行NAS双活实施步骤?

传统中小机构进行应用层NAS双活实施,路线及步骤应大致如何规划,是否按系统重要程度、稳态/敏态进行区分

嘉宾:lzg21st 存储工程师 , brcb
嗯,业务需求是源,底层存储的资源池建设包括存储高可用架构要视业务需求而定。对于核心以及重要系统,就匹配高性能,高可用的存储资源池。对于一般业务系统,一般也没必要建同城灾备,同时对存储性能诉求也不高,所以存储就可以选降一级的资源池。

嘉宾:洪月 企业存储产品规划 , 华为数据存储解决方案中心
NAS 双活主要还是用于关键的稳态业务,通过双活实现两个数据中心同时读写同一个文件系统,在提升高可靠的同时实现负载分担。
要实施 NAS 双活,首先需要明确数据中心的规划,是本地双活还是同城双活。如果是同城双活,网络条件和距离与是否能实现 NAS 双活强相关,阵列间需要通过交换机 + 裸光纤互联。链路的带宽、 RTT 时间和误码率等需要满足双活的要求。
NAS 的主机需要集群部署,通过 IP 交换机连到两端阵列;同时建议部署单独的仲裁服务器;

四、同行交流共识总结

1.以业务需求和使用场景为出发点,来决策企业部署NAS双活的必要性。
2.NAS双活是成熟的技术方案,NETAPP和华为都有较多的案例。
3.在NAS存储选型时,需要从业务需求出发,综合评估产品的性能、可靠性、特性、扩展能力等要求来选择合适的NAS产品。
4.在部署NAS双活架构时,要做好提前规划。一是网络环境的搭建,对于不同功能的网络做好分离和各张网络的冗余设计,尤其是复制网、业务网还有仲裁网络。二是做好业务场景的规划,灵活利用租户特性实现不同业务的安全隔离。
5.目前NAS双活主要还是HA的架构,即同一个文件系统在一侧存储提供读写服务,另一侧存储则为从端。但近年来,也有的产品支持真正的A-A方式,但是和传统的SAN双活还是有区别的。对于A-A方式的NAS双活建议持续关注,根据企业自身情况,适时引入。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

本文隶属于专栏

活动总结
活动总结是社区交流活动内容的总结及延伸,为大家提供了社区专家们丰富且高水平的理论知识、实践经验以及常见问题的最佳解决方法,非常值得大家收藏学习。

作者其他文章

相关文章

相关问题

相关资料

X社区推广