jxnxsdengyu
作者jxnxsdengyu课题专家组·2019-03-27 14:31
系统工程师·江西农信

银行业关键交易类核心系统同城双活设计研讨问题集锦

字数 3073阅读 2357评论 1赞 6

互联网金融发展如日中天,各金融机构无一缺席这一盛宴,在壮大发展的同时,也面临着许多新问题,特别是客户不确定性、体验性、处理时效性以及业务连续性严苛要求,使得各金融机构纷纷将同城灾备架构逐步升级至双活中心架构,以提升系统处理能力与客户体验性,满足监管部门业务连续性要求,同时充分利用计算资源,节约成本。那双活中心建设在各金融机构发展如何,有哪些经验可借鉴,建设过程中有哪些问题需要攻坚呢?是不是双活中心建设没有风险呢?双活中心又是如何定义呢?又能解决哪些问题呢?

基于以上问题,TWT平台拟组织一次线下探讨活动,邀请有双活建设经验的金融单位或同行业分享他们的宝贵经验,旨在为准备建设双活中心或者正计划,或者已经在建设中的各行业提供经验借鉴,以更好的完成同城双活建设目标。本次活动将围绕以下主题进行讨论:

1、同城双活从层次来划分,可分为存储双活、数据库双活、应用双活,网络双活等,每种类型在各金融机构实现的如何呢?
2、每种双活类型,有哪些典型技术案例?稳定性如何?
3、存储双活、应用双活关键技术痛点有哪些,如何攻关?
4、在考虑双活建设时,有先后顺序吗?先数据还是先应用呢?
5、哪些双活在金融机构是应用最广泛的呢?

为了能更好的解决企业在实现同城双活时面临的难点,twt社区特别邀请了在这方面有着丰富项目实践的专家与大家一起交流探讨。以下是本次交流中产生的问题集锦,欢迎大家查看、留言!

1、江西农信的SVC有多大规模?

邓老师:
目前江西农信SVC用在很多个方面,基本上除了核心业务系统没有SVC之外,其他交易类业务系统、管理类业务系统、开发测试环境、带内管理业务系统都分别用到了各自的SVC集群,总体来说SVC功能还是非常好用的,在存储数据迁移、冗余保护、同城灾备、双活等发面功能都很齐全,存储维护变得更加灵活和便捷,高可用架构也更加健壮。

2、双活是否会造成性能的下降?

邓老师:
双活必然带来读写IO性能的下降,这点是必然的,因为每一个写IO都会同步到另一个存储节点中,存在链路往返延迟,随着链路间距的增加,延迟也越来越大,势必和存储直接IO的延迟在同一个数量级,在业务端看来,这种延迟的增加是双活技术所带来的。

赵老师:
会,使用存储双活架构会造成存储I/O的写延迟增加,导致业务系统的写性能下降。

3、hyperswap是否需要两套SVC?成本是几倍?算双活还是灾备?

邓老师:
Hyperswap是需要两套SVC,也就是2套SVC IO GROUP,总计四个SVC节点,成本来看是一套SVC的两倍上下,这种技术算是存储网关双活技术,对于底层存储而言,准确地说是灾备,因为SVC Hyperswap的两套SVC节点都是ACTIVE-ACTIVE,但底层存储实际上是ACTIVE-STANDBY。

赵老师:
Hyperswap需要两套SVC和两套粗U难处。从存储成本来说相对于单套SVC+单套存储就是两倍。如果考虑实施费用,和数据中心间链路以及第三个仲裁站点的费用,那就会更高。
Hyperswap是双活技术。

4、例如SVC,其他厂商还有什么其他好的产品?

邓老师:
其他友商,像EMC的VPLEX,NetApp MetroCluster等

赵老师:
目前来看,独立的SAN存储虚拟化控制器技术就只有IBM SVC和EMC Vplex

5、hyperswap或SVC是否需要和DB2高度耦合?

邓老师:
不需要和DB2高度耦合,SVC hyperswap是存储层的双活技术,DB2双活像DB2 PureScale是数据库事务级的双活技术,但需要和底层存储一起结合实现完整的数据库双活方案,目前DB2 PureScale和GPFS结合的比较紧密,是一个打包的成熟方案,落地案例也很多,但理论上HYPERSWAP+DB2 PureScale也是可以的,需要注意的是存储双活仲裁和DB2双活仲裁的一致性问题。

赵老师:
和DB2高度耦合的双活技术是DB2 Purescale。Hyperswap无法和DB2高度耦合。SVC是经过DB2认证的存储虚拟化产品

6、分布式存储和集中式存储的对比?价格方面及维护难度方面?

邓老师:
集中式存储的维护其实要比分布式存储简单,价格方面,如果分布式存储用的开源产品,没有涉及软件费用的话,分布式存储价格更占优势,如果分布式存储需要购买分布式存储软件许可的话,总体拥有成本,也不会占明显优势,基本和集中式存储持平。

赵老师:
一般而言,金融客户的核心系统都是基于数据库的结构化数据,单套系统的数据量都不会太大,此时适合集中式存储。分布式存储一般适合的是互联网类型的应用,其特点一般是数据量非常大,而且以非结构化数据为主。价格的话分布式存储的每TB成本肯定低于集中化存储,但是由于其数据量都很大,单套分布式存储的投资应该是高于集中式存储的,维护复杂度也高于集中式存储

7、对象存储,PB级,用的什么盘?协议是用的ceph还是S3?

邓老师:
目前主流对象存储的访问协议是S3、Openstack Swift、Simple Object等Rest API接口,用的盘也是主流的SAS盘,是一个软件定义存储解决方案。

赵老师:
用大容量NL-SAS盘(单盘8T,10T),S3协议

8、国内谁实现了真双活,做到秒级切换?

邓老师:
很少城商行通过SVC实现了本地或者同城存储双活,切换也可以达到秒级,但对于一个业务系统而言,存储双活只是其中一部分,真正要实现业务系统级别的双活和秒级切换还需要其他技术的支持,像数据库双活,应用集群和全局性负载等,作为整体性的切换,RTO要实现秒级还是有些难度,目前这块暂未见到。

赵老师:
据我所知工商银行做到的,互联网上搜索一下就有相应的报道,比如:
http://www.sohu.com/a/236711548_100184968

9、IBM ESC如果宕机了,对业务影响如何?

邓老师:
单个SVC ESC节点宕机了,存储路径可以自动切到另一个节点,如果两个SVC ESC宕机了,可以切到另一组SVC ESC节点组中。切换过程可以达到秒级。

赵老师:
ESC是基于SVC I/O Group的拉伸集群,如果部署两个I/O Group,即四个SVC节点,那么不管是单个SVC节点故障,还是两个SVC节点故障,都可以做到对业务无影响,除非是四个节点同时宕机,才会影响也额无

10、DB2 pure scale双活上线有遇到什么问题?

邓老师:
在规划和测试阶段发现了一些问题,都提前在上线前通过以下手段进行了规避,如:

(1)两个站点的应用节点只访问本站点的数据库成员节点,数据库成员节点只访问本站点的GPFS NSD存储
A、需要配置DB2客户端(应用端)亲缘关系与GDPC配合使用
B、需要在DB2客户端配置跨站点的冗余性,提供容错功能
C、两个站点的GPFS NSD盘的属性需要优先本地站点的成员节点

(2)减少访问CF集中缓存、GPFS NSD的网络同步带来的影响
A、节点间通信尽量使用高速互连网络(推荐Roce)
B、尽量减少通讯,减少热点数据竞争,使用小PageSize,增大GPFS缓存,数据库缓存,减少大量日志写入
C、采用数据库分表、分区,避免热页面
D、将不同的应用分布在不同的节点上,利用业务分割的方式,来保证整体双活数据库性能

11、江西农信的400用的什么复制技术?

邓老师:
目前江西农信AS400本地和同城灾备用的DS8870存储的MGM同步技术,本地两套AS400主机和两套DS8870存储,做得MM同步,同城灾备用的一套AS400和一套DS8700存储做的GM同步。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

6

添加新评论1 条评论

michael1983michael1983联盟成员技术总监某证券
2019-03-31 18:03
基于应用的双活是最靠谱的
Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广