dawey
作者dawey2019-09-23 14:26
技术经理, 光大证券股份有限公司

证券企业构建高可用、弹性的集中交易系统架构设计及难点

字数 1465阅读 3908评论 0赞 4

券商交易系统的建设行业现状

中国证券业经过20年的发展,已取得了长足的进步,券商的IT系统也发生巨大的变化。从交易工具逐步演变为业务系统的支撑平台,并随着金融科技应用的深入,特别是随着数字化转型加速,逐渐开始引领业务的发展。
但是证券业的告诉发展,给券商IT带来巨大的挑战。静则小溪流水,动则山洪爆发般的行情让券商IT系统和IT运维人员带来很大的压力。就像突降的暴雨让城市的基础设施不堪重负一样,短时间的天量成交也会让券商IT系统不堪重负。
在2015年牛市最火爆期间,部分券商交易系统曾因为开盘交易过于火爆造成系统承压太大而崩溃,导致大批投资者无法交易。监管因此也要求券商信息系统进行升级。不过,由于过去一年股市一直处于相对低迷的环境中,面对突如其来的万亿级交易行情,常规系统配置依然应对乏力。

后台的重点是高可用性和弹性

1、高可用性

“高可用性”(High Availability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性。
《证券期货经营机构信息系统备份能力标准》(JR/T 0059—2010)已经提出了明确的要求。
对故障应对能力、灾难应对能力和重大灾难应对能力,分别从恢复时间目标(RTO)、恢复点目标(RPO)和性能容量等三个方面进行要求。

券商基于Power架构的集中交易系统拓扑图:

高可用的保障机制:
1)   无单点,主生产物理设备无单点(主生产双主机、双存储),其余部件无单点
2)   交易系统数据库,4套数据库(同1份数据,4份拷贝,分属3地)
3)   两种技术的日志同步:hadr 和Logshipping
4)   自动化灾备切换(实现一键切换,同城灾备切换后台实现,前端接入无需变更配置)
5)   每季度1次带营业部的灾备切换演练,通过以演代练、以演促练,实现关键时刻敢切、能切、切成功。

困难点:
1)   设备冗余带来安全的同时,也增加成本、故障点以及性能的下降,这个如何平衡;
2)   1份业务数据,同时存活多份拷备,增加成本、维护工作量、故障点(比如hadr也会成为故障点);
3)   业务系统的软硬件经常变更,多站点、多备份导致的更新工作量增大,风险也增多,如果某次升级有站点软件版本没有同步更新,那么一旦发生灾备切换,就会悲剧了;
4)   灾备演练的坚持,灾备演练涉及人员多,系统关联影响面大,需要全员支持。

2、弹性(容量管理)

1)   主机性能提升(Power7 --> Power9),投入比较大,但是效果明显:

通过更换主机:
rPerf:  410.80 --> 910   提升2.21倍
   前期在北京IBM CSC实验室测试,带应用的性能提升:
   E980 32C较现有生产P770 32C性能提升2倍,清算性能提升35%(节省31分钟);
   后续应用代码优化可进一步提升系统性能。

2)   应用功能的拆分(把查询分拆到温备服务器或者增加查询服务器,降低主生产的负载)
主要体现的读写比的降低上:

1)   监控容量动态变化,及时分析、评估容量发展趋势,做出预估
2)   制定容量管理计划,确定容量的冗余比(1:4,1:5,。。。)

困难点:
1)   升级需要投入,而且还不是小钱
2)   硬件升级会导致OS升级--> DB升级 ---> 应用升级,一般硬件升级回提升性能,软件(数据库)升级会导致性能下降 需要平衡
3)   应用拆分需要开发商支持
4)   监控容量动态变化需要工具支持
5)   监控容量需要制度支持

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

4

添加新评论0 条评论

Ctrl+Enter 发表