您所不知的中小银行IT人的痛!

2013年10月31日AIX专家俱乐部成功举办了关于银行的线上研讨会研讨的主题:如何保证系统的高可用性、可靠性、可扩展性?在本次研讨会过程中各家银行的参会嘉宾都积极参与交流,也同时涌现出大量大家比较关心的内容,所以把行业中大家比较关心的话题,放到社区来和大家一起交流。
本期讨论话题一:大家现有环境中都有什么具体措施或计划保障业务的连续稳定?

参会人员的一些观点:

某银行人员:对于数据库层面的高可用,可以采用MAA架构,在节点,存储,数据等多个方面全方位保护,缺点是造价昂贵;


某银行人员:关于系统高可用性和稳定运行,个人认为作为我们地方性商业银行,就系统本身的调试和需求一般不会有太多特殊性。通常我们关注以下几个关键要素:应用、硬件、数据、切换。就应用而言,各商业银行差异化非常大,良莠并存,仁者见仁智者见智。那么就应用本身的问题无论是BUG还是优化都是需要我们长期与之抗力的;

当然离开应用本身,我们也不是就毫无助力,我们行采用了两种方法:一是使用第三方监控软件,在应用异常情况下进行预警。二是对关键应用开发专门的守护进程。两种各有好劣,第一种起到及时通知的作用,便于我们人工分析和干预,弱点是必须要人到现场处理问题,即便是个简单问题。第二种可以及时发现并通过一定的逻辑检查进行自动自救。但最大的问题是如果应用本身发生了致命障碍,守护会反复尝试自举,或许会带来其他意想不到的风险。同时守护进程本身的逻辑检查及运作机制也是个需要考察,或说本身也是个风险的存在。因此我们是集合起来应用的。而其他硬件、数据的风险,通常我们走的是冗余的方法。将数据存储到阵列,利用阵列已成熟的各种RAID技术回避转移风险,必要时关键应用也可考虑迁入。我们建立了“两地三中心”的灾备体系,使用“快照”技术进行数据备份,建立了多个LUN,在主备系统中进行识别,LUN与主机host的映射通过storage Group建立,但切换过程根据障碍级别还有人工干预的步骤,当然逐渐提高自动化程度是我们正在走,也是长期需要思考建设的问题;


某银行人员:对银行系统的高可用性、可靠性、可扩展性是个很大的话题。应用层中间件,操作系统,数据库,存储,都要考虑到这些问题,责任分工,每个岗位工程师会更关注这一方面,进行细化,测试,实施,运维。在技术上都要厂商配合,寻找成熟的方案;


大家在参与交流的过程中可以按以下格式进行:

行业: 银行

针对话题进行讨论和交流不限制在银行业

备注:凡是参与的会员根据回答的内容情况奖励参与奖20——50金币。欢迎大家踊跃参与交流!
参与12

0同行回答

“答”则兼济天下,请您为题主分忧!
午夜幽魂午夜幽魂系统运维工程师计算机有限公司
说说最近的感觉,其实现在无论哪个厂家的技术,基本是可满足客户的需要求的,高可用也好,性能也好,花了钱了,都办得到。现在出现的问题不是在死的机器上,而在活的人身上。一个业务性能出现问题,研发推给系统,系统推给主机,主机再推给数据库,数据库再推给存储,有一部份客户都是这样的存在...显示全部
说说最近的感觉,
其实现在无论哪个厂家的技术,基本是可满足客户的需要求的,高可用也好,性能也好,花了钱了,都办得到。
现在出现的问题不是在死的机器上,而在活的人身上。
一个业务性能出现问题,研发推给系统,系统推给主机,主机再推给数据库,数据库再推给存储,
有一部份客户都是这样的存在的,不管从性能,高可用来说,都是需要不同部门来配合的,
单说性能,底层都不了解上层应用的特点,怎么做底层的优化,还要提方案,。。。。:L

无论是哪个项目,哪个技术,各个部门 合作沟通才是最重要的,任何一套系统的建立不能缺少任何一个环节。收起
系统集成 · 2013-11-08
浏览1423
boypixieboypixie售后技术支持zte
小行应该要求更高显示全部
小行应该要求更高收起
电信设备制造商 · 2013-11-17
浏览1406
zjqiang222zjqiang222系统分析师zjcz
回复 7# yanhaix ORACLE RAC还算稳定的吧 ~显示全部
回复 7# yanhaix


ORACLE RAC还算稳定的吧 ~收起
政府机关 · 2013-11-14
浏览1420
mzhmzh系统工程师日照银行
其实小银行当中的运维还是比较好做的,我感觉最难解决的问题就是软件开发商和硬件供应商之间“扯皮”的事,当正常生产业务出现问题时,找不到原因,把软件人员厂商人员都叫来,都说自己的东西没问题,一推二五六,谁也不解决,这事最麻烦!...显示全部
其实小银行当中的运维还是比较好做的,我感觉最难解决的问题就是软件开发商和硬件供应商之间“扯皮”的事,当正常生产业务出现问题时,找不到原因,把软件人员厂商人员都叫来,都说自己的东西没问题,一推二五六,谁也不解决,这事最麻烦!收起
银行 · 2013-11-14
浏览1424
psm306psm306系统工程师信阳珠江银行
同6楼所说,银行业大都采用稳定成熟的方案,包括主机、网络、系统软件和应用软件。但对于小的城商行来说,因为人员较少,大部分人都是身兼多职,系统运维的工作相当繁重。生产机房对数据库和重要应用都有hacmp,数据存储到磁盘阵列,这些都是非常可靠的,可能的风险反而会出现在应用上,特...显示全部
同6楼所说,银行业大都采用稳定成熟的方案,包括主机、网络、系统软件和应用软件。但对于小的城商行来说,因为人员较少,大部分人都是身兼多职,系统运维的工作相当繁重。生产机房对数据库和重要应用都有hacmp,数据存储到磁盘阵列,这些都是非常可靠的,可能的风险反而会出现在应用上,特别是新上银行核心业务的银行,会因为应用的效率问题或未发现的bug被生产上的某些条件触发了而造成应用的不可用。
另外因为监管部门的要求,各家银行大都建立了两地三中心的灾备模式,如同版主所说,无论哪个厂家的技术,基本是可满足的,但是对于城商行来说,有没有切实可行的预案,实际有没有经常做演练,也可能是存在问题的。比如极端情况下,生产机房的存储、网络全都不可用,所有的业务能否在同城接管呢?以及各个外联系统,像银联、人行、支付宝等,平时演练的时候是否做过测试,都是问题所在。特别是网络,如果主生产机房有故障,网络多久能到同城备份机房呢?另外同城能够接管业务后,因为时间延迟,对于同步到同城的数据丢失的部分在业务上应该怎么处理,也需要提前做好预案。
对于大行,都有严格的制度,有规范的流程,责任也很明确。可是小行呢?任意一个环节出了问题,都是科技的责任。只能祈祷吧!收起
银行 · 2013-11-11
浏览1447
yanhaixyanhaix系统工程师北京环亚时代
oracle rac的应用越来越越多,但感觉用起来也有很多问题显示全部
oracle rac的应用越来越越多,但感觉用起来也有很多问题收起
系统集成 · 2013-11-11
浏览1463
玉树林风玉树林风系统工程师中国民生银行
银行主要采用DB2、informix等数据库,采用两地三中心灾备模式保证业务的可切换和零宕机性,硬件上采用冗余或者端口绑定等方式达到,软件上主要有操作系统层面上的HACMP,虚拟化层面上的双VIO,数据库层面上的oracle RAC,数据备份层面上的TSM。       &nbs...显示全部
银行主要采用DB2、informix等数据库,采用两地三中心灾备模式保证业务的可切换和零宕机性,硬件上采用冗余或者端口绑定等方式达到,软件上主要有操作系统层面上的HACMP,虚拟化层面上的双VIO,数据库层面上的oracle RAC,数据备份层面上的TSM。
        现在HA方面由于脑裂 健忘等问题的出现,现在已经逐渐趋向于虚拟化方面的发展,如VIO enterprise版支持多达255个节点的。保证了业务稳定的同时,并且通过VIO可以实现从各个层面的网络、硬盘、存储的冗余。收起
银行 · 2013-11-09
浏览1438
qihanchongqihanchong系统架构师ITMA
银行业一般采用比较成熟稳定的技术和方案,因此一般来说问题不大。硬件上可以采用多台主机部署应用,采用HA技术,提高高可用性。也可以使用虚拟化方案。然后再搞个2地三中心,应该差不多了吧。...显示全部
银行业一般采用比较成熟稳定的技术和方案,因此一般来说问题不大。
硬件上可以采用多台主机部署应用,采用HA技术,提高高可用性。也可以使用虚拟化方案。
然后再搞个2地三中心,应该差不多了吧。收起
系统集成 · 2013-11-08
浏览1471
hello_unixhello_unix信息技术经理西安
银行来说性能问题还不严重,稳定性是个挑战。对于硬件和操作系统,都应该考虑寿命问题,该换不换,必有后患显示全部
银行来说性能问题还不严重,稳定性是个挑战。
对于硬件和操作系统,都应该考虑寿命问题,该换不换,必有后患收起
互联网服务 · 2013-11-08
浏览1423
xingwuhuixingwuhui系统工程师杭州九州方园科技有限公司
医疗行业:通过emc的双活技术,来保证his等业务的稳定性。显示全部
医疗行业:通过emc的双活技术,来保证his等业务的稳定性。收起
系统集成 · 2013-11-08
浏览1458

提问者

twt社区管理员
网站运营经理TWT
擅长领域: 数据库服务器存储

相关问题

相关资料

问题状态

  • 发布时间:2013-11-08
  • 关注会员:1 人
  • 问题浏览:7086
  • 最近回答:2013-11-17
  • X社区推广