主持人好,大家好,很高兴可以就这个话题进行互动。谈到“应用异构冗灾”,我们要先谈一个“软单点故障”的话题。我们以为,若系统内某个层面(网络、系统结构各环节)使用同样的”软件“(设备、程序代码等),则该系统在该层面存在单点,区别于硬件物理设备的单点,把这种情况理解为该系统存...
显示全部主持人好,大家好,很高兴可以就这个话题进行互动。
谈到“应用异构冗灾”,我们要先谈一个“软单点故障”的话题。
我们以为,若系统内某个层面(网络、系统结构各环节)使用同样的”软件“(设备、程序代码等),则该系统在该层面存在单点,区别于硬件物理设备的单点,把这种情况理解为该系统存在”软单点“,软单点“发生故障称为”软单点故障“。
近几年来,金融行业每年都会发生比较严重的技术事故,甚至在金融行业里被公认为技术能力最强、技术投入最大的银行业也是重大技术事故屡次发生。这些发生事故的公司从系统建设、管理规范、资源投入等方面可以说在银行业内都还名列前茅,并且这些事故不是简单的硬件损坏,不是因为没有建设热备、灾备系统、不是人员的误操作、不是业务功能逻辑错误、也不是因为公司没有制定应急预案,这都促使我们进一步思考,究竟是为什么呢?
归类分析这些冗余设计,几乎所有的“无单点故障”设计方案是主、备、灾容灾体系是建立在同源、同构基础上的,都是针对硬件层面、部署层面的,也就是说是“无硬件单点故障”;而对于软件层面的无单点故障设计则没有全面分析和防范,也就是说,虽然是“无硬件单点故障”,但存在着很多有意或无意忽视的“软单点故障”暗礁。而“软单点故障”正是造成前述那么多银行重大技术事故的罪魁祸首。
目前我们也在思考如何解决这类问题的方案。
针对证券行业集中交易体系“软单点故障”大都是比较难处理的问题,研究和制定应对手段不会是一件简单和容易,找到合适的应对手段将会是行业内一项长期的工作,应对手段可以多样化,例如:
1) 从理论上说可以采取主、备、灾使用不同的操作系统,或在“备”中使用多种方式来备
2) 在目前很多公司建设多交易中心的时候,能否实现不同厂商交易系统的互备(或容许损失某些功能特性)。
3) 网上交易软件选择两家或以上不同厂商的系统,同时制定其中一套网上交易系统出问题后客户的通知、引导、下载另一套网上交易软件的整体方案。
此类尝试的解决方案的核心思想是建立异构化的非同源应用系统作为现有“同构、同源”灾备体系的补充用来应对软单点故障,即“异构化容灾”。
当然,目前更多的是探索,希望大家多提想法和意见,谢谢。
收起