双活数据中心是否做到完全的自动化切换,如何实现?

请问:大家在搞双活的时候是否做到完全的自动化切换,如何实现?如果没有,原因是什么呢?

参与21

8同行回答

footfansfootfansIT顾问吴江农商行
目前看我行是无法实现完全的自动化。  当发生故障时,业务可以自动切换至备站点(主机服务通过powerHA,存储切换通过Hyperswap);  但业务回切时,需要人工介入,并且需要安排业务维护窗口(主要是由于节点间HA配置信息可能不一致,需要手工同步cluster的信息): ...显示全部
目前看我行是无法实现完全的自动化。
  当发生故障时,业务可以自动切换至备站点(主机服务通过powerHA,存储切换通过Hyperswap);
  但业务回切时,需要人工介入,并且需要安排业务维护窗口(主要是由于节点间HA配置信息可能不一致,需要手工同步cluster的信息):
   1),停应用和powerHA;
   2),恢复底层存储MetroMirror关系;
   3),同步powerHA配置后,重新启HA,应用恢复并验证;收起
银行 · 2015-06-11
浏览3343
prada_guprada_gu其它xxx
如果真是双活,就不存在切换的议题;系统架构设计会考虑到各种可能的事件场景,出现各种场景时会自动应对,应用无感知,业务不中断,数据不丢失。需要讨论切换的,还有那么多切换步骤的,叫高可用集群HA,不是双活。...显示全部
如果真是双活,就不存在切换的议题;系统架构设计会考虑到各种可能的事件场景,出现各种场景时会自动应对,应用无感知,业务不中断,数据不丢失。
需要讨论切换的,还有那么多切换步骤的,叫高可用集群HA,不是双活。收起
IT其它 · 2015-06-12
浏览3313
arrnoxarrnox系统架构师交通银行总行软件开发中心
我们使用了和GDPC差不多的架构,差异主要是以下几点:1)中心A布了4个DB2 member,中心B只布了2个DB2 member2)RSCT quorumtype使用的是Quorumless,Tiebreaker使用的是operator没有做到自动切换,因为中心A节点比中心B多,所以把中心A所有节点关闭后,RSCT集群处于pending状态、GPFS集群...显示全部
我们使用了和GDPC差不多的架构,差异主要是以下几点:
1)中心A布了4个DB2 member,中心B只布了2个DB2 member
2)RSCT quorumtype使用的是Quorumless,Tiebreaker使用的是operator
没有做到自动切换,因为中心A节点比中心B多,所以把中心A所有节点关闭后,RSCT集群处于pending状态、GPFS集群处于offline状态,需要运行一个切换脚本把集群拉起来,切换时间大致在2分钟左右。收起
银行 · 2015-06-11
浏览3327
老袁老袁技术经理cmbc
gdpc方案是通过tsa和gpfs两个集群系统来处理各种异常,所有异常都靠这两个软件自动化处理,关于能处理哪些异常,可以关注一下tsa和gpfs。显示全部
gdpc方案是通过tsa和gpfs两个集群系统来处理各种异常,所有异常都靠这两个软件自动化处理,关于能处理哪些异常,可以关注一下tsa和gpfs。收起
银行 · 2015-06-11
浏览3251
honglang60honglang60客户代表ThoughtWorks
简单来说,因为一直有错误切换存在。例如,切换系统故障,造成互相切。所以,这个事情,多数需要一定的人工干预。还有,切换不是什么大问题,关键是切换完以后的数据同步问题。特别是比较大的机构,比较复杂的系统。而数据又很重要的时候。就对数据不同步很敏感,而且每次同步所消耗的时间...显示全部
简单来说,因为一直有错误切换存在。例如,切换系统故障,造成互相切。所以,这个事情,多数需要一定的人工干预。
还有,切换不是什么大问题,关键是切换完以后的数据同步问题。特别是比较大的机构,比较复杂的系统。而数据又很重要的时候。就对数据不同步很敏感,而且每次同步所消耗的时间之类的比较长,如果是运行中同步,技术难度高。容易丢失数据。收起
IT咨询服务 · 2015-06-16
浏览3295
arrnoxarrnox系统架构师交通银行总行软件开发中心
另外DB2集群重启过程还需要一些时间。1.        首先切换2个集群的仲裁节点到漕河泾的某个member上2.        然后把张江的节点从GPFS集群里都踢掉,因为GPFS集群使用的是多数存活的判断策略,而张江的节点太多了3.    &n...显示全部
另外DB2集群重启过程还需要一些时间。
1.        首先切换2个集群的仲裁节点到漕河泾的某个member上
2.        然后把张江的节点从GPFS集群里都踢掉,因为GPFS集群使用的是多数存活的判断策略,而张江的节点太多了
3.        然后把GPFS集群拉起来,让GPFS文件系统正常
4.        然后把GPFS Replication断开
5.        然后把RSCT的集群拉起来
6.        最后重启DB2集群收起
银行 · 2015-06-11
浏览3281
arrnoxarrnox系统架构师交通银行总行软件开发中心
回复 5# anikikong 人为运行切换脚本。显示全部
回复 5# anikikong
人为运行切换脚本。收起
银行 · 2015-06-11
浏览3334
anikikonganikikong课题专家组数据库运维工程师中国民生银行
交行这种非对称的环境下在主站点全当机后,运行切换脚本是自动的吗?还是必须要人为干预? 如果是自动的,请问是如何定义检测策略的?显示全部
交行这种非对称的环境下在主站点全当机后,运行切换脚本是自动的吗?还是必须要人为干预? 如果是自动的,请问是如何定义检测策略的?收起
银行 · 2015-06-11
浏览3357

提问者

pipilux
信息技术经理中国银联
擅长领域: 云计算灾备私有云

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-06-11
  • 关注会员:0 人
  • 问题浏览:9955
  • 最近回答:2015-06-16
  • X社区推广