脑裂
脑裂
脑裂是因为cluster分裂导致的,cluster集群中节点因为处理器忙或者其他原因暂时停止响应时,其他节点可能误认为该节点“已死”,从而夺取共享磁盘(即资源)的访问权,此时极有可能假死节点重新对共享文件系统产生读写操作,从而导致共享磁盘文件系统损坏。...(more)
脑裂是因为cluster分裂导致的,cluster集群中节点因为处理器忙或者其他原因暂时停止响应时,其他节点可能误认为该节点“已死”,从而夺取共享磁盘(即资源)的访问权,此时极有可能假死节点重新对共享文件系统产生读写操作,从而导致共享磁盘文件系统损坏。

问题

互联网服务双活数据中心·2016-01-08
苏翔 · IBM 擅长领域:灾备, 双活, 服务器
117 会员关注
我觉得还要加上监控以及灾备自动化控制。在双活条件下,业务分发到不同的数据中心,业务访问在不同的层级间(如WEB,APP,DB)的数据访问路径是需要严格控制的。举例说明,A中心的app模块故障下,是否需要将A中心的web模块停止,而将所有的业务访问导向到B中心。这里就涉及到了访问控制...
银行脑裂·2016-01-08
anikikong课题专家组 · 中国民生银行 擅长领域:数据库, 灾备, 双活
708 会员关注
双活环境下的仲裁分很多的层次。例如文件系统复制,集群文件系统节点,数据库集群仲裁节点等等,包括网络,存储等。我现在见到的实际使用的防脑裂机制主要有两种: 一种是通过第三方仲裁,由第三方仲裁来决定哪一方存活。例如民生银行的对等双活环境,四川农信也在测试。还有一种是maj...
互联网服务仲裁资源·2016-01-08
arrnox · 交通银行总行软件开发中心 擅长领域:服务器, 小型机, 灾备
161 会员关注
有些集群软件是支持手工仲裁的,比如rsct,脑裂后可以将仲裁方式修改为人工,然后将某个子集群拉起来。但是有些集群比如gpfs是不支持这种人工仲裁的,它好像就majority一种仲裁方式,不过这也不要紧,依稀记得好像只要子集群里有配置节点,在配置节点里把不要的节点删了,还是可以把集群...
系统集成资源组·2016-01-06
zwz99999 · dcits 擅长领域:服务器, 存储, 灾备
1094 会员关注
从输出上看,资源组是在切换到另一个节点的过程中,这个时间可以看hacmp.out和cluster.log是否正常
银行PowerHA·2016-01-06
zwz99999 · dcits 擅长领域:服务器, 存储, 灾备
1094 会员关注
出现脑裂之后应该会中断的,资源不停的来回切换,机器不会宕机
融资租赁数据库·2016-01-06
欧阳峰 · Freelancer 擅长领域:数据库, 关系型数据库, 新核心系统
59 会员关注
只能说降低了脑裂的概率,不能完全消除,如果存储链路除了问题照样脑裂即使网络 心跳是好的,但是如果有人传送个大文件把网络带宽站满了照样脑裂,所以只能说降低,没法保证100%消除...
互联网服务脑裂·2016-01-06
hello_unix · 西安 擅长领域:服务器, 存储, 灾备
135 会员关注
关于脑裂,补充一些基础知识,供大家学习参考:在“双机热备”高可用(HA)系统中,当联系2个节点的“心跳线”断开时,本来为一整体、动作协调的HA系统,就分裂成为2个独立的个体。由于相互失去了联系,都以为是对方出了故障,2个节点上的HA软件像“裂脑人”一样,“本能”地争抢“共享资源”...
互联网服务脑裂·2016-01-06
hello_unix · 西安 擅长领域:服务器, 存储, 灾备
135 会员关注
脑裂发生,其实就是HACMP故障的一种,一般情况下,HACMP出故障了,不建议在生产时间来修理HACMP问题,第一步:赶紧把HACMP停掉(此时,有可能需要重启某台机器),把资源都释放掉。第二步:手动把vg和文件系统都挂在起来第三步:配置service IP地址(ifconfig eth0 1.1.1.X alias)第四步:执行业务启...
银行HA·2016-01-06
zwz99999 · dcits 擅长领域:服务器, 存储, 灾备
1094 会员关注
hacmp中,共享存储设置看是看你连接什么型号的存储,不同的存储有不同的设置SSA and FAStT devices# /usr/sbin/chdev -l hdiskn -a reserve_lock=no■ ESS, EMC, HDS, CLARiiON, and MPIO-capable devices# /usr/sbin/chdev -l hdiskn -a reserve_policy=no_reserve这个在做...
银行PowerHA·2016-01-06
爱如潮水 · 四川农信 擅长领域:服务器, 存储, 灾备
88 会员关注
1、遵循厂商要求,按标准化的配置规范进行HA的设计实施2、日常监控中,对HA的各种运行日志进行检查

描述

脑裂是因为cluster分裂导致的,cluster集群中节点因为处理器忙或者其他原因暂时停止响应时,其他节点可能误认为该节点“已死”,从而夺取共享磁盘(即资源)的访问权,此时极有可能假死节点重新对共享文件系统产生读写操作,从而导致共享磁盘文件系统损坏。...(more)
脑裂是因为cluster分裂导致的,cluster集群中节点因为处理器忙或者其他原因暂时停止响应时,其他节点可能误认为该节点“已死”,从而夺取共享磁盘(即资源)的访问权,此时极有可能假死节点重新对共享文件系统产生读写操作,从而导致共享磁盘文件系统损坏。
X社区推广
  • 提问题