hacmp会引发lv错误?

公司找外厂商做数据迁移,一波三折,之间发生几次问题,有几个问题不甚了解,听工程师讲没太懂,来此麻烦给位解决下:
系统环境:小机双机,hacmp5.4,使用串口心跳 存储A、B 将A上的数据迁移到B上,A有两个卷,在小机中为datavg,分两个lv,ora和file。
由于是外厂商工程师操作,具体如何操作不清楚,大概过程如下:
1.将A上的数据镜像到B上,经应用测试,发现部分数据丢失,后发现有部分数据没有镜像完,重新同步丢失数据,完成后踢出A,业务测试正常,此时没有重启。

2.重启小机,发现双机未启动,重新配置双机,HA仍然未能正常启动,oralv能够自动mount上,feilelv不能自动挂载,手工mount filelv,提示
mount /filelv
Replaying log for /dev/filelv.
mount: 0506-324 Cannot mount /dev/filelv on /filelv: The media is not formatted or the format is not correct.
0506-342 The superblock on /dev/filelv is dirty.  Run a full fsck to fix.

fsck -y /dev/filelv
The current volume is: /dev/filelv
Primary superblock is valid.
J2_LOGREDO:log redo processing for /dev/filelv                     
Primary superblock is valid.
Invalid data detected in aggregate inode 2.
Invalid data detected in aggregate inode 2.
fsck: 0507-278 Cannot continue.
File system is dirty.

重新导入superblock,挂载时问题依旧。

3. 重新划分lv,使用带库恢复,据工程师讲A上的vg已经不能使用,因为A存储从vg中删除后,系统认为上面的vg信息比现在的旧,不能使用A存储,想恢复数据需找专门的恢复公司完成。使用磁带库完成恢复后挂载正常,重新配置HACMP,HACMP正常启动,无法挂载 filelv,后发现又出现上面的状况,但fsck可以执行,执行后正常手工挂载。工程师称经检查发现主机的异步卡损坏,造成启动ha时主备机挣资源,造成filelv损坏。

4.问题:
(1)以上这种情况是否会造成lv损坏?
(2)如会造成lv损坏,为什么oralv没有问题?
(3)如何修复上述损坏的filelv?
(4)A上的VG能否重新使服务器认到,之前没有试。如果不能认到,那么原因如工程师所说?
参与19

19同行回答

myguangzhoumyguangzhou技术经理Uniwise
问题是厂家说是HA造成的,我以前也在存储行业晃过5年,也没注意到有这种情况,请求各位高手解惑。 ...kevin_chu 发表于 2011-10-8 12:24 他这样说也不能完全不对,HA如果脑裂了,是很可能造成数据损坏的但是也不能排除是迁移数据过程中出错,或者是AIX的BUG造成数据丢失你应该分析...显示全部
问题是厂家说是HA造成的,我以前也在存储行业晃过5年,也没注意到有这种情况,请求各位高手解惑。 ...
kevin_chu 发表于 2011-10-8 12:24

他这样说也不能完全不对,HA如果脑裂了,是很可能造成数据损坏的
但是也不能排除是迁移数据过程中出错,或者是AIX的BUG造成数据丢失
你应该分析他们当时所有的操作步骤和输出结果,才能进一步定位故障原因

我就看过有人用MIRRORVG来做数据迁移,第一次不成功,第二次重新同步才完成的,比较危险

记住:所有对OS和DB的正常操作也不能保证100%不出问题
所以备份是才是王道!收起
互联网服务 · 2011-10-09
浏览1105
myguangzhoumyguangzhou技术经理Uniwise
脑裂的情况就容易导致数据损坏因此所有的HA都建议2个或以上的心跳机制来避免脑裂出现所以连国产的ROSE HA都支持网络心跳和串口心跳:lol显示全部
脑裂的情况就容易导致数据损坏
因此所有的HA都建议2个或以上的心跳机制来避免脑裂出现

所以连国产的ROSE HA都支持网络心跳和串口心跳:lol收起
互联网服务 · 2011-10-09
浏览1072
myguangzhoumyguangzhou技术经理Uniwise
“工程师称经检查发现主机的异步卡损坏,造成启动ha时主备机挣资源,造成filelv损坏。”有这个可能不知道你的HACMP怎么整的,已经是5.4了,就没做一个磁盘心跳吗?网络心跳呢?只弄了个串口线吗?...显示全部
“工程师称经检查发现主机的异步卡损坏,造成启动ha时主备机挣资源,造成filelv损坏。”有这个可能
不知道你的HACMP怎么整的,已经是5.4了,就没做一个磁盘心跳吗?网络心跳呢?只弄了个串口线吗?收起
互联网服务 · 2011-10-09
浏览1067
myguangzhoumyguangzhou技术经理Uniwise
有些乱既然是镜像,那么你们是怎么发现有些数据丢失了?后来重新同步镜像就找回丢失的数据?这是不可能的啦,或许你的描述有误另外,被踢出去的PV,里面的数据无法被使用的了显示全部
有些乱
既然是镜像,那么你们是怎么发现有些数据丢失了?后来重新同步镜像就找回丢失的数据?
这是不可能的啦,或许你的描述有误

另外,被踢出去的PV,里面的数据无法被使用的了收起
互联网服务 · 2011-10-09
浏览1114
shenadamshenadam系统工程师sjo
很奇怪啊,镜像后,虽然不没镜像成功,但是怎么会导致数据丢失呢??LZ应该有些情况不清楚吧.具体只能看那个实施的人操作过程了.镜像是通过什么方法呢?LV镜像还是存储镜像?显示全部
很奇怪啊,镜像后,虽然不没镜像成功,但是怎么会导致数据丢失呢??
LZ应该有些情况不清楚吧.具体只能看那个实施的人操作过程了.

镜像是通过什么方法呢?LV镜像还是存储镜像?收起
互联网服务 · 2011-10-09
浏览1092
kevin_chukevin_chu系统工程师长城汽车
问题是厂家说是HA造成的,我以前也在存储行业晃过5年,也没注意到有这种情况,请求各位高手解惑。显示全部
问题是厂家说是HA造成的,我以前也在存储行业晃过5年,也没注意到有这种情况,请求各位高手解惑。收起
汽车 · 2011-10-08
浏览1076
leolaukbleolaukb专业技术支持人员HCF
新手啊,光按照操作手册或者什么文档是不行的,碰到情况就不知道怎么弄了,要理解,你现场的情况,只能厂家解决了,其他的都解决不了显示全部
新手啊,光按照操作手册或者什么文档是不行的,碰到情况就不知道怎么弄了,要理解,你现场的情况,只能厂家解决了,其他的都解决不了收起
IT分销/经销 · 2011-10-08
浏览1129
kevin_chukevin_chu系统工程师长城汽车
我想HA应该不会产生这种问题,如果产生这种问题,那线上系统部署的话怎么办?备份后再操作?如果心跳线丢失,会造成这种情况,那么在使用过程中,如果维护两台机子,双双重启,那么不就被HA破坏分区了么?数据还有什么安全性可言?...显示全部
我想HA应该不会产生这种问题,如果产生这种问题,那线上系统部署的话怎么办?备份后再操作?
如果心跳线丢失,会造成这种情况,那么在使用过程中,如果维护两台机子,双双重启,那么不就被HA破坏分区了么?数据还有什么安全性可言?收起
汽车 · 2011-10-05
浏览1103
kevin_chukevin_chu系统工程师长城汽车
各位高手,帮帮忙回答下,谢谢!显示全部
各位高手,帮帮忙回答下,谢谢!收起
汽车 · 2011-10-04
浏览1075

提问者

kevin_chu
系统工程师长城汽车

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2011-10-04
  • 关注会员:0 人
  • 问题浏览:12886
  • 最近回答:2011-11-04
  • X社区推广