问题描述:
在RoseHA配置完成后,重启,拔网线等操作,进行软件功能测试时,发现RosHA软件自动切换异常。
经过多次测试后,包涵在客户的生产环境和虚拟化服务器测试环境中测试,发现如下问题。
1、 进行服务器重启和拔网线,ifconfigeth0 down等操作后,IPSAN的设备号发生改变。及/dev/sdb磁盘可能变成/dev/sdc,导致文件系统不能正常挂载。
2、 带入应用后应用不能正常切换(应用脚本在手动测试时,正常使用)。
系统网络拓扑图
其中web主服务器和web备服务器采用RoseHA8.9软件实现应用的高可用性。
环境描述:
硬件环境描述:华为FusionServer RH5885 V3服务器作为主WEB服务器、华为 Tecal RH1288 V2作为备WEB服务器,安装Redhat 6.5操作系统。通过ISCSI方式连接华为OceanStor 5300 V3存储。双机HA软件是RoseHA8.9。
应用的描述:对外端口: 8000 ,开发语言:java,容器:resin3自定义修改版,应用功能:协同办公与文档搜索引擎。
软件安装位置描述:RoseHA双机软件安装在/opt目录下,启动脚本及应用程序安装在共享存储上,启动脚本改变路径后不能正常使用,应用程序是基于共享存储挂载后,才能正常启动。
RoseHA配置如下:
磁盘资源正常配置和IP资源正常配置,可以进行手动切换和自动切换。在添加自定义应用资源时,监听端口选择8000,脚本指向共享存储中java容器目录下的启动脚本,和共享磁盘资源绑定(基于共享存储),没有配置监听脚本。
个人通过日志分析
安装正常切换逻辑,从带入到带出应用资源的逻辑顺序应是如下进行:
带入应用顺序:挂载磁盘→启动应用脚本
带出应用顺序:启动停止脚本→卸载磁盘
且应用停止需要时间,如果应用没有停止,共享存储不能被卸载。
错误日志如下:
收起