作者:广州九一乐维工程师 许远
一家中小型企业需要使用zabbix_server监控大量设备,某天,一位新来的员工操作服务器失误,导致zabbix _server 服务器系统奔溃无法开机。这时候zabbix _server 服务中断了,这家企业的所有设备都无法进行监控,假如此时,监控的设备中有重要的业务主机,出现了告警,但是由于zabbix _server 无法采集数据,导致运维人员不知道业务主机出现了一个严重的告警,业务也受到了影响。最后给企业带来巨大的经济损失。
名词解析:
高可用技术简单的说就是,保障业务在出现故障的时候,进行快速的切换,从而不影响到业务的正常运转。
高可用技术离不开VIP,高可用的原理其实就是用户通过VIP访问业务,而VIP会映射到对应的服务器IP。
默认情况下,客户端通过192.168.74.150的IP映射到的192.168. 74 .149这台主zabbix _server 的服务,如果主zabbix _server 服务器的关机了,那么客户端继续使用192.168. 74 .150的ip就会映射到备用zabbix _server (192.168. 74.148) 这台服务。
准备内容:
安装两台zabbix _server ,一台数据库服务器(主zabbix _server 和备zabbix _server 的数据都保存在这台数据库上)
备:zabbix _server:192.168.74.148
主:zabbix-server :192.168.74.149
一台数据库服务器:192.168.74.128.
本实验的内容需要利用逻辑网卡作为VIP(192.168.74.150)
两台zabbix _server 服务器进入/etc /sysconfig/network-script 目录
C d /etc /sysconfig/network-scripts
拷贝当前服务器网卡文件,我的网卡是ifcfg -ens33 。
编辑ifcfg -ens33:0 文件(两台zabbix _server 的 ifcfg-ens33:0文件中,ip都改为192.168.74.150作为虚拟ip)
现在任意一台zabbix _server 上启动ifcfg -ens33:0 ,确认网卡是否可以启动。
注意,不可以同时在两台zabbix _server 启用ifcfg -ens33:0 ,否则会出现ip冲突。
逻辑网卡启动命令是if up 网卡名,使用ifup命令,只重启新增的网卡即可,最好不要用system ctl network restart 命令重启全部网卡,一旦这条命令导致网卡启动失败,将会导致无法远程服务器。
在window主机上安装agent,把agent配置文件的server_ip指向192.168.74.150这个虚拟ip , 确认是否可以通过192.168.74.150映射到192.168.74.149这个zabbix_server服务
此时已经可以通过虚拟IP(192.168.74.150)访问到192.168.74.149的zabbix _server 。
为了解决上面的问题,需要修改所有监控主机的zabbix agent.conf 的server ip 都指向192.168.74.150
修改完agent的配置,一定要重启zabbix _agent
最重要的一步,修改两台zabbix _server .conf里面的参数Source指定为虚拟ip
192.168.74.150 ,否则界面的ZBX会出现爆红
修改zabbix _server.conf 文件,Source IP 修改为虚拟ip ,192.168.74.150
重启zabbix _server
S ystemctl restart zabbix_server
下面开始编写shell脚本,实现主zabbix_server(192.168.74.149)服务器挂掉后,仍然可以通过192.168.74.150继续访问备用zabbix _server (192.168.74.148)
在192.168.74.149和192.168.74.148两台服务器上编写脚本check_alive
并在两台服务器上crontab –e 的定时任务中加入这两个脚本。执行这两个脚本的时间由用户自定义。本人暂时以60s一次执行这个检测脚本。记住要给这两个脚本可执行的权限
之所以设置60s执行一次脚本,是为了待会演示关闭192.168.74.149这台虚拟机,然后界面会无法访问。接着等待60s , 备用zabbix _server 的192.168.74.148就会启用vip,界面就可以继续访问zabbix _server 。正常来说,设置为3-10s比较合适,这样才能做到快速切换
C hmo d o+x 755 check_alive.sh
最终效果演示
关闭主zabbix_server(192.168.74.149虚拟机)
关闭主zabbix_server(192.168.74.149)后,备zabbix _server 就无法ping通,vip 192.168.74.150 了。
等待60s ,VIP(192.168.74.150 会出现在备用zabbix _server (192.168.74.148 )
V ip切换成功,刷新界面看一下能否访问zabbix _server
主zabbix _server 关机了,所以无法获取数据。
本案例可以确保zabbix_server服务进行高可用。但有一个缺点,就是两个zabbix_server服务使用的是同一个数据库服务器,如果这个数据库服务器挂掉。同样会无法获取数据。所以最好也做一下数据库的高可用。
如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!
赞7
添加新评论4 条评论
2020-09-09 10:06
2020-08-07 20:57
2020-06-30 12:06
2020-04-07 18:07