zabbix 监控主机时有时会因server 端db io高导致大量主机不可达?

目前公司采取了zabbix监控系统,目前使用3.4.7版本,监控400台左右的设备,5万+个指标,已经运行了很长一段时间。为了节约成本,采用了虚拟机搭建,并使用master+proxy的分布式结构,master采用8c+20G的配置,proxy配置相对低一些。

问题:
由于master  端的数据库io问题,曾经优化过内存的配置参数和zabbix.server 和proxy的相关参数,偶尔还会遇到io高的问题,大量节点不可达的问题,短时间又可以恢复。  数据库参数
innodb_buffer_pool_size = 12G
innodb_buffer_pool_instances=3
innodb_flush_method=O_DIRECT
max_allowed_packet = 64M
wait_timeout = 2880000
interactive_timeout = 2880000
[mysqld_safe]

log-error=/var/log/mariadb/mariadb.log
pid-file=/var/run/mariadb/mariadb.pid

请问:
那位兄弟有关相关经验可以指导一下,争取不投入物理机环境解决这个问题。

6回答

youki2008youki2008  系统架构师 , DDT
挚爱咖啡wfang_2020wangxq等赞同了此回答
会的,我们公司的zabbix Server曾出现过几次数据库IO过高,进程堵塞导致大量主机不可达,产生很多误报信息。显示全部

会的,我们公司的zabbix Server曾出现过几次数据库IO过高,进程堵塞导致大量主机不可达,产生很多误报信息。

收起
 2020-04-26
浏览711
chinesezzqiangchinesezzqiang  信息技术经理 , M
我们公司采用分布式部署方式,增加proxy。显示全部

我们公司采用分布式部署方式,增加proxy。

收起
 2020-05-06
浏览252
ajxzlajxzl  软件架构设计师 , 不知道
数据库数据量不大,IO过高是因为同时大量操作数据吗?显示全部

数据库数据量不大,IO过高是因为同时大量操作数据吗?

收起
 2020-04-27
浏览693
michael1983michael1983  技术经理 , 某证券
我们采取了分库监控的方式,笨方法显示全部

我们采取了分库监控的方式,笨方法

收起
 2020-04-02
浏览940
eianboeianbo  IT顾问 , PBCCRC
可以试试hotDB显示全部

可以试试hotDB

收起
 2020-04-01
浏览952
Zabbix大叔_乐维Zabbix大叔_乐维  研发工程师 , 广州九一乐维信息科技有限公司
你好,数据库是否有做过表分区操作?zabbix首页右下角的“ 系统信息 ” 里的“ 要求的主机性能, 每秒新值 ”的数量是多少?显示全部

你好,数据库是否有做过表分区操作?zabbix首页右下角的“ 系统信息 ” 里的“ 要求的主机性能, 每秒新值 ”的数量是多少?

收起
 2020-04-01
浏览1007
董志卫 邀答

提问者

董志卫系统架构师, 李宁(中国)体育用品有限公司

问题状态

  • 发布时间:2020-04-01
  • 关注会员:7 人
  • 问题浏览:2403
  • 最近回答:2020-05-06