互联网服务Zabbix

zabbix 监控主机时有时会因server 端db io高导致大量主机不可达?

目前公司采取了zabbix监控系统,目前使用3.4.7版本,监控400台左右的设备,5万+个指标,已经运行了很长一段时间。为了节约成本,采用了虚拟机搭建,并使用master+proxy的分布式结构,master采用8c+20G的配置,proxy配置相对低一些。

问题:
由于master  端的数据库io问题,曾经优化过内存的配置参数和zabbix.server 和proxy的相关参数,偶尔还会遇到io高的问题,大量节点不可达的问题,短时间又可以恢复。  数据库参数
innodb_buffer_pool_size = 12G
innodb_buffer_pool_instances=3
innodb_flush_method=O_DIRECT
max_allowed_packet = 64M
wait_timeout = 2880000
interactive_timeout = 2880000
[mysqld_safe]

log-error=/var/log/mariadb/mariadb.log
pid-file=/var/run/mariadb/mariadb.pid

请问:
那位兄弟有关相关经验可以指导一下,争取不投入物理机环境解决这个问题。

参与23

7同行回答

panmengpanmeng  系统工程师 , 成都农商银行
升级到4.0以后用postgresql的时序数据库显示全部

升级到4.0以后用postgresql的时序数据库

收起
银行 · 2020-06-01
浏览2524
chinesezzqiangchinesezzqiang  信息技术经理 , M
我们公司采用分布式部署方式,增加proxy。显示全部

我们公司采用分布式部署方式,增加proxy。

收起
IT其它 · 2020-05-06
浏览2724
ajxzlajxzl  软件架构设计师 , 不知道
数据库数据量不大,IO过高是因为同时大量操作数据吗?显示全部

数据库数据量不大,IO过高是因为同时大量操作数据吗?

收起
系统集成 · 2020-04-27
浏览3224
youki2008youki2008  系统架构师 , DDT
会的,我们公司的zabbix Server曾出现过几次数据库IO过高,进程堵塞导致大量主机不可达,产生很多误报信息。显示全部

会的,我们公司的zabbix Server曾出现过几次数据库IO过高,进程堵塞导致大量主机不可达,产生很多误报信息。

收起
互联网服务 · 2020-04-26
浏览3191
michael1983michael1983  技术总监 , 某证券
我们采取了分库监控的方式,笨方法显示全部

我们采取了分库监控的方式,笨方法

收起
证券 · 2020-04-02
浏览3487
eianboeianbo  IT顾问 , PBCCRC
可以试试hotDB显示全部

可以试试hotDB

收起
互联网服务 · 2020-04-01
浏览3488
乐维社区乐维社区  研发工程师 , 广东乐维软件有限公司
你好,数据库是否有做过表分区操作?zabbix首页右下角的“ 系统信息 ” 里的“ 要求的主机性能, 每秒新值 ”的数量是多少?显示全部

你好,数据库是否有做过表分区操作?zabbix首页右下角的“ 系统信息 ” 里的“ 要求的主机性能, 每秒新值 ”的数量是多少?

收起
软件开发 · 2020-04-01
浏览3933
powertiandi 邀答
  • 做过分区表的,性能值是524
    2020-04-03
  • zabbix 跟数据库是在同一台机吗?平时物理内存利用率是多少的?数据库平时的活跃连接数 是否 快达到了数据库配置的最大连接数?
    2020-04-03
  • server和db 是在同一台机器上的。内存总体使用情况还可以,CPU,就是IO高一些,平时在1M-40M左右,上下波动。一般在10M/s左右
    2020-04-04
  • 数据库最大连接数是151,平时在100 左右
    2020-04-04

提问者

powertiandi
系统架构师李宁(中国)体育用品有限公司
擅长领域: 存储服务器灾备

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2020-04-01
  • 关注会员:8 人
  • 问题浏览:6783
  • 最近回答:2020-06-01
  • X社区推广