查看其它 1 个回答空kong的回答

空kong空kong其它某单位

一个集群是否健康,大体可以从以下几个方面来判断
1 、单 region 的 storefile 数量是否合理
2 、 memstore 是否得到合理的利用,此项指标与 hlog 的数量和大小相关
3 、 compact 和 flush 的流量比值是否合理,如果每天仅 flush 1G 却要 compact 几十上百 G 就是明显的浪费
4 、 split 似乎否过频,能否采取 pre-sharding 的方式来预分配 region
5 、集群的 region 是否过多, zk 在默认参数下无法支撑 12w 以上的 region 个数,并且 region 过多也会影响 regionserver failover 的时间
6 、读写相应时间是否合理, datablock 的读取延时是否符合预期
7 、 flush 队列、 callqueue 长度、 compact 队列是否符合预期。前两者的积压都会造成系统不稳定。
8 、 failedRequest 和 maxResponseTime
9 、 gc 状况,过长的 ygc 和过频的 cms 都需要警惕

保险 · 2020-02-19
浏览1482

回答者

空kong
其它某单位
擅长领域: 大数据数据库大数据平台

空kong 最近回答过的问题

回答状态

  • 发布时间:2020-02-19
  • 关注会员:4 人
  • 回答浏览:1482
  • X社区推广