针对卡顿问题,排除资源配置、网络等因素外,如果是java程序,还需要考虑JVM调教优化,向着短停顿时间—反应快的策略 ,使用CMS内存回收算法,具体配置: -XX:+UseConcMarkSweepGC,供参考
收起针对云上系统卡顿现象可以从以下几点考虑:
1、服务配置的cpu和内存是否过小;
2、云平台node节点与服务数据库是否在同一网段内,我们之前遇到过,不同网段的网络差异很大;
3、针对服务慢的情况,可以部署一个skywalking看下具体是哪里慢,并针对慢的问题具体分析解决;
4、如果业务量大,是否启动多pod进行流量分流;
需要先搞清楚卡顿的原因是什么,目前主流的监控数据收集工具是prometheus。容器平台部署完成后,使用监控系统查看平台组件及底层硬件的各项监控指标综合分析。主要可以看节点的资源量是否充裕,可以从CPU使用率、内存使用率、I/O性能例如IO延迟等多个方面进行考虑。如果容器平台是部署在IaaS上的虚拟机里的话,IaaS平台不建议超售。
收起